欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

正则表达式学习教程之回溯引用backreference详解

程序员文章站 2022-06-23 11:57:56
本文实例讲述了正则表达式回溯引用backreference。分享给大家供大家参考,具体如下: 在所有例子中正则表达式匹配结果包含在源文本中的【和】之间,有的例子会使用ja...

本文实例讲述了正则表达式回溯引用backreference。分享给大家供大家参考,具体如下:

在所有例子中正则表达式匹配结果包含在源文本中的【和】之间,有的例子会使用java来实现,如果是java本身正则表达式的用法,会在相应的地方说明。所有java例子都在jdk1.6.0_13下测试通过。

一、问题引入

一个在html页面中匹配标题标签(h1—h6)的问题:

文本:

<body>
<h1>welcome to my page</h1>
content is divided into twosections:<br>
<h2>introduction</h2>
information about me.
<h2>hobby</h2>
information about my hobby.
<h2>this is invalid html</h3>
</body>

正则表达式:<[hh][1-6]>.*?</[hh][1-6]>

结果:

<body>
【<h1>welcome to my page</h1>】
content is divided into twosections:<br>
【<h2>introduction</h2>】
information about me.
【<h2>hobby</h2>】
information about my hobby.
【<h2>this is invalid html</h3>】
</body>

分析:模式<[hh][1-6]>匹配任何一级标题的开始标签,而且不区分大小写,在这个例子中它匹配到了<h1>、<h2>,</[hh][1-6]>匹配到了</h1>、</h2>、</h3>;这里使用了懒惰型元字符来匹配标签中的文本,否则会匹配到从第一个开始标签到最后一下结束标签之间的内容。但是从结果可以看出,有一个无效的标签也匹配上了,即<h2></h3>,它们根本不能配对。要解决这个问题,就需要使用到回溯引用(backreference)。

二、回溯引用匹配

回溯引用是指模式的后半部分引用在前半部分中定义的子表达式。至于子表达式的使用、划分和引用,在前面已经介绍过了。现在来解决前面的例子:

文本:

<body>
<h1>welcome to my page</h1>
content is divided into twosections:<br>
<h2>introduction</h2>
information about me.
<h2>hobby</h2>
information about my hobby.
<h2>this is invalid html</h3>
</body>

正则表达式:<[hh]([1-6])>.*?</[hh]\1>

结果:

<body>
【<h1>welcome to my page</h1>】
content is divided into twosections:<br>
【<h2>introduction</h2>】
information about me.
【<h2>hobby</h2>】
information about my hobby.
<h2>this is invalid html</h3>

分析:首先匹配开始标题标签的模式<[hh]([1-6])>,使用括号把[1-6]做为子表达式,而匹配结束标题标签模式为</[hh]\1>,其中\1表示引用第一个子表达式,即([1-6]),如果([1-6])匹配到的是1,那\1也匹配到1,如果匹配到2,那\1也匹配到2,所以最后一个无效的标题标签就不会被匹配到了。

ps:这里再为大家提供2款非常方便的正则表达式工具供大家参考使用:

javascript正则表达式在线测试工具:

正则表达式在线生成工具:

更多关于javascript相关内容感兴趣的读者可查看本站专题:《javascript正则表达式技巧大全》、《javascript替换操作技巧总结》、《javascript查找算法技巧总结》、《javascript数据结构与算法技巧总结》、《javascript遍历算法与技巧总结》、《javascript中json操作技巧总结》、《javascript错误与调试技巧总结》及《javascript数学运算用法总结

希望本文所述对大家javascript程序设计有所帮助。