精华区 [关闭][返回]

当前位置:月光软件>>讨论区精华>>〖软件开发〗>>● ASP>>★ASP的表达★>>13.选择与编组

主题:13.选择与编组
发信人: dongbao()
整理人: wuga(2002-09-17 08:35:00), 站内信件
选择允许使用 '|' 字符来在两个或多个候选项中进行选择。通过扩展章节标题的
正则表达式,可以将其扩充为不仅仅适用于章节标题的表达式。不过,这可没有
想象的那么直接。在使用选择时,将匹配'|' 字符每边最可能的表达式。你可能
认为下面的 Visual Basic Scripting Edition 和 VBScript 表达式将匹配位于
一行的开始和结束位置且后跟一个或两个数字的 'Chapter' 或 'Section':

/^Chapter|Section [1-9][0-9]{0,1}$/
"^Chapter|Section [1-9][0-9]{0,1}$"

不幸的是,真正的情况是上面所示的正则表达式要么匹配位于一行开始处的单词
 'Chapter',要么匹配一行结束处的后跟任何数字的 'Section'。如果输入字符
串为 'Chapter 22',上面的表达式将只匹配单词 'Chapter'。如果输入字符串为
 'Section 22',则该表达式将匹配 'Section 22'。但这种结果不是我们此处的
目的,因此必须有一种办法来使正则表达式对于所要做的更易于响应,而且确实
也有这种方法。

可以使用圆括号来限制选择的范围,也就是说明确该选择只适用于这两个单词 '
Chapter' 和 'Section'。不过,圆括号同样也是难处理的,因为它们也用来创建
子表达式,有些内容将在后面关于子表达式的部分介绍。通过采用上面所示的正
则表达式并在适当位置添加圆括号,就可以使该正则表达式既可以匹配 'Chapte
r 1',也可以匹配 'Section 3'。 

下面的正则表达式使用圆括号将 'Chapter' 和 'Section' 组成一组,所以该表
达式才能正确工作。对 Visual Basic Scripting Edition 为:

/^(Chapter|Section) [1-9][0-9]{0,1}$/

对 VBScript 为:

"^(Chapter|Section) [1-9][0-9]{0,1}$"

这些表达式工作正确,只是产生了一个有趣的副产品。在 'Chapter|Section' 两
边放置圆括号建立了适当的编组,但也导致两个待匹配单词之一都被捕获供今后
使用。由于在上面所示的表达式中只有一组圆括号,因此只能有一个捕获的 sub
match。可以使用 VBScript 的Submatches 集合或者Visual Basic Scripting E
dition 中RegExp 对象的 $1-$9 属性来引用这个子匹配。

有时捕获一个子匹配是所希望的,有时则是不希望的。在说明所示的示例中,真
正想做的就是使用圆括号对单词 'Chapter' 或 'Section' 之间的选择编组。并
不希望在后面再引用该匹配。实际上,除非真的是需要捕获子匹配,否则请不要
使用。由于不需要花时间和内存来存储那些子匹配,这种正则表达式的效率将更
高。

可以在正则表达式模式圆括号内部的前面使用 '?:'来防止存储该匹配供今后使用
。对上面所示正则表达式的下述修改提供了免除子匹配存储的相同功能。对 Vis
ual Basic Scripting Edition:

/^(?:Chapter|Section) [1-9][0-9]{0,1}$/

对 VBScript:

"^(?:Chapter|Section) [1-9][0-9]{0,1}$"

除了 '?:' 元字符,还有两个非捕获元字符用于称之为预查的匹配。一个为正向
预查,用 ?= 表示, 在任何开始匹配圆括号内的正则表达式模式的位置来匹配搜
索字符串。一个为负向预查,用 '?!' 表示,在任何开始不匹配该正则表达式模
式的位置来匹配搜索字符串。

例如,假定有一个包含引用有 Windows 3.1、Windows 95、Windows 98 以及 Wi
ndows NT 的文档。进一步假设需要更新该文档,方法是查找所有对 Windows 95
、Windows 98 以及 Windows NT 的引用,并将这些引用更改为 Windows 2000。
可以使用下面的 Visual Basic Scripting Edition 正则表达式,这是一个正向
预查,来匹配 Windows 95、Windows 98 以及 Windows NT:

/Windows(?=95 |98 |NT )/

在 VBScript 要进行同样的匹配可以使用下述表达式:

"Windows(?=95 |98 |NT )"

找到一个匹配后,紧接匹配到的文字(而不包括预查中使用的字符)就开始对下
一次匹配的搜索。例如,如果上面所示的表达式匹配到 'Windows 98',则将从 
'Windows' 而不是 '98' 之后继续查找。

--
ICQ:43395237 OICQ:126132  
我自豪我用正版,我骄傲我用盗版!!! 

※ 来源:.月光程序代码网 http://www.moon-soft.com.[FROM: 202.108.5.134]

[关闭][返回]






转载请注明:转载自 月光程序代码网 [ http://www.moon-soft.com ]