国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Regex > 正文

JavaScript正則表達(dá)式解析URL的技巧

2020-03-16 21:01:13
字體:
供稿:網(wǎng)友
本文的宗旨在于教你如何理解URL的正則表達(dá)式,以達(dá)到理解正則表達(dá)式,以及能夠在日后的工作中寫出相對簡單的正則。對js正則表達(dá)式解析url相關(guān)知識(shí)感興趣的朋友一起學(xué)習(xí)吧
 

正則表達(dá)式是一個(gè)描述字符模式的對象。

首先,此片文章并不是直接告訴你,url的正則表達(dá)式是什么,以及怎么使用這個(gè)正則表達(dá)式去解析一個(gè)URL地址,相信這種問題在網(wǎng)絡(luò)上已經(jīng)能找到很多。本文的宗旨在于教你如何理解URL的正則表達(dá)式,以達(dá)到理解正則表達(dá)式,以及能夠在日后的工作中寫出相對簡單的正則。言歸正傳,先看看一下的例子:

var parse_url = /^(?:([A-Za-z]+):)?(//{0,3})([0-9./-A-Za-z]+)(?::(/d+))?(?://([^?#]*))?(?:/?([^#]*))?(?:#(.*))?$/;
var parse_url = /^(?:([A-Za-z]+):)?(//{,})([-./-A-Za-z]+)(?::(/d+))?(?://([^?#]*))?(?:/?([^#]*))?(?:#(.*))?$/; var url = "http://qiji.kerlai.net:/GoodsBasic/Operate/?q#simen"; var result = parse_url.exec(url); var names = ["url","scheme","slash","host","port","path","query","hash"]; for(var i=; i <names.length;i++){  console.log(names[i]+":"+result[i]); } //輸出結(jié)果 /* url:http://qiji.kerlai.net:/GoodsBasic/Operate/?q#simen scheme:http slash:// host:qiji.kerlai.net port: path:GoodsBasic/Operate/ query:q hash:simen */ 

我們先來看看結(jié)果:

url:http://qiji123.kerlai.net:81/GoodsBasic/Operate/12678?q#simen
scheme:http
slash://
host:qiji123.kerlai.net
port:81
path:GoodsBasic/Operate/12678
query:q
hash:simen

代碼中result數(shù)組的集合是['http://qiji123.kerlai.net:81/GoodsBasic/Operate/12678?q#simen','http', '//', 'qiji123.kerlai.net', '81', 'GoodsBasic/Operate/12678', 'q', 'simen']

現(xiàn)在我們嘗試把從第2個(gè)到最后一個(gè)的結(jié)果一個(gè)一個(gè)鏈接起來,得到的結(jié)果為:"http // qiji123.kerlai.net 81 GoodsBasic/Operate/12678 q simen" 和原來的url相比,缺少了":?#"等鏈接符。這個(gè)是為何?說到這,我們就要引出正則表達(dá)式的一個(gè)概念為正則表達(dá)式的分組。正則表達(dá)式有4種分組,分別是:捕獲型、飛捕獲型、向前正向匹配、向前負(fù)向匹配。此處我重點(diǎn)介紹前面兩種,后面兩種大家可以自行補(bǔ)腦。其中非捕獲型的就不會(huì)在結(jié)果的數(shù)組中出現(xiàn),()括起來的為一個(gè)組,即會(huì)占用結(jié)果數(shù)組的一個(gè)位置。同樣如果在你的正則表達(dá)式中,沒有用括號(hào)括起來,那么所匹配到的字符將不會(huì)出現(xiàn)在exec()方法所返回的數(shù)組中。正則的分組是使用()括起來的稱為一個(gè)分組。

JavaScript正則表達(dá)式解析URL的技巧

1、捕獲型分組:(...)

2、非捕獲型分組:(?: .....)

3、向前正向匹配:(?=........)

4、向前負(fù)向匹配:(?!.........)

接下來我們來分解parse_url這個(gè)正則表達(dá)式,第一個(gè)分組

1、^表示字符串的開始

整個(gè)正則因子是匹配一個(gè)協(xié)議名:http

2、(?: )表示一個(gè)非捕獲型分組:即在這個(gè)括號(hào)內(nèi)的,但是不在其子括號(hào)內(nèi)所匹配到的字符將不放入結(jié)果數(shù)組中。

3、()表示一個(gè)捕獲型分組,此括號(hào)內(nèi)所匹配到的字符放入結(jié)果數(shù)組中對應(yīng)url中的:http字符

4、[]為正則表達(dá)式類,表示符合中括號(hào)內(nèi)任一一個(gè)字符。

7、A-Za-z表示字母A到字母Z,字母a到字母z。[A-Za-z]表示符合字母A到字母Z,字母a到字母z的任一一個(gè)字符

5、+表示匹配1次貨多次

6、?表示此組為可選匹配條件

第二個(gè)正則因子:(//{0,3})://

捕獲型分組,//表示一個(gè)應(yīng)該被匹配的/,{0,3}表示/將被匹配0次或者1到3次之間

([0-9./-A-Za-z]+):qiji123.kerlai.net

捕獲型分組,由一個(gè)或多個(gè)數(shù)字 ,“.”,”/-“(轉(zhuǎn)義成”-“),字母A到Z和字母a到z組成

(?::(/d+))?:81

前置:放在非捕獲型分組中將不會(huì)出現(xiàn)在返回?cái)?shù)組中,/d表示匹配數(shù)字。整個(gè)因子就是匹配前置為:后面跟隨一個(gè)或多個(gè)數(shù)字。此分組因子為可選的

(?://([^?#]*))?:GoodsBasic/Operate/12678

該分組由/開始,^在此處表示非的意思,即除?#之外的所有字符 最后一個(gè)?表示此正則因子分組可選

(?:/?([^#]*))? :q

該分組表示包含0個(gè)或多個(gè)非#字符

(?:#(.*))?:simen

該分組以#開始,(.)將匹配除結(jié)束符以外的所有字符。

 $表示這個(gè)字符串結(jié)束。

到此就已經(jīng)分析完url的所有分組。接下來大家可以寫寫電話號(hào)碼的正則表達(dá)式:既能匹配固定電話有能匹配手機(jī)號(hào)(這個(gè)會(huì)用到新的字符:|)

 

字符 含意
/

做為轉(zhuǎn)意,即通常在"/"后面的字符不按原來意義解釋,如/b/匹配字符"b",當(dāng)b前面加了反斜桿后//b/,轉(zhuǎn)意為匹配一個(gè)單詞的邊界。 -或- 
對正則表達(dá)式功能字符的還原,如"*"匹配它前面元字符0次或多次,/a*/將匹配a,aa,aaa,加了"/"后,/a/*/將只匹配"a*"。

^ 匹配一個(gè)輸入或一行的開頭,/^a/匹配"an A",而不匹配"An a"
$ 匹配一個(gè)輸入或一行的結(jié)尾,/a$/匹配"An a",而不匹配"an A"
* 匹配前面元字符0次或多次,/ba*/將匹配b,ba,baa,baaa
+ 匹配前面元字符1次或多次,/ba*/將匹配ba,baa,baaa
? 匹配前面元字符0次或1次,/ba*/將匹配b,ba
(x) 匹配x保存x在名為$1...$9的變量中
x|y 匹配x或y
{n} 精確匹配n次
{n,} 匹配n次以上
{n,m} 匹配n-m次
[xyz] 字符集(character set),匹配這個(gè)集合中的任一一個(gè)字符(或元字符)
[^xyz] 不匹配這個(gè)集合中的任何一個(gè)字符
[/b] 匹配一個(gè)退格符
/b 匹配一個(gè)單詞的邊界
/B 匹配一個(gè)單詞的非邊界
/cX 這兒,X是一個(gè)控制符,//cM/匹配Ctrl-M
/d 匹配一個(gè)字?jǐn)?shù)字符,//d/ = /[0-9]/
/D 匹配一個(gè)非字?jǐn)?shù)字符,//D/ = /[^0-9]/
/n 匹配一個(gè)換行符
/r 匹配一個(gè)回車符
/s 匹配一個(gè)空白字符,包括/n,/r,/f,/t,/v等
/S 匹配一個(gè)非空白字符,等于/[^/n/f/r/t/v]/
/t 匹配一個(gè)制表符
/v 匹配一個(gè)重直制表符
/w 匹配一個(gè)可以組成單詞的字符(alphanumeric,這是我的意譯,含數(shù)字),包括下劃線,如[/w]匹配"$5.98"中的5,等于[a-zA-Z0-9]
/W 匹配一個(gè)不可以組成單詞的字符,如[/W]匹配"$5.98"中的$,等于[^a-zA-Z0-9]。

用re = new RegExp("pattern",["flags"]) 的方式比較好 pattern : 正則表達(dá)式 flags: g (全文查找出現(xiàn)的所有 pattern) i (忽略大小寫) m (多行查找)

vaScript動(dòng)態(tài)正則表達(dá)式問題

請問正則表達(dá)式可以動(dòng)態(tài)生成嗎? 例如JavaScript中: var str = "strTemp"; 要生成: var re = /strTemp/; 如果是字符連接: var re = "/" + str + "/"即可 
但是要生成表達(dá)式,可以實(shí)現(xiàn)嗎?怎樣實(shí)現(xiàn)?



注:相關(guān)教程知識(shí)閱讀請移步到正則表達(dá)式頻道。
發(fā)表評論 共有條評論
用戶名: 密碼:
驗(yàn)證碼: 匿名發(fā)表
主站蜘蛛池模板: 舞钢市| 宁化县| 安义县| 涟水县| 建德市| 封丘县| 资源县| 观塘区| 时尚| 南昌县| 抚州市| 黔东| 甘洛县| 林西县| 塔河县| 喀喇沁旗| 泰兴市| 奉贤区| 澜沧| 临沭县| 洪泽县| 张家界市| 伊吾县| 阳西县| 青海省| 图们市| 高青县| 房产| 康平县| 凤山县| 隆子县| 东丽区| 柘荣县| 乳山市| 德兴市| 葵青区| 泰来县| 开平市| 皮山县| 塘沽区| 清徐县|