国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Regex > 正文

php 正則表達式提取網頁超級鏈接url的函數

2020-03-16 21:14:02
字體:
來源:轉載
供稿:網友
php 正則表達式提取網頁超級鏈接url的函數
 
 
復制代碼代碼如下:

function match_links($document) { 
preg_match_all("'</s*a/s.*?href/s*=/s*([/"/'])?(?(1)(.*?)//1|([^/s/>]+))[^>]*>?(.*?)</a>'isx",$document,$links); 
while(list($key,$val) = each($links[2])) { 
if(!empty($val)) 
$match['link'][] = $val; 

while(list($key,$val) = each($links[3])) { 
if(!empty($val)) 
$match['link'][] = $val; 

while(list($key,$val) = each($links[4])) { 
if(!empty($val)) 
$match['content'][] = $val; 

while(list($key,$val) = each($links[0])) { 
if(!empty($val)) 
$match['all'][] = $val; 

return $match; 
}

主要是正則的問題,下面給出個asp.net下的,多測試正則
獲取頁面的鏈接正則 
復制代碼代碼如下:

public string GetHref(string HtmlCode) 

string MatchVale = ""; 
string Reg = @"(h|H)(r|R)(e|E)(f|F) *= *('|"")?((/w|//|//|/.|:|-|_)+)('|""| *|>)?"; 
foreach (Match m in Regex.Matches(HtmlCode, Reg)) 

MatchVale += (m.Value).ToLower().Replace("href=", "").Trim() + "||"; 

return MatchVale; 
}

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 抚州市| 顺义区| 墨玉县| 永修县| 太仓市| 罗平县| 丹江口市| 安新县| 洛浦县| 扎囊县| 万山特区| 祁东县| 新竹市| 绥宁县| 镶黄旗| 乌恰县| 巴东县| 敦煌市| 申扎县| 溆浦县| 金川县| 隆林| 兖州市| 凤庆县| 兴海县| 新源县| 蒙自县| 韶关市| 永新县| 巴林左旗| 陕西省| 义马市| 澳门| 红桥区| 柞水县| 太原市| 缙云县| 新化县| 赣榆县| 大埔县| 冷水江市|