国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > regex > 正文

php 正則表達式提取網頁超級鏈接url的函數

2020-01-20 22:19:20
字體:
來源:轉載
供稿:網友
復制代碼 代碼如下:

function match_links($document) {
preg_match_all("'</s*a/s.*?href/s*=/s*([/"/'])?(?(1)(.*?)//1|([^/s/>]+))[^>]*>?(.*?)</a>'isx",$document,$links);
while(list($key,$val) = each($links[2])) {
if(!empty($val))
$match['link'][] = $val;
}
while(list($key,$val) = each($links[3])) {
if(!empty($val))
$match['link'][] = $val;
}
while(list($key,$val) = each($links[4])) {
if(!empty($val))
$match['content'][] = $val;
}
while(list($key,$val) = each($links[0])) {
if(!empty($val))
$match['all'][] = $val;
}
return $match;
}

主要是正則的問題,下面給出個asp.net下的,多測試正則
獲取頁面的鏈接正則
復制代碼 代碼如下:

public string GetHref(string HtmlCode)
{
string MatchVale = "";
string Reg = @"(h|H)(r|R)(e|E)(f|F) *= *('|"")?((/w|//|//|/.|:|-|_)+)('|""| *|>)?";
foreach (Match m in Regex.Matches(HtmlCode, Reg))
{
MatchVale += (m.Value).ToLower().Replace("href=", "").Trim() + "||";
}
return MatchVale;
}
發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 古交市| 同仁县| 盘山县| 黄浦区| 苏尼特左旗| 衡山县| 合山市| 玉林市| 辽阳县| 恭城| 什邡市| 高邑县| 拉萨市| 永善县| 新疆| 呼伦贝尔市| 莱西市| 余干县| 和田县| 金沙县| 高雄市| 轮台县| 井冈山市| 龙江县| 东至县| 巴林右旗| 阳城县| 宝山区| 搜索| 普兰店市| 巩义市| 泊头市| 沂水县| 武汉市| 贞丰县| 霍州市| 富顺县| 望都县| 和顺县| 威宁| 海盐县|