国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁(yè) > 開(kāi)發(fā) > PHP > 正文

php html解析器Simple HTML Dom使用說(shuō)明

2024-05-04 21:48:03
字體:
來(lái)源:轉(zhuǎn)載
供稿:網(wǎng)友

1. 開(kāi)始使用

首先下載解壓縮,然后將simple_html_dom.php文件包含進(jìn)要編寫的腳本文件中,加載要處理的html,支持三種模式的html加載,分別是『從url中加載,從字符串中加載,從文件中加載』.代碼如下:

  1. require_once('simple_html_dom.php'); 
  2. //從url加載 
  3. $html = file_get_html('http://m.survivalescaperooms.com'); 
  4. //從字符串加載 
  5. $html = str_get_html('<html><body>Hello World!</body></html>'); 
  6. //從文件中加載 
  7. $html = file_get_html('example.htm');  
  8. 從字符串加載網(wǎng)上文件需要先從網(wǎng)絡(luò)下下載,使用cURL比較好一些,需要在php配置文件中打開(kāi)php擴(kuò)展php_curl。 
  9.  
  10. $url = 'http://m.survivalescaperooms.com'
  11. $ci = curl_init(); 
  12. curl_setopt($ci,CURLOPT_URL,$url); 
  13. curl_setopt($ci, CURLOPT_SSL_VERIFYPEER, false); 
  14. curl_setopt($ci, CURLOPT_SSL_VERIFYHOST, false); 
  15. curl_setopt($ci, CURLOPT_RETURNTRANSFER, 1); 
  16. $result = curl_exec($ch); 

2.查找html元素

使用find函數(shù)查找,返回包含對(duì)象的數(shù)組,常見(jiàn)的查找如下.

  1. //查找超鏈接元素 
  2. $alink = $html->find('a'); 
  3. //查找第n個(gè)連接元素 
  4. $alink = $html->find('a',5); 
  5. //查找id為main的div 
  6. $mainDiv = $html->find('div[id=main]'); 
  7. //查找所有定義了id的div 
  8. $idDiv = $html->find('div[id]'); 
  9. //查找所有定義了id的元素 
  10. $idAll = $html->find('[id]'); 
  11. //查找樣式類為info的元素 
  12. $classInfo = $html->find('.info'); 
  13. //支持嵌套子元素查找 
  14. $ret = $html->find('ul li'); 
  15. //查找多個(gè)html元素 
  16. $ret = $html->find('a,img,p'); 
  17. //....  

3.其他

可以使用內(nèi)置的函數(shù)來(lái)進(jìn)行元素的定位,返回父元素parent,返回子元素?cái)?shù)組children,返回第一個(gè)子元素first_child,返回最后一個(gè)子元素last_child,返回前一個(gè)相鄰元素prev_sibling,返回后一個(gè)相鄰元素next_sibling等.提供簡(jiǎn)單的正則表達(dá)式來(lái)過(guò)濾屬性選擇器,類似于[attribute]的格式.

每個(gè)對(duì)象都有4個(gè)基本屬性:

tag — 返回html標(biāo)簽名

innertext — 返回innerHTML

outertext — 返回outerHTML

plaintext — 返回HTML標(biāo)簽中的文本

返回元素屬性值:

  1. //返回$alink的href值 
  2. $link = $alink->href;  

通過(guò)設(shè)置元素的屬性值可以對(duì)元素進(jìn)行添加、修改、刪除操作,代碼如下:

  1. //刪除url連接 
  2. $alink->href = null; 
  3. //元素的修改 
  4. $ret->outertext = '<div class="nav">' . $ret->outertext . '</div>'
  5. $ret->outertext = ''
  6. $ret->outertext = $ret->outertext . '<div>other</div>'
  7. $ret->outertext = '<div>Welcome</div>' . $ret->outertext;  
  8. -EOF- 

發(fā)表評(píng)論 共有條評(píng)論
用戶名: 密碼:
驗(yàn)證碼: 匿名發(fā)表
主站蜘蛛池模板: 泸定县| 嘉鱼县| 聂拉木县| 都匀市| 会理县| 枝江市| 依兰县| 昌都县| 永平县| 平谷区| 迁西县| 阿城市| 皋兰县| 孟连| 普兰店市| 汉阴县| 巴塘县| 北海市| 淮安市| 南投县| 阳谷县| 乡宁县| 建始县| 陕西省| 鹤庆县| 灵山县| 康乐县| 开阳县| 大渡口区| 洮南市| 克东县| 安新县| 霍林郭勒市| 长乐市| 九台市| 汝阳县| 海口市| 威信县| 开鲁县| 旬邑县| 民勤县|