從網頁中提取關鍵詞,從指定頁面中提取關鍵詞并顯示出來,代碼如下:
- $meta = get_meta_tags('http://m.survivalescaperooms.com/');
- $keywords = $meta['keywords'];
- // 分割關鍵詞
- $keywords = explode(',', $keywords );
- // 整理
- $keywords = array_map( 'trim', $keywords );
- // 去掉空內容
- $keywords = array_filter( $keywords );
- print_r( $keywords );
得到頁面中所有的鏈接,下面代碼可以使用 PHP DOM 獲取指定頁面中的所有鏈接,僅作拋磚引玉,具體使用自由發揮,代碼如下:
- $html = file_get_contents('http://m.survivalescaperooms.com');
- $dom = new DOMDocument();
- @$dom->loadHTML($html);
- $xpath = new DOMXPath($dom);
- $hrefs = $xpath->evaluate("/html/body//a");
- for ($i = 0; $i < $hrefs->length; $i++) {
- $href = $hrefs->item($i);
- $url = $href->getAttribute('href');
- echo $url.'<br />';
- }
自動把頁面中的 URL 轉換成可點擊的超鏈接,如果你發表一些文章或者做一些頁面,要想放上一個超鏈接,必須編寫一個 a 標簽。使用下面這段代碼可以方便的將 URL 轉換成超鏈接輸出,實現方法比較簡單,大體思路就是用正則匹配出來 URL 然后處理輸出超鏈接,代碼如下:
- function _make_url_clickable_cb($matches) {
- $ret = '';
- $url = $matches[2];
- if ( emptyempty($url) )
- return $matches[0];
- // 去掉 URL 后面的標點符號
- if ( in_array(substr($url, -1), array('.', ',', ';', ':')) === true ) {
- $ret = substr($url, -1);
- $url = substr($url, 0, strlen($url)-1);
- }
- return $matches[1] . "<a href="$url" rel="nofollow">$url</a>" . $ret;
- }
- function _make_web_ftp_clickable_cb($matches) {
- $ret = '';
- $dest = $matches[2];
- $dest = 'http://' . $dest;
- if ( emptyempty($dest) )
- return $matches[0];
- if ( in_array(substr($dest, -1), array('.', ',', ';', ':')) === true ) {
- $ret = substr($dest, -1);
- $dest = substr($dest, 0, strlen($dest)-1);
- }
- return $matches[1] . "<a href="$dest" rel="nofollow">$dest</a>" . $ret;
- }
- function _make_email_clickable_cb($matches) {
- $email = $matches[2] . '@' . $matches[3];
- return $matches[1] . "<a href="mailto:$email">$email</a>";
- }
- function make_clickable($ret) {
- $ret = ' ' . $ret;
- $ret = preg_replace_callback('#([s>])([w]+?://[w/x80-/xff#$%&~/.-;:=,?@[]+]*)#is', '_make_url_clickable_cb', $ret);
- $ret = preg_replace_callback('#([s>])((www|ftp).[w/x80-/xff#$%&~/.-;:=,?@[]+]*)#is', '_make_web_ftp_clickable_cb', $ret);
- $ret = preg_replace_callback('#([s>])([.0-9a-z_+-]+)@(([0-9a-z-]+.)+[0-9a-z]{2,})#i', '_make_email_clickable_cb', $ret);
- $ret = preg_replace("#(<a( [^>]+?>|>))<a [^>]+?>([^>]+?)</a></a>#i", "$1$3</a>", $ret);
- $ret = trim($ret);
- return $ret;
- }
用 PHP 生成 Data URI 代碼,通常把圖片編碼成 Data URI 格式用在網頁中來減少 HTTP 請求來提升前端性能,同時還有一些其他的用途,下面代碼可以將文件編碼成 Data URI,代碼如下:
- function data_uri($file, $mime) {
- $contents=file_get_contents($file);
- $base64=base64_encode($contents);
- echo "data:$mime;base64,$base64";
- }
將遠程圖片下載到本地服務器,特別是轉載文章等,為了防止對方網站關掉而導致圖片丟失,通常會在發表文章的時候,將遠程服務器上的圖片下載到本地服務器上,下面代碼簡單的實現了這個需求,更多的儲存位置、遍歷鏈接還需要你自己自定義,代碼如下:
- $image = file_get_contents('http://m.survivalescaperooms.com/logo.gif');
- file_put_contents('/images/logo.gif', $image);
去掉文中的無用標簽,當從一些文本編輯器(例如 Word)中將文本復制到網頁編輯器中時,可能會有一些額外的無用標簽,例如一些指定文字樣式的 style 等,下面代碼可以通過正則匹配來去掉這些無用標簽,凈化文本,代碼如下:
- function cleanHTML($html) {
- // 首先去掉無用的標簽(可以自定義更多需要清除的標簽)
- $html = ereg_replace("<(/)?(font|span|del|ins)[^>]*>","",$html);
- // 然后再運行兩遍去掉無用屬性
- $html = ereg_replace("<([^>]*)(class|lang|style|size|face)=("[^"]*"|'[^']*'|[^>]+)([^>]*)>","<1>",$html);
- $html = ereg_replace("<([^>]*)(class|lang|style|size|face)=("[^"]*"|'[^']*'|[^>]+)([^>]*)>","<1>",$html);
- return $html
- }
新聞熱點
疑難解答