国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > PHP > 正文

PHP簡單實現“相關文章推薦”功能的方法

2020-03-22 18:07:12
字體:
來源:轉載
供稿:網友
通常在做內容網站的時候,需要在每一篇文章中出現與該文章相關的文章列表。對于大多數人來說,使用的方法通常是:建立一個關鍵詞列表,判斷每篇文章包含有那些關鍵詞,最后根據關鍵詞找出與某篇文章最相關的文章。對于內容比較復雜的網站,確定關鍵列表詞顯然會比較麻煩。本文介紹了與以往方法不同的similar_text(php4,php5)函數來方便的達到我們的預期要求。具體的思路是:從文章列表中取出所有的文章標題,將所有的文章標題都同當前標題對比,將對比結果生成一個數組,按照相似度的大小由大到標題,利用similar_text將這些文章標題同原文章標題做對比,按標題的相似程度重新排列標題,就得到了與原文章相似的文章列表。這個思路用到的關鍵函數是:int similar_text ( string $first, string $second[, float $percent] )它返回的是兩個字根串的相同字節數。按照這個思路,我們建立如下的函數,這個函數的功能是把$arr_title數組按照同$title相似的的順序重新排列數組。 php $demo_title= "簡明現代魔法"; $demo_arr_title= array("簡單易懂的現代魔法","簡單明了的現代魔法","簡明扼要的古代魔法","不簡單的現代魔法","很難懂的現代魔法"); $new_array= getSimilar($demo_title,$demo_arr_title); //print_r($new_array); echo"與[$demo_title]最相關的前三個文章是: br/ for($j=0; $j $j++) echo($j+1).":".$new_array[$j]." br/ //$title當前標題,$arrayTitle為需要查找的數組 functiongetSimilar($title,$arr_title) $arr_len= count($arr_title); for($i=0; $i =($arr_len-1); $i++) //取得兩個字符串相似的字節數 $arr_similar[$i] = similar_text($arr_title[$i],$title); arsort($arr_similar); //按照相似的字節數由高到低排序 reset($arr_similar); //將指針移到數組的第一單元 $index= 0; foreach($arr_similaras$old_index= $similar) $new_title_array[$index] = $arr_title[$old_index]; $index++; return$new_title_array; 程序運行結果:與[簡明現代魔法]最相關的前三個文章是: 1:簡單明了的現代魔法 2:簡單易懂的現代魔法 3:簡明扼要的古代魔法有些需要注意的地方:關于similar_text速度,有人做過這個一個測試,結果是:
The speed issues for similar_text seem to be only an issue for long sections of text ( 20000 chars).I found a huge performance improvement in my application by just testing if the string to be tested was less than 20000 chars before calling similar_text.20000+ took 3-5 secs to process, anything else (10000 and below) took a fraction of a second. Fortunately for me, there was only a handful of instances with 20000 chars which I couldn't get a comparison % for.如果要直接使用正文作對比速度可能會比較慢。據說這個函數用于英文的效果不太好(感興趣的讀者可以自行嘗試)。用于英文時可以將英文句子用空格分開成多個單詞后再寫一個類似于similar_text的函數。另外,如果句子中含有比較多“的”、“了”等非關鍵詞字符時,得到的結果可能會不太理想。PHP教程

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時間聯系我們修改或刪除,多謝。

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 沾化县| 永兴县| 策勒县| 白沙| 通州区| 东乌珠穆沁旗| 乳源| 朝阳市| 双鸭山市| 扶风县| 鹤峰县| 溆浦县| 敦化市| 灌阳县| 玉环县| 清原| 朝阳市| 湖北省| 游戏| 宁波市| 西林县| 西和县| 东至县| 吉首市| 合川市| 渝北区| 贵定县| 台东市| 滦平县| 林芝县| 天等县| 大悟县| 吉林省| 咸阳市| 广昌县| 运城市| 宁国市| 宜黄县| 孟州市| 会同县| 通城县|