国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁(yè) > 開(kāi)發(fā) > PHP > 正文

php實(shí)現(xiàn)scws中文分詞搜索的方法

2024-05-04 23:41:24
字體:
來(lái)源:轉(zhuǎn)載
供稿:網(wǎng)友
這篇文章主要介紹了php實(shí)現(xiàn)scws中文分詞搜索的方法,詳細(xì)介紹了scws中文分詞搜索的具體步驟與相關(guān)使用技巧,并提供了scws的本站下載地址,需要的朋友可以參考下
 

本文實(shí)例講述了php實(shí)現(xiàn)scws中文分詞搜索的方法。分享給大家供大家參考,具體如下:

1、4個(gè)文件(本站下載地址。)解壓后,放到一個(gè)地方 eg:E:/wamp/scws

2、php.ini 中配置

extension = php_scws.dll scws.default.charset = utf8 //配置默認(rèn)的編碼方式scws.default.fpath = "E:/wamp/scws" //加壓后文件的路徑

3、使用

$so = scws_new(); $so->set_charset('utf8'); //編碼// 這里沒(méi)有調(diào)用 set_dict 和 set_rule 系統(tǒng)會(huì)自動(dòng)試調(diào)用 ini 中指定路徑下的詞典和規(guī)則文件 $so->add_dict(ini_get('scws.default.fpath') . '/dict.utf8.xdb');//$so->add_dict('./dd.txt',SCWS_XDICT_TXT);$so->set_rule(ini_get('scws.default.fpath') . '/rules.utf8.ini'); $so->set_duality(0);  //散字二元 $so->set_ignore(0); //忽略標(biāo)點(diǎn)符號(hào)$so->set_multi(0); $wd='要搜索的內(nèi)容';$so->send_text($wd); while($tmp = $so->get_result())//遍歷后即得到字符串分割后的內(nèi)容,//根據(jù)得到的內(nèi)容分別到數(shù)據(jù)庫(kù)中查找(like匹配){}

親自試驗(yàn)了一下如下:

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN""http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"><html xmlns="http://www.w3.org/1999/xhtml"><head><meta http-equiv="Content-Type" content="text/html; charset=utf-8" /><title>test</title></head><body><?phpfunction search($keywords,$table,$key1,$key2){// (要查找的字符串,表名,字段一,字段二)如果就一個(gè)字段的話,$key2=''; $arr=array(); $str=array();  if( preg_match("/^[^/x80-/xff]+$/", $keywords)){//判斷keywords是否全為英文,全為英文的話按照字符串切割處理 $str1=explode(' ',$keywords); //先按照空格切割 foreach($str1 as $key=>$value) {  $str2=explode(',',$value); //,切割  foreach($str2 as $k=>$v)  {  $str3=explode('.',$v); //。切割  foreach($str3 as $kk=>$vv)  {   array_push($arr,$vv);//處理完后,返回一個(gè)數(shù)組  }  } } }else{//對(duì)中文的分詞處理 $so = scws_new();  $so->set_charset('utf8');   // 這里沒(méi)有調(diào)用 set_dict 和 set_rule 系統(tǒng)會(huì)自動(dòng)試調(diào)用 ini 中指定路徑下的詞典和規(guī)則文件    $so->add_dict(ini_get('scws.default.fpath') . '/dict.utf8.xdb');   $so->set_rule(ini_get('scws.default.fpath') . '/rules.utf8.ini');    $so->set_duality(0);  //散字二元   $so->set_ignore(0); //忽略標(biāo)點(diǎn)符號(hào)  $so->set_multi(0); $so->send_text($keywords); while ($tmp = $so->get_result())//得到一個(gè)數(shù)組,里面包含詞組和標(biāo)點(diǎn)符號(hào) {  foreach($tmp as $key=>$value)  {  $value=$value["word"];  if(preg_match("/^[一-龥](méi){6,21}$/", $value))//去除標(biāo)點(diǎn)符號(hào)  {   array_push($arr,$value);  }  } } } foreach($arr as $key=>$value)//便利得到的數(shù)組,到數(shù)據(jù)庫(kù)中匹配 { if($key2!='') {  $sql="select * from `$table` where `$key1` like '%$value%' or `$key2` like '%$value%'"; }else{  $sql="select * from `$table` where `$key1` like '%$value%'"; } $query=mysql_query($sql); array_push($str,$query); } return $str;}include('conn.php');$keywords="哈哈lsd djk,hdjs dd";$table='two_key';$key1='address';$key2='';$query=search($keywords,$table,$key1,$key2);foreach($query as $key=>$value){ while($row=mysql_fetch_array($value)) { echo $row[id].'----'.$row[name].'-----'.$row[address].'<br>'; }}?></body></html>

希望本文所述對(duì)大家PHP程序設(shè)計(jì)有所幫助。



注:相關(guān)教程知識(shí)閱讀請(qǐng)移步到PHP教程頻道。
發(fā)表評(píng)論 共有條評(píng)論
用戶(hù)名: 密碼:
驗(yàn)證碼: 匿名發(fā)表
主站蜘蛛池模板: 阿合奇县| 泉州市| 牡丹江市| 神木县| 额尔古纳市| 威信县| 凌源市| 麻阳| 东兴市| 乾安县| 汕头市| 乌什县| 阿城市| 全椒县| 栖霞市| 宾阳县| 定西市| 宁南县| 白玉县| 南投县| 仁布县| 登封市| 宝山区| 湟源县| 乌海市| 石阡县| 南和县| 周宁县| 蓬安县| 德令哈市| 敦化市| 衡阳市| 毕节市| 巫山县| 沅江市| 阳曲县| 田阳县| 陇川县| 博白县| 阿图什市| 都昌县|