国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁(yè) > 數(shù)據(jù)庫(kù) > MySQL > 正文

mysql表中記錄重復(fù)處理方案

2024-07-24 12:39:33
字體:
來(lái)源:轉(zhuǎn)載
供稿:網(wǎng)友

記錄重復(fù)的這些問(wèn)題小編介紹過(guò)非常的多了,如果不信可以可以百度找找,下面一起來(lái)看小編整理的一篇mysql表中記錄重復(fù)處理方案,今天寫了一個(gè)airport表,主要有這么幾個(gè)字段.

  1. //主鍵id,機(jī)場(chǎng)英文名稱,機(jī)場(chǎng)中文名稱,機(jī)場(chǎng)三字碼,機(jī)場(chǎng)所在城市名子 
  2. id, name, c_name, code,city_name 

由于機(jī)場(chǎng)三字碼是不重復(fù)的,所以一開(kāi)始我為airport表添加唯一索引.

ALTER  TABLE  `airport`  ADD  UNIQUE(`code`);

但在寫的過(guò)程中發(fā)現(xiàn)我爬蟲爬到的信息有重復(fù)的情況,所以先暫時(shí)去掉唯一索引.

show index from airport;//查看索引情況

DROP INDEX code ON airport

上下爬蟲程序代碼:

  1. require('phpQuery.php'); 
  2. phpQuery::newDocumentFile("http://******************因?yàn)槟承┰?**********");  
  3. $res = pq('tbody')->find('tr')->text(); 

根據(jù)自己的業(yè)務(wù)邏輯插入到表中,很快完成了工作,完成之后,還是要理解三字碼重復(fù)的問(wèn)題,我的做法是采用了把所有重復(fù)的最小的三字碼記錄進(jìn)行刪除處理,最早寫的代碼如下:

  1. DELETE FROM airport WHERE  
  2. id IN (SELECT id FROM airport GROUP BY code HAVING COUNT(code) > 1)  --Vevb.com 
  3. AND id NOT IN ( SELECT max(id) FROM airport GROUP BY code HAVING COUNT(code ) >1); 

但運(yùn)行這條sql的時(shí)候出錯(cuò),原因是在選擇的時(shí)候,不能同步進(jìn)行刪除或更新操作,這時(shí)候引用一個(gè)臨時(shí)表吧.

  1. create TEMPORARY table tmp  select id from airport WHERE  
  2. id IN (SELECT id FROM airport GROUP BY code HAVING COUNT(code) > 1)  
  3. AND id NOT IN (SELECT max(id) FROM airport GROUP BY code HAVING COUNT(code ) >1); 
  4.  
  5. delete from airport where id in (select id from tmp) 

ok,操作完成,再看看有沒(méi)有重復(fù)的情況:

SELECT id FROM airport GROUP BY code HAVING COUNT(code) > 1

如果有再進(jìn)行刪除,表的三字碼已經(jīng)不重復(fù)了,再為三字碼添加唯一索引了.

發(fā)表評(píng)論 共有條評(píng)論
用戶名: 密碼:
驗(yàn)證碼: 匿名發(fā)表
主站蜘蛛池模板: 济宁市| 固原市| 灵武市| 阿拉善右旗| 乌鲁木齐市| 盐边县| 城市| 牟定县| 桐梓县| 麻城市| 绿春县| 新晃| 综艺| 赤城县| 垫江县| 宣化县| 武威市| 正阳县| 东丰县| 大洼县| 察哈| 遂平县| 当雄县| 那曲县| 宁城县| 平和县| 安平县| 东莞市| 和硕县| 介休市| 拜泉县| 常宁市| 商丘市| 连江县| 利津县| 汉沽区| 荔波县| 寿宁县| 遂宁市| 黔江区| 临沧市|