国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 開發 > PHP > 正文

基于PHP讀取TXT文件向數據庫導入海量數據的方法

2024-05-04 21:53:18
字體:
來源:轉載
供稿:網友

有一個TXT文件,包含了10萬條記錄,格式如下:

列1 列2 列3 列4 列5
a 00003131 0 0 adductive#1 adducting#1 adducent#1
a 00003356 0 0 nascent#1
a 00003553 0 0 emerging#2 emergent#2
a 00003700 0.25 0 dissilient#1

……………………后面有10萬條………………

需求是要導入數據庫中,數據表的結構為

word_id 自動增量
word 【adductive#1 adducting#1 adducent#1】這一個TXT記錄要轉換為3個SQL記錄
value =第三列-第四列;如果=0,則此條記錄略過不插入數據表

復制代碼 代碼如下:www.CuoXIn.com

<?php
$file = 'words.txt';//10W條記錄的TXT源文件
$lines = file_get_contents($file);
ini_set('memory_limit', '-1');//不要限制Mem大小,否則會報錯
$line=explode("/n",$lines);
$i=0;
$sql="INSERT INTO words_sentiment (word,senti_type,senti_value,word_type) VALUES ";

foreach($line as $key =>$li)
{
$arr=explode(" ",$li);
$senti_value=$arr[2]-$arr[3];
if($senti_value!=0)
{
if($i>=20000&&$i<25000)//分批次導入,避免失敗
{
$mm=explode(" ",$arr[4]);
foreach($mm as $m) //【adductive#1 adducting#1 adducent#1】這一個TXT記錄要轉換為3個SQL記錄 {
$nn=explode("#",$m);
$word=$nn[0];
$sql.="(/"$word/",1,$senti_value,2),";//這個地方要注意到是 word有可能包含單引號(如jack's),因此我們要用雙引號來包含word(注意轉義)
}
}
$i++;
}
}
//echo $i;
$sql=substr($sql,0,-1);//去掉最后一個逗號
//echo $sql;
file_put_contents('20000-25000.txt', $sql); //批量導入數據庫,5000條一次,大概需要40秒的樣子;一次導入太多max_execution_time會不夠,導致失敗
?>

1,海量數據導入到時候,要注意PHP的一些限制,可以臨時調整一下,否則會報錯

Allowed memory size of 33554432 bytes exhausted (tried to allocate 16 bytes)

2,PHP操作TXT文件

file_get_contents()

file_put_contents()

3,海量導入的時候,最好分批次導入,失敗的幾率小一些

4,海量導入之前,腳本一定要多次測試無誤再使用,比如用100條數據來測試

5,導入之后,如果PHP的mem_limit還是不夠的話,程序仍然跑不起來

(建議用修改php.ini的方式來提高mem_limit,而不是用臨時的語句)

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 南陵县| 环江| 买车| 临高县| 澄江县| 信阳市| 枣阳市| 游戏| 修文县| 宝山区| 祁阳县| 灵武市| 武夷山市| 上思县| 青阳县| 肇源县| 资中县| 和顺县| 天水市| 汝城县| 崇文区| 永定县| 安龙县| 西畴县| 宣化县| 南涧| 张北县| 洛隆县| 孝感市| 靖宇县| 行唐县| 志丹县| 凌海市| 基隆市| 盐津县| 奎屯市| 苏尼特右旗| 西昌市| 青州市| 西贡区| 鹤山市|