問題概述:
公司網站是問答百科的網站、seo工程師提出需求說根據網站的問題來生成xml文件。每個xml文件包含5000條setmap格式數據。現在線上網站大約有70w條問題,所以說基本生成140個xml文件。還有一個索引文件。比如文件的名稱以數字開頭的。索引文件包含的內容就是每個xml文件的路徑還有名稱。
為什么要每個文件存儲5000條數據呢,因為這是mysql的一個界限值、如果每次取多了以后可能會對線上用戶訪問造成影響,或者速度變慢。每個文件存儲5000條數據,但是mysql selsect的時候不能每次取5000條、現在寫的是每次取1000條。那這樣邏輯就有點復雜。
實現方法:
首先取出1000條數據(可以靈活些成活的,方便以后修改),然后循環生成xml格式文件。file_puts_contens寫入文件。然后再把生成的xml文件名稱、取出問題的最小id、取出問題的最大id、取出問題的條數寫出一個索引查詢的txt文件當中,格式大概是這個樣子的。
0,3146886,3145887,1000
發現最后面的條數是1000了嗎、第一次select取出1000條數據、然后寫入0.xml文件當中。把取出的xml文件名稱、最小id、最大id、條數寫入到索引查詢txt中。第一次寫入了1000條數據到0.xml、生成條數為1000。第二次查詢的時候select語句會成為。 where id > 取出的最大id(當前mysql為正序查詢、如果為倒序、改成小于) limit 1000 這樣的話又取出1000、然后修改索引查詢txt的最小id、最大id、生成條數加到2000。以此類推等生成條數到了5000的時候再另起一行寫入索引文件、類似這樣
0,3146886,3145887,5000
1,3148886,3147887,1000
這樣寫的話就減輕了服務器的壓力。
下面貼出實現代碼(風格有點亂):
具體功能代碼如下:
代碼如下:<?php
xml索引文件格式如下:
新聞熱點
疑難解答