在mysql中獲取隨機(jī)數(shù)據(jù)方法很簡(jiǎn)單只要使用order by rand()即可了,但是如果你是百萬級(jí)數(shù)據(jù)量,使用order by rand()獲取隨機(jī)數(shù)據(jù)你會(huì)等死去,下面我來介紹具體的解決辦法.
1.order by rand()
數(shù)據(jù)多了極慢,隨機(jī)性非常好,適合非常小數(shù)據(jù)量的情況,代碼如下:
- SELECT * FROM table_name AS r1 JOIN (SELECT (ROUND(RAND() * (SELECT ABS(MAX(id)-MIN(id)-$limit) FROM table_name))+(SELECT MIN(id) from table_name)) AS id) AS r2 WHERE r1.id >= r2.id ORDER BY r1.id ASC LIMIT $limit;
速度非常快,但是得到的數(shù)據(jù)是id連續(xù)的,沒辦法解決.
子查詢產(chǎn)生一個(gè)隨機(jī)數(shù),rand()是0到1的隨機(jī)數(shù),可以等于0到1,MAX(id)-MIN(id)還要減去$limit以免結(jié)果數(shù)量不夠$limit條,因?yàn)橹鞅韎d可能不連續(xù),所以r1.id要>=r2.id.
還要注意的是有時(shí)候最小id不是從1開始的,可能從一個(gè)很大的數(shù)開始,所以必須加上M(id)的值.
手冊(cè)相關(guān)內(nèi)容:若要在i ≤ R ≤ j 這個(gè)范圍得到一個(gè)隨機(jī)整數(shù)R,需要用到表達(dá)式 FLOOR(i + RAND() * (j – i + 1)).
例如,若要在7 到 12 的范圍(包括7和12)內(nèi)得到一個(gè)隨機(jī)整數(shù),可使用以下語(yǔ)句:
- SELECT FLOOR(7 + (RAND() * 6)); //Vevb.com
- select * from test where rand()>0.0005 limit 10;
0.0005是一個(gè)計(jì)算出的比例直接關(guān)系到隨機(jī)的質(zhì)量,比如數(shù)據(jù)表10000條數(shù)據(jù),需要隨機(jī)取300條,那么0.0005就需要改成(300/10000=0.03).
這種方法不能保證每次能取到多少,需要取多次,2和3速度一樣的快,主要區(qū)別是2總能返回limit條數(shù)據(jù),3就沒準(zhǔn)了,符合正太分布,2是連續(xù)數(shù)據(jù),3是隨機(jī)行.
新聞熱點(diǎn)
疑難解答
圖片精選