国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 開發(fā) > PHP > 正文

php 短鏈接算法收集與分析

2024-05-04 23:16:01
字體:
來源:轉載
供稿:網(wǎng)友
短鏈接就不說了,大家已經(jīng)都清楚了,如下所示就是短鏈接:
新浪微博
騰訊微博
Yun.io
短鏈接的好處:1、內容需要;2、用戶友好;3、便于管理。
如何實現(xiàn)呢,大概有三個步驟:
1、定義一個URL映射算法,可以將長的URL映射成短字符串;
2、使用一個存儲(數(shù)據(jù)庫?NoSQL?)來存儲完成的映射;
3、實現(xiàn)自己的URL映射算法;
一般來說,第三步是我們比較頭疼的,如何將一個長的URL字符串,映射成一個較短的字符串呢。我總結了三種辦法:
普通實現(xiàn)
我想以前大家學習過十進制和二進制的互相轉換,或者十進制和十六進制的互相轉換,那么為了更短,我們可以使用62進制,對于一個數(shù)字ID進行轉碼,轉換成一個短字符串。
這種做法的缺點是沒有辦法保證所有鏈接都是固定的位數(shù)的長度,而且在高并發(fā)的情況下,如何保證能夠快速分發(fā)是個問題。
具體實現(xiàn)方法:

復制代碼 代碼如下:


/**
* 利用62進制對數(shù)字ID進行短鏈接編碼,缺點不能保證每個短鏈接是固定長度
*
* @author wanshiqiang<wangshiqiang@360.cn>
* @param integer $integer
* @param string $base
*/
private function getShortenedURLFromID ($integer, $base = ALLOWED_CHARS)
{
$length = strlen($base);
while($integer > $length - 1)
{
$out = $base[fmod($integer, $length)] . $out;
$integer = floor( $integer / $length );
}
return $base[$integer] . $out;
}
/**
* 對62進制編碼的短鏈接進行解碼
*
* @author wangshiqiang<wangshiqiang@360.cn>
* @param string $string
* @param string $base
*/
private function getIDFromShortenedURL ($string, $base = ALLOWED_CHARS)
{
$length = strlen($base);
$size = strlen($string) - 1;
$string = str_split($string);
$out = strpos($base, array_pop($string));
foreach($string as $i => $char)
{
$out += strpos($base, $char) * pow($length, $size - $i);
}
return $out;
}


文藝實現(xiàn)
算法描述:使用6個字符來表示短鏈接,我們使用ASCII字符中的'a'-'z','0'-'5',共計32個字符做為集合。每個字符有32種狀態(tài),六個字符就可以表示32^6(1073741824),那么如何得到這六個字符,描述如下:
對傳入的長URL進行Md5,得到一個32位的字符串,這個字符串變化很多,是16的32次方,基本上可以保證唯一性。將這32位分成四份,每一份8個字符,這時機率變成了16的8次方,是4294967296,這個數(shù)字碰撞的機率也比較小啦,關鍵是后面的一次處理。我們將這個8位的字符認為是16進制整數(shù),也就是1*('0x'.$val),然后取0-30位,每5個一組,算出他的整數(shù)值,然后映射到我們準備的32個字符中,最后就能夠得到一個6位的短鏈接地址。
PHP實現(xiàn)如下:

復制代碼 代碼如下:


function shorten( $long_url )
{
$base32 = "abcdefghijklmnopqrstuvwxyz012345";
$hex = md5( $long_url );
$hexLen = strlen( $hex );
$subHexLen = $hexLen / 8;
$output = array();
for( $i = 0; $i < $subHexLen; $i++ )
{
$subHex = substr( $hex, $i * 8, 8 );
$subHex = 0x3FFFFFFF & ( 1 * ('0x' . $subHex ) );
    $out = '';
for( $j = 0; $j < 6; $j++ )
{
$val = 0x0000001F & $int;
$out .= $base32[$val];
$int = $int >> 5;
}
$output[] = $out;
}
return $output;
}


二逼實現(xiàn)
下面這個函數(shù)使用了純隨機的方式來生成一個短鏈接,雖然我們可以通過查詢操作來確保不重復使用短鏈接,可是... 這樣真的靠譜嗎~~

復制代碼 代碼如下:


function random($length, $pool = '') {
$random = '';
if (empty($pool)) { $pool = 'abcdefghkmnpqrstuvwxyz'; $pool .=
'23456789'; }
srand ((double)microtime()*1000000);
for($i = 0; $i < $length; $i++) { $random .=
substr($pool,(rand()%(strlen ($pool))), 1); }
return $random;
}


Technorati 標簽: 短鏈接,Short Url,映射,哈希

參考資料:

1、微博短地址原理解析

2、微博短域名原理及作用

3、Yours.org

4、Free PHP URL Shorten script that kicks ass

5、PHP Short Url Algorithm Implementation

6、Implement your own short URL

7、短網(wǎng)址算法初步匯總

8、Short Url 實現(xiàn)方式

發(fā)表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發(fā)表
主站蜘蛛池模板: 冕宁县| 贺兰县| 营口市| 凤冈县| 莆田市| 右玉县| 贵港市| 滨海县| 北碚区| 阿尔山市| 清远市| 连南| 怀安县| 辰溪县| 忻城县| 湄潭县| 祁东县| 深州市| 泾阳县| 宜良县| 信宜市| 丘北县| 屏山县| 荣成市| 邢台市| 通榆县| 武宁县| 靖边县| 信丰县| 游戏| 金乡县| 寿阳县| 德惠市| 永春县| 福鼎市| 文水县| 项城市| 长治县| 泰顺县| 兴宁市| 施甸县|