当前位置:Gxlcms > PHP教程 > php短链接算法收集与分析_php技巧

php短链接算法收集与分析_php技巧

时间:2021-07-01 10:21:17 帮助过:5人阅读

短链接就不说了,大家已经都清楚了,如下所示就是短链接:
新浪微博 http://t.cn/SVpONM
腾讯微博 http://url.cn/302yor
Yun.io http://d.yun.io/PNri2v
短链接的好处:1、内容需要;2、用户友好;3、便于管理。
如何实现呢,大概有三个步骤:
1、定义一个URL映射算法,可以将长的URL映射成短字符串;
2、使用一个存储(数据库?NoSQL?)来存储完成的映射;
3、实现自己的URL映射算法;
一般来说,第三步是我们比较头疼的,如何将一个长的URL字符串,映射成一个较短的字符串呢。我总结了三种办法:
普通实现
我想以前大家学习过十进制和二进制的互相转换,或者十进制和十六进制的互相转换,那么为了更短,我们可以使用62进制,对于一个数字ID进行转码,转换成一个短字符串。
这种做法的缺点是没有办法保证所有链接都是固定的位数的长度,而且在高并发的情况下,如何保证能够快速分发是个问题。
具体实现方法:
代码如下:
  1. <br>/** <br>* 利用62进制对数字ID进行短链接编码,缺点不能保证每个短链接是固定长度 <br>* <br>* @author wanshiqiang<wangshiqiang@360.cn> <br>* @param integer $integer <br>* @param string $base <br>*/ <br>private function getShortenedURLFromID ($integer, $base = ALLOWED_CHARS) <br>{ <br>$length = strlen($base); <br>while($integer > $length - 1) <br>{ <br>$out = $base[fmod($integer, $length)] . $out; <br>$integer = floor( $integer / $length ); <br>} <br>return $base[$integer] . $out; <br>} <br>/** <br>* 对62进制编码的短链接进行解码 <br>* <br>* @author wangshiqiang<wangshiqiang@360.cn> <br>* @param string $string <br>* @param string $base <br>*/ <br>private function getIDFromShortenedURL ($string, $base = ALLOWED_CHARS) <br>{ <br>$length = strlen($base); <br>$size = strlen($string) - 1; <br>$string = str_split($string); <br>$out = strpos($base, array_pop($string)); <br>foreach($string as $i => $char) <br>{ <br>$out += strpos($base, $char) * pow($length, $size - $i); <br>} <br>return $out; <br>} <br> <br>文艺实现 <br>算法描述:使用6个字符来表示短链接,我们使用ASCII字符中的'a'-'z','0'-'5',共计32个字符做为集合。每个字符有32种状态,六个字符就可以表示32^6(1073741824),那么如何得到这六个字符,描述如下: <br>对传入的长URL进行Md5,得到一个32位的字符串,这个字符串变化很多,是16的32次方,基本上可以保证唯一性。将这32位分成四份,每一份8个字符,这时机率变成了16的8次方,是4294967296,这个数字碰撞的机率也比较小啦,关键是后面的一次处理。我们将这个8位的字符认为是16进制整数,也就是1*('0x'.$val),然后取0-30位,每5个一组,算出他的整数值,然后映射到我们准备的32个字符中,最后就能够得到一个6位的短链接地址。 <br>PHP实现如下: <br><span><u></u></span> 代码如下:<pre class="brush:php;toolbar:false layui-box layui-code-view layui-code-notepad"><ol class="layui-code-ol"><li><br>function shorten( $long_url ) <br>{ <br>$base32 = "abcdefghijklmnopqrstuvwxyz012345"; <br>$hex = md5( $long_url ); <br>$hexLen = strlen( $hex ); <br>$subHexLen = $hexLen / 8; <br>$output = array(); <br>for( $i = 0; $i < $subHexLen; $i++ ) <br>{ <br>$subHex = substr( $hex, $i * 8, 8 ); <br>$subHex = 0x3FFFFFFF & ( 1 * ('0x' . $subHex ) ); <br>    $out = ''; <br>for( $j = 0; $j < 6; $j++ ) <br>{ <br>$val = 0x0000001F & $int; <br>$out .= $base32[$val]; <br>$int = $int >> 5; <br>} <br>$output[] = $out; <br>} <br>return $output; <br>} <br> <br>二逼实现 <br>下面这个函数使用了纯随机的方式来生成一个短链接,虽然我们可以通过查询操作来确保不重复使用短链接,可是... 这样真的靠谱吗~~ <br><span><u></u></span> 代码如下:<pre class="brush:php;toolbar:false layui-box layui-code-view layui-code-notepad"><ol class="layui-code-ol"><li><br>function random($length, $pool = '') { <br>$random = ''; <br>if (empty($pool)) { $pool = 'abcdefghkmnpqrstuvwxyz'; $pool .= <br>'23456789'; } <br>srand ((double)microtime()*1000000); <br>for($i = 0; $i < $length; $i++) { $random .= <br>substr($pool,(rand()%(strlen ($pool))), 1); } <br>return $random; <br>} <br> <br></li><li>Technorati 标签: 短链接,Short Url,映射,哈希</li><li><p>参考资料:</p></li><li><p>1、微博短地址原理解析</p></li><li><p>2、微博短域名原理及作用</p></li><li><p>3、Yours.org</p></li><li><p>4、Free PHP URL Shorten script that kicks ass</p></li><li><p>5、PHP Short Url Algorithm Implementation</p></li><li><p>6、Implement your own short URL</p></li><li><p>7、短网址算法初步汇总</p></li><li><p>8、Short Url 实现方式 </p></li></ol></pre></li></ol></pre></wangshiqiang@360.cn></wangshiqiang@360.cn>

人气教程排行