[转载]微博短链接算法

PHP版算法

function shorturl($url=‘‘, $prefix=‘‘, $suffix=‘‘) {
    $base32 = array (
        ‘a‘, ‘b‘, ‘c‘, ‘d‘, ‘e‘, ‘f‘, ‘g‘, ‘h‘,
        ‘i‘, ‘j‘, ‘k‘, ‘l‘, ‘m‘, ‘n‘, ‘o‘, ‘p‘,
        ‘q‘, ‘r‘, ‘s‘, ‘t‘, ‘u‘, ‘v‘, ‘w‘, ‘x‘,
        ‘y‘, ‘z‘, ‘0‘, ‘1‘, ‘2‘, ‘3‘, ‘4‘, ‘5‘);

    $hex = md5($prefix.$url.$suffix);
    $hexLen = strlen($hex);
    $subHexLen = $hexLen / 8;
    $output = array();

    for ($i = 0; $i < $subHexLen; $i++) {
        $subHex = substr ($hex, $i * 8, 8);
        $int = 0x3FFFFFFF & (1 * (‘0x‘.$subHex));
        $out = ‘‘;
        for ($j = 0; $j < 6; $j++) {
            $val = 0x0000001F & $int;
            $out .= $base32[$val];
            $int = $int >> 5;
        }
        $output[] = $out;
    }
    return $output;
}

$urls = shorturl(‘http://www.php100.com‘);
var_dump($urls);

Java版算法

package com.csdn.shorturl;
public class ShortUrlGenerator {
 
    /**
      * @param args
      */
    public static void main(String[] args) {
       // 长连接: http://tech.sina.com.cn/i/2011-03-23/11285321288.shtml
       // 新浪解析后的短链接为: http://t.cn/h1jGSC
       String sLongUrl = "http://tech.sina.com.cn/i/2011-03-23/11285321288.shtml" ; // 3BD768E58042156E54626860E241E999
       String[] aResult = shortUrl (sLongUrl);
       // 打印出结果
       for ( int i = 0; i < aResult. length ; i++) {
           System. out .println( "[" + i + "]:::" + aResult[i]);
       }
    }
 
    public static String[] shortUrl(String url) {
       // 可以自定义生成 MD5 加密字符传前的混合 KEY
       String key = "wuguowei" ;
       // 要使用生成 URL 的字符
       String[] chars = new String[] { "a" , "b" , "c" , "d" , "e" , "f" , "g" , "h" ,
              "i" , "j" , "k" , "l" , "m" , "n" , "o" , "p" , "q" , "r" , "s" , "t" ,
              "u" , "v" , "w" , "x" , "y" , "z" , "0" , "1" , "2" , "3" , "4" , "5" ,
              "6" , "7" , "8" , "9" , "A" , "B" , "C" , "D" , "E" , "F" , "G" , "H" ,
              "I" , "J" , "K" , "L" , "M" , "N" , "O" , "P" , "Q" , "R" , "S" , "T" ,
              "U" , "V" , "W" , "X" , "Y" , "Z"
 
       };
       // 对传入网址进行 MD5 加密
       String sMD5EncryptResult = ( new CMyEncrypt()).getMD5OfStr(key + url);
       String hex = sMD5EncryptResult;
 
       String[] resUrl = new String[4];
       for ( int i = 0; i < 4; i++) {
 
           // 把加密字符按照 8 位一组 16 进制与 0x3FFFFFFF 进行位与运算
           String sTempSubString = hex.substring(i * 8, i * 8 + 8);
 
           // 这里需要使用 long 型来转换,因为 Inteper .parseInt() 只能处理 31 位 , 首位为符号位 , 如果不用long ,则会越界
           long lHexLong = 0x3FFFFFFF & Long.parseLong (sTempSubString, 16);
           String outChars = "" ;
           for ( int j = 0; j < 6; j++) {
              // 把得到的值与 0x0000003D 进行位与运算,取得字符数组 chars 索引
              long index = 0x0000003D & lHexLong;
              // 把取得的字符相加
              outChars += chars[( int ) index];
              // 每次循环按位右移 5 位
              lHexLong = lHexLong >> 5;
           }
           // 把字符串存入对应索引的输出数组
           resUrl[i] = outChars;
       }
       return resUrl;
    }
}

跳转原理

当我们生成短链接之后,只需要在表中(数据库或者NoSql )存储原始链接与短链接的映射关系即可。当我们访问短链接时,只需要从映射关系中找到原始链接,即可跳转到原始链接。

参考网址

http://www.php100.com/html/webkaifa/PHP/PHPyingyong/2012/0606/10506.html

http://blog.csdn.net/wgw335363240/article/details/6568794

时间: 2024-10-13 04:57:43

[转载]微博短链接算法的相关文章

微博短链接算法php版本

思路:1)将长网址md5生成32位签名串,分为4段, 每段8个字节;2)对这四段循环处理, 取8个字节, 将他看成16进制串与0x3fffffff(30位1)与操作, 即超过30位的忽略处理;3)这30位分成6段, 每5位的数字作为字母表的索引取得特定字符, 依次进行获得6位字符串;4)总的md5串可以获得4个6位串; 取里面的任意一个就可作为这个长url的短url地址; 下面是PHP代码: function shorturl($url='', $prefix='', $suffix='') {

java清除所有微博短链接

java实现微博短链接清除,利用正则,目前只支持微博短链接格式为"http://域名/字母或数字8位以内"的链接格式,现在基本通用 如果链接有多个,返回结果中会有多出的空格,请注意! 实现代码: 1.测试版       public static void main(String[] args) { // System.out.println(testFilter("刚在#微操盘#卖出的这支600111 包钢稀土 又挣钱了!有木有!人品爆发了有木有! http://t.cn/

微博短链接的生成算法(Java版本)

最近看到微博的短链接真是很火啊,新浪.腾讯.搜狐等微博网站都加入了短链接的功能.之所以要是使用短链接,主要是因为微博只允许发140 字,如果链接地址太长的话,那么发送的字数将大大减少.短链接的主要职责就是把原始链接很长的地址压缩成只有6 个字母的短链接地址,当我们点击这6 个字母的链接后,我们又可以跳转到原始链接地址. 开始以为短链接是按照某种算法把原始链接压缩为短链接,再根据算法从短链接反算成原始链接的.后来尝试了下压缩算法(gzip 压缩算法),发现对于url 这种字符串越是压缩,长度就越长

生成短链接的URL

假设你想做一个像微博短链接那样的短链接服务,短链接服务生成的URL都非常短例如: http://t.cn/E70Piib, 我们应该都能想到链接中的E70Piib对应的就是存储长链接地址的数据记录的ID,可是这个有大小写字母和数字构成的唯一ID是怎么生成的呢,刚学编程的时候我们用的方法都试拼接一个足够唯一的字符串(比如时间戳加用户ID等等)然后再用MD5或者SHA1散列算法算出一个散列值,用这种方法得到的唯一ID有可能比原始的链接的长度还要长,所以如何来优雅的生成足够短的字符串唯一ID呢? 我们

php短网址算法实例代码分享

php实现的短网址算法,理论上支持1,073,741,824个短网址. 每个网址用6个字符代替,(6^32) 最多可以拥有1,073,741,824个短网址.当然,你还可以记录更详细的信息,如访问记录,创建时间等.如果真不够用了,还可以删掉很久不用的. function shorturl($input) { $base32 = array ( 'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l', 'm', 'n', 'o', 'p

Android-微博短链接正则表达式与特殊文本高亮

做新浪微博第三方客户端时,对正文内容的特殊字符(如网页短链接.##话题.@人名等)进行高亮变色,需要用到以下几个正则表达式. 1 /**微博短链接正则表达式*/ 2 static final String regex_http = "http(s)?://([a-zA-Z|\\d]+\\.)+[a-zA-Z|\\d]+(/[a-zA-Z|\\d|\\-|\\+|_./?%=]*)?"; 3 static final String regex_at = "@[\\u4e00-\

百度 谷歌 Twitter,这么多短链接服务(Short Url)到底哪家强?

一.短链接是什么 短链接,通俗来说,就是将长的URL网址,通过程序计算等方式,转换为简短的网址字符串. 它的原理也非常简单,就是采用 Domain Redirect(域名重定向) ,将一个域名自动跳转到另一个域名. 根据wikipedia描述,短链接的方案最早在2000年诞生.在2009年11月,著名短链接服务提供商Bitly的访问量是21亿,可见短链接的使用需求是非常大的. 维基地址 而在国内,短链接的普及与微博息息相关. 最早是由新浪仿照Twitter的140短篇博文功能,上线了新浪微博,之

新浪短链接

https://www.aliyun.com/jiaocheng/327498.html 阿里云 >  教程中心   >  java教程 >  短链(短地址.Short URL) 短链(短地址.Short URL) 发布时间:2018-02-07 来源:网络 上传者:用户 关键字: 新浪微博 接口 流行 统计 网络 发表文章 摘要:   短链接产生和流行得益于社交网络的发展.短链接可以更方便的在网络中传播,避免超出字符限制,使得分享地址更加容易并且能够统计此地址的访问信息.   下面是新

Java 域名短链接服务原理及解决方案

一.背景 现在在各种圈的产品各种推广地址,由于URL地址过长,不美观.不方便收藏.发布.传播以及各种发文字数限制等问题,微信.微博都在使用短链接技术.最近由于使用的三方的生成.解析短链接服务开始限制使用以及准备收费.不方便统计分析.不方便流控等问题,决定自建一个短地址服务. 二.原理 比如,http://a.b.com/15uOVS 这个短地址 第1步,浏览器请求这个地址 第2步,通过DNS后到短地址服务端,还原这个短地址对应的原始长地址. 第3步,请求http 301 或302到原始的长地址上