微博短链接的生成算法(Java版本)

最近看到微博的短链接真是很火啊,新浪、腾讯、搜狐等微博网站都加入了短链接的功能。之所以要是使用短链接,主要是因为微博只允许发140 字,如果链接地址太长的话,那么发送的字数将大大减少。短链接的主要职责就是把原始链接很长的地址压缩成只有6 个字母的短链接地址,当我们点击这6 个字母的链接后,我们又可以跳转到原始链接地址。

开始以为短链接是按照某种算法把原始链接压缩为短链接,再根据算法从短链接反算成原始链接的。后来尝试了下压缩算法(gzip 压缩算法),发现对于url 这种字符串越是压缩,长度就越长。通过对压缩算法的一些了解,发现靠压缩算法来实现这个功能不太靠谱。

后来在网上找到一个生成算法,该算法主要使用MD5 算法对原始链接进行加密(这里使用的MD5 加密后的字符串长度为32 位),然后对加密后的字符串进行处理以得到短链接的地址。原始的算法是C# 版本的,这里我把该算法修改成Java 版本的. 算法的具体代码如下,代码中有注释:

package com.csdn.shorturl;

public class ShortUrlGenerator {

    /**

      * @param args

      */

    public static void main(String[] args) {

       // 长连接: http://tech.sina.com.cn/i/2011-03-23/11285321288.shtml

       // 新浪解析后的短链接为: http://t.cn/h1jGSC

       String sLongUrl = "http://tech.sina.com.cn/i/2011-03-23/11285321288.shtml" ; // 3BD768E58042156E54626860E241E999

       String[] aResult = shortUrl (sLongUrl);

       // 打印出结果

       for ( int i = 0; i < aResult. length ; i++) {

           System. out .println( "[" + i + "]:::" + aResult[i]);

       }

    }

    public static String[] shortUrl(String url) {

       // 可以自定义生成 MD5 加密字符传前的混合 KEY

       String key = "wuguowei" ;

       // 要使用生成 URL 的字符

       String[] chars = new String[] { "a" , "b" , "c" , "d" , "e" , "f" , "g" , "h" ,

              "i" , "j" , "k" , "l" , "m" , "n" , "o" , "p" , "q" , "r" , "s" , "t" ,

              "u" , "v" , "w" , "x" , "y" , "z" , "0" , "1" , "2" , "3" , "4" , "5" ,

              "6" , "7" , "8" , "9" , "A" , "B" , "C" , "D" , "E" , "F" , "G" , "H" ,

              "I" , "J" , "K" , "L" , "M" , "N" , "O" , "P" , "Q" , "R" , "S" , "T" ,

              "U" , "V" , "W" , "X" , "Y" , "Z"

       };

       // 对传入网址进行 MD5 加密

       String sMD5EncryptResult = ( new CMyEncrypt()).getMD5OfStr(key + url);

       String hex = sMD5EncryptResult;

       String[] resUrl = new String[4];

       for ( int i = 0; i < 4; i++) {

           // 把加密字符按照 8 位一组 16 进制与 0x3FFFFFFF 进行位与运算

           String sTempSubString = hex.substring(i * 8, i * 8 + 8);

           // 这里需要使用 long 型来转换,因为 Inteper .parseInt() 只能处理 31 位 , 首位为符号位 , 如果不用 long ,则会越界

           long lHexLong = 0x3FFFFFFF & Long.parseLong (sTempSubString, 16);

           String outChars = "" ;

           for ( int j = 0; j < 6; j++) {

              // 把得到的值与 0x0000003D 进行位与运算,取得字符数组 chars 索引

              long index = 0x0000003D & lHexLong;

              // 把取得的字符相加

              outChars += chars[( int ) index];

              // 每次循环按位右移 5 位

              lHexLong = lHexLong >> 5;

           }

           // 把字符串存入对应索引的输出数组

           resUrl[i] = outChars;

       }

       return resUrl;

    }

}

  

二、  输出结果

执行上面代码的结果如下,会产生4 组6 位字符串,任意一组都可以作为当前字符串的短链接地址。

[0]:::7nUFJn

[1]:::f6Zzy2

[2]:::j6jmQb

[3]:::2eAjea

  

三、  跳转原理

当我们生成短链接之后,只需要在表中(数据库或者NoSql )存储原始链接与短链接的映射关系即可。当我们访问短链接时,只需要从映射关系中找到原始链接,即可跳转到原始链接。

转载:http://tomfish88.iteye.com/blog/1112381

时间: 2024-10-12 05:26:46

微博短链接的生成算法(Java版本)的相关文章

java清除所有微博短链接

java实现微博短链接清除,利用正则,目前只支持微博短链接格式为"http://域名/字母或数字8位以内"的链接格式,现在基本通用 如果链接有多个,返回结果中会有多出的空格,请注意! 实现代码: 1.测试版       public static void main(String[] args) { // System.out.println(testFilter("刚在#微操盘#卖出的这支600111 包钢稀土 又挣钱了!有木有!人品爆发了有木有! http://t.cn/

java高仿新浪微博短链接地址生成工具ShortUrlGenerator.java

原文:仿新浪微博 短链接地址生成工具 ShortUrlGenerator.java 源代码下载地址:http://www.zuidaima.com/share/1550463378934784.htm 仿新浪微博 短链接地址生成工具 ShortUrlGenerator.java String sLongUrl = "http://www.zuidaima.com/share/1550463378934784.htm"; // 3BD768E58042156E54626860E241E9

URL短地址压缩算法 微博短地址原理解析 (Java实现)

最近,项目中需要用到短网址(ShortUrl)的算法,于是在网上搜索一番,发现有C#的算法,有.Net的算法,有PHP的算法,就是没有找到Java版的短网址(ShortUrl)的算法,很是郁闷.同时还发现有不少网友在发帖求助,怎么实现Java版的短网址(ShortUrl)的算法.干脆一不做,二不休,参考了一下网上比较流行的PHP版短网址(ShortUrl)算法: 再根据自己的理解,用Java实现了该短网址(ShortUrl)的算法.(\(^o^)/YES!我还真厉害!) 先来废话一下,是在别人的

http://t.cn/xxx的短链接如何生成?(附15款新浪短链接生成器)

短链接已经广泛应用于各种场景,电商,微信,短信等等.那么今天给大家推荐15款t.cn.url.cn的短链接短网址在线生成工具,都是我从市面数十款短链接短网址生成工具里面挑选的最为简便,最为稳定的短链接短网址生成工具.废话不多! 1,青梅短网址 网站链接:http://qingmeidwz.cn 青梅短网址是发展的比较成熟的一款在线短网址短链接生成工具,一直是本着“简 单,高效,自由,稳定”的理念.不管是同行业还是用户的口中都有着非常好的口碑. 青梅短网址最大的优点就和他们所倡导的理念一样:“简单

[转载]微博短链接算法

PHP版算法 function shorturl($url='', $prefix='', $suffix='') {     $base32 = array (         'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h',         'i', 'j', 'k', 'l', 'm', 'n', 'o', 'p',         'q', 'r', 's', 't', 'u', 'v', 'w', 'x',         'y', 'z', '0', '

推荐十五个新浪T.CN短网址/腾讯URL短链接的生成缩短的工具

1.冷狗短链接 平台官网:http://dogdwz.cn/ 2.麦云短链接 平台官网:http://maiyurl.cn/ 3.麻花短网址 平台官网:http://mhdwz.cn/ 4.蓝鸟短链接 平台官网:http://lnurl.cn 5.青桃短链接 平台官网:http://qturl.cn 6.快鸟短网址 平台官网:http://kndwz.com 7.酷牛短链接 平台官网:http://knurl.cn 8.雷虎短链 平台官网:http://tttool.cn 9.米狗短网址 平台官

微博短链接算法php版本

思路:1)将长网址md5生成32位签名串,分为4段, 每段8个字节;2)对这四段循环处理, 取8个字节, 将他看成16进制串与0x3fffffff(30位1)与操作, 即超过30位的忽略处理;3)这30位分成6段, 每5位的数字作为字母表的索引取得特定字符, 依次进行获得6位字符串;4)总的md5串可以获得4个6位串; 取里面的任意一个就可作为这个长url的短url地址; 下面是PHP代码: function shorturl($url='', $prefix='', $suffix='') {

回文字算法(java版本)

package com.gdh.backtext;import java.util.HashMap;import java.util.Map;import java.util.Map.Entry; public class BackText { String text; public BackText() { super(); this.text = null; } public BackText(String text) { super(); this.text = text; } publi

生成短链接的URL

假设你想做一个像微博短链接那样的短链接服务,短链接服务生成的URL都非常短例如: http://t.cn/E70Piib, 我们应该都能想到链接中的E70Piib对应的就是存储长链接地址的数据记录的ID,可是这个有大小写字母和数字构成的唯一ID是怎么生成的呢,刚学编程的时候我们用的方法都试拼接一个足够唯一的字符串(比如时间戳加用户ID等等)然后再用MD5或者SHA1散列算法算出一个散列值,用这种方法得到的唯一ID有可能比原始的链接的长度还要长,所以如何来优雅的生成足够短的字符串唯一ID呢? 我们