URL短地址压缩算法

时下,短网址应用已经在全国各大微博上开始流行了起来。例如QQ微博的url.cn,新郎的t.cn等。我们在新浪微博上发布网址的时候,微博会自动判别网址,并将其转换,例如:http://t.cn/hrYnr0。为什么要这样做的,原因我想有这样几点:

1、微博限制字数为140字一条,那么如果我们需要发一些连接上去,但是这个连接非常的长,以至于将近要占用我们内容的一半篇幅,这肯定是不能被允许的,所以短网址应运而生了。

2、短网址可以在我们项目里可以很好的对开放级URL进行管理。有一部分网址可以会涵盖性、暴力、广告等信息,这样我们可以通过用户的举报,完全管理这个连接将不出现在我们的应用中,应为同样的URL通过加密算法之后,得到的地址是一样的。

3、我们可以对一系列的网址进行流量,点击等统计,挖掘出大多数用户的关注点,这样有利于我们对项目的后续工作更好的作出决策。

以上三点纯属个人观点,因为在我接下来的部分项目中会应用到,所以就了解了一下,下面先来看看短网址映射算法的理论(网上找到的资料):

① 将长网址用md5算法生成32位签名串,分为4段,,每段8个字符;

② 对这4段循环处理,取每段的8个字符, 将他看成16进制字符串与0x3fffffff(30位1)的位与操作,超过30位的忽略处理;

③ 将每段得到的这30位又分成6段,每5位的数字作为字母表的索引取得特定字符,依次进行获得6位字符串;

④ 这样一个md5字符串可以获得4个6位串,取里面的任意一个就可作为这个长url的短url地址。

我们并不一定说得到的URL是唯一的,但是我们能够取出4组URL,这样几乎不会出现太大的重复。

首先,请大家了解在Java中如何用MD5来加密字符串得到32位的加密后的字符串,下面是我已经封装好的Java MD5算法:

【MD5encry.class】

package com.example.demo_shorturl;

import java.security.MessageDigest;

/**
 * ClassName:MD5encry <br/>
 * Function: TODO ADD FUNCTION. <br/>
 * Reason:	 TODO ADD REASON. <br/>
 * Date:     2014-8-13 上午9:51:15 <br/>
 * @author   Geek_AnJon
 * @version
 * @since    JDK 1.6
 * @see
 */
public class MD5encry {
	private final static String[] hexDigits = {
	      "0", "1", "2", "3", "4", "5", "6", "7",
	      "8", "9", "a", "b", "c", "d", "e", "f"}; 

	    public static String byteArrayToHexString(byte[] b){
	        StringBuffer resultSb = new StringBuffer();
	        for (int i = 0; i < b.length; i++){
	            resultSb.append(byteToHexString(b[i]));
	        }
	        return resultSb.toString();
	    }

	    private static String byteToHexString(byte b){
	        int n = b;
	        if (n < 0)
	            n = 256 + n;
	        int d1 = n / 16;
	        int d2 = n % 16;
	        return hexDigits[d1] + hexDigits[d2];
	    }

	    public static String MD5Encode(String origin){
	        String resultString = null;
	            try {

	                resultString=new String(origin);
	                MessageDigest md = MessageDigest.getInstance("MD5");

	                resultString.trim();

	                resultString=byteArrayToHexString(md.digest(resultString.getBytes("UTF-8")));
	            }catch (Exception ex){}
	            return resultString;
	        }
	    public static void main(String[] args)
	    {

	        String data = "189022881112011111118:09sz0000123456789987654321";
	        System.out.println(MD5Encode(data));
	    }
}

【ShortUrl.class】

package com.example.demo_shorturl;
/**
 * ClassName:ShortUrl <br/>
 * Function: TODO ADD FUNCTION. <br/>
 * Reason:	 TODO ADD REASON. <br/>
 * Date:     2014-8-13 上午9:48:34 <br/>
 * @author   Geek_AnJon
 * @version
 * @since    JDK 1.6
 * @see
 */
public class ShortUrl {
    public static void main(String[] args) {
        String url = "http://www.baidu.com";
        for (String string : ShortText(url)) {
            print(string);
        }
    } 

    public static String[] ShortText(String string){
        String key = "Geek";                 //自定义生成MD5加密字符串前的混合KEY
        String[] chars = new String[]{          //要使用生成URL的字符
            "a","b","c","d","e","f","g","h",
            "i","j","k","l","m","n","o","p",
            "q","r","s","t","u","v","w","x",
            "y","z","0","1","2","3","4","5",
            "6","7","8","9","A","B","C","D",
            "E","F","G","H","I","J","K","L",
            "M","N","O","P","Q","R","S","T",
            "U","V","W","X","Y","Z"
        }; 

        String hex = MD5encry.MD5Encode(key + string);
        int hexLen = hex.length();
        int subHexLen = hexLen / 8;
        String[] ShortStr = new String[4]; 

        for (int i = 0; i < subHexLen; i++) {
            String outChars = "";
            int j = i + 1;
            String subHex = hex.substring(i * 8, j * 8);
            long idx = Long.valueOf("3FFFFFFF", 16) & Long.valueOf(subHex, 16); 

            for (int k = 0; k < 6; k++) {
                int index = (int) (Long.valueOf("0000003D", 16) & idx);
                outChars += chars[index];
                idx = idx >> 5;
            }
            ShortStr[i] = outChars;
        } 

        return ShortStr;
    } 

    private static void print(Object messagr){
        System.out.println(messagr);
    }
}

现在可以直接使用ShortText(url)方法获取短链接地址了

URL短地址压缩算法

时间: 2024-10-03 16:20:33

URL短地址压缩算法的相关文章

转载 URL短地址压缩算法

由于文章转载太多,所以找到出处,作者看到别生气 - - /// <summary> /// 生成salt /// </summary> /// <returns></returns> public static string GenerateSalt() { byte[] data = new byte[0x10]; new RNGCryptoServiceProvider().GetBytes(data); return Convert.ToBase64S

URL短地址压缩算法 微博短地址原理解析 (Java实现)

最近,项目中需要用到短网址(ShortUrl)的算法,于是在网上搜索一番,发现有C#的算法,有.Net的算法,有PHP的算法,就是没有找到Java版的短网址(ShortUrl)的算法,很是郁闷.同时还发现有不少网友在发帖求助,怎么实现Java版的短网址(ShortUrl)的算法.干脆一不做,二不休,参考了一下网上比较流行的PHP版短网址(ShortUrl)算法: 再根据自己的理解,用Java实现了该短网址(ShortUrl)的算法.(\(^o^)/YES!我还真厉害!) 先来废话一下,是在别人的

C#如何实现url短地址?C#短网址压缩算法与短网址原理入门

c# url短地址压缩算法与短网址原理的例子,详细介绍了短网址的映射算法,将长网址md5生成32位签名串,分为4段,每段8个字节,然后生成短网址,具体见文本实例. 短网址映射算法: 将长网址md5生成32位签名串,分为4段,每段8个字节:对这四段循环处理,取8个字节,将他看成16进制串与0x3fffffff(30位1)与操作,即超过30位的忽略处理:这30位分成6段,每5位的数字作为字母表的索引取得特定字符,依次进行获得6位字符串:总的md5串可以获得4个6位串:取里面的任意一个就可作为这个长u

url短地址

现在好多URL连接都使用的短地址不知道什么意思,网上找了篇例子读了一下代码做参考 <?php class Short_Url { #字符表 public static $charset = "0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz"; public static function short($url) { $key = "alexis"; $urlhash = md5($k

使用EJS生成短地址

此博客为9925.org的镜像,登录9925.org可以查看到最新博文. 原文出处:http://ily.so/MnUFBf 使用EJS脚本可以轻松调用webapi接口,下面的例子是调用ily.so短地址服务的,请参考. clear(); var url = prompt("请输入要缩短的地址:"); if(url != null && url != "") {     var re = /((http|https):\/\/)(([a-zA-Z0-

微博URL短网址生成算法原理及(java版、php版实现实例)

短网址(Short URL),顾名思义就是在形式上比较短的网址.通常用的是asp或者php转向,在Web 2.0的今天,不得不说,这是一个潮流.目前已经有许多类似服务,借助短网址您可以用简短的网址替代原来冗长的网址,让使用者可以更容易的分享链接. 例如:http://t.cn/SzjPjA 短网址服务,可能很多朋友都已经不再陌生,现在大部分微博.手机邮件提醒等地方已经有很多应用模式了,并占据了一定的市场.估计很多朋友现在也正在使用. 看过新浪的短连接服务,发现后面主要有6个字符串组成,于是第一个

短地址TinyURL的API使用

TinyURL的短地址服务超过10年了,很稳定,官方没有给出API连接,其实很简单: API: 调用:http://tinyurl.com/api-create.php?url=http://URL,  你可以发送一个request到这个地址, Response中只有一个字符串,就是你的短地址URL; php例子: /** * 获取短地址 * [@param](/user/param) $url 需要处理的长地址 * [@return](/user/return) string */ priva

Nodejs+mySql实现长地址转短地址

一.开发原因 之前公司用一些在线的转短地址网站,但出来的的地址输入没规则,输入太麻烦了,而且扫码还需要安装一个扫码的软件,在一个就是不能转换本地代理的地址(例:http://192.168.1.200:8080),心累.正好公司有个闲置的电脑做服务器,想着干嘛不搞个本地的转短地址工具,这样可以随意设置,想咋弄就咋弄. 注:这个插件没有部署到服务器上,只是在本地搭建了一个可运行环境,在局域网内可以随意访问.不过只要部署到服务器,再给个域名,就完全可以用,童鞋们可以自行补全. 二.开发环境 系统环境

discuz X3.1的门户文章实现伪静态,利于搜索引擎收录url的地址修改

最近在捣鼓DZ框架,这两天发现文章的收录情况并不是太理想,做了很多优化方面的工作,今天主要解决了DZ门户的文章链接伪静态化,在这次修改之前,也做过一次在网上找的静态化修改,之前做的方式是: 1.在DZ管理后台->全局->seo设置->url静态化模块中,开启如下配置 2.在nginx的配置文件中,添加url的rewrite规则如下图,添加完规则后,在门户首页和频道列表中显示的url规则是:http://xxx.com/article-aid-page.html;其中aid是文章id,pa