文档章节

微博短链接的生成算法(Java版本)

java-苦苦甜甜
 java-苦苦甜甜
发布于 2012/11/22 17:41
字数 879
阅读 528
收藏 17

微博短链接的生成算法(Java 版本)

最近看到微博的短链接真是很火啊,新浪、腾讯、搜狐等微博网站都加入了短链接的功能。之所以要是使用短链接,主要是因为微博只允许发140 字,如果链接地址太长的话,那么发送的字数将大大减少。短链接的主要职责就是把原始链接很长的地址压缩成只有6 个字母的短链接地址,当我们点击这6 个字母的链接后,我们又可以跳转到原始链接地址。

开始以为短链接是按照某种算法把原始链接压缩为短链接,再根据算法从短链接反算成原始链接的。后来尝试了下压缩算法(gzip 压缩算法),发现对于url 这种字符串越是压缩,长度就越长。通过对压缩算法的一些了解,发现靠压缩算法来实现这个功能不太靠谱。

后来在网上找到一个生成算法,该算法主要使用MD5 算法对原始链接进行加密(这里使用的MD5 加密后的字符串长度为32 位),然后对加密后的字符串进行处理以得到短链接的地址。原始的算法是C# 版本的,这里我把该算法修改成Java 版本的. 算法的具体代码如下,代码中有注释:

一、  代码

package com.csdn.shorturl;

public class ShortUrlGenerator {

 

    /**

      * @param args

      */

    public static void main(String[] args) {

       // 长连接: http://tech.sina.com.cn/i/2011-03-23/11285321288.shtml

       // 新浪解析后的短链接为: http://t.cn/h1jGSC

       String sLongUrl = "http://tech.sina.com.cn/i/2011-03-23/11285321288.shtml" ; // 3BD768E58042156E54626860E241E999

       String[] aResult = shortUrl (sLongUrl);

       // 打印出结果

       for ( int i = 0; i < aResult. length ; i++) {

           System. out .println( "[" + i + "]:::" + aResult[i]);

       }

    }

 

    public static String[] shortUrl(String url) {

       // 可以自定义生成 MD5 加密字符传前的混合 KEY

       String key = "wuguowei" ;

       // 要使用生成 URL 的字符

       String[] chars = new String[] { "a" , "b" , "c" , "d" , "e" , "f" , "g" , "h" ,

              "i" , "j" , "k" , "l" , "m" , "n" , "o" , "p" , "q" , "r" , "s" , "t" ,

              "u" , "v" , "w" , "x" , "y" , "z" , "0" , "1" , "2" , "3" , "4" , "5" ,

              "6" , "7" , "8" , "9" , "A" , "B" , "C" , "D" , "E" , "F" , "G" , "H" ,

              "I" , "J" , "K" , "L" , "M" , "N" , "O" , "P" , "Q" , "R" , "S" , "T" ,

              "U" , "V" , "W" , "X" , "Y" , "Z"

 

       };

       // 对传入网址进行 MD5 加密

       String sMD5EncryptResult = ( new CMyEncrypt()).getMD5OfStr(key + url);

       String hex = sMD5EncryptResult;

 

       String[] resUrl = new String[4];

       for ( int i = 0; i < 4; i++) {

 

           // 把加密字符按照 8 位一组 16 进制与 0x3FFFFFFF 进行位与运算

           String sTempSubString = hex.substring(i * 8, i * 8 + 8);

 

           // 这里需要使用 long 型来转换,因为 Inteper .parseInt() 只能处理 31 , 首位为符号位 , 如果不用 long ,则会越界

           long lHexLong = 0x3FFFFFFF & Long.parseLong (sTempSubString, 16);

           String outChars = "" ;

           for ( int j = 0; j < 6; j++) {

              // 把得到的值与 0x0000003D 进行位与运算,取得字符数组 chars 索引

              long index = 0x0000003D & lHexLong;

              // 把取得的字符相加

              outChars += chars[( int ) index];

              // 每次循环按位右移 5

              lHexLong = lHexLong >> 5;

           }

           // 把字符串存入对应索引的输出数组

           resUrl[i] = outChars;

       }

       return resUrl;

    }

}

 

 

二、  输出结果

执行上面代码的结果如下,会产生46 位字符串,任意一组都可以作为当前字符串的短链接地址。

[0]:::7nUFJn

[1]:::f6Zzy2

[2]:::j6jmQb

[3]:::2eAjea

 

三、  跳转原理

当我们生成短链接之后,只需要在表中(数据库或者NoSql )存储原始链接与短链接的映射关系即可。当我们访问短链接时,只需要从映射关系中找到原始链接,即可跳转到原始链接。

本文转载自:http://blog.163.com/linfeng_0212/blog/static/622213820115281026047/

java-苦苦甜甜
粉丝 19
博文 157
码字总数 15880
作品 0
厦门
私信 提问
加载中

评论(3)

苗哥
苗哥

引用来自“冯泽锋”的评论

CMyEncrypt 这个类在哪呢?

这篇文章的原文链接其实是在这里:http://blog.csdn.net/wgw335363240/article/details/6568794,我今天刚好看到了,然后把那個 MD5 加密算法给添加进去了,整合了壹個可以运行的版本在这里:http://www.oschina.net/code/snippet_136226_25713
井底的蜗牛
井底的蜗牛
CMyEncrypt 这个类在哪呢?
丁小迪
丁小迪
思路就是字典的方式么~学习了
URL短地址压缩算法 微博短地址原理解析 (Java实现)

最近,项目中需要用到短网址(ShortUrl)的算法,于是在网上搜索一番,发现有C#的算法,有.Net的算法,有PHP的算法,就是没有找到Java版的短网址(ShortUrl)的算法,很是郁闷。同时还发现有...

神勇小白鼠
2014/07/29
794
0
微博URL短网址生成算法原理及(java版、php版实现实例)

短网址(Short URL),顾名思义就是在形式上比较短的网址。通常用的是asp或者php转向,在Web 2.0的今天,不得不说,这是一个潮流。目前已经有许多类似服务,借助短网址您可以用简短的网址替代...

小老傅
2014/08/20
3.9K
5
收藏的技术博客链接(不断更新)

这里收藏了一些不错的的技术博客和文章的链接,供平时学习和参考,经常看看还是很有收获的。链接列表会不定时更新,列在这里就当是书的目录了。 (1)技术文章系列: 前端技术:http://www....

isam
2014/10/28
280
0
Oracle的JDBC驱动的版本你了解吗?

classes12.jar,ojdbc14.jar,ojdbc5.jar和ojdbc6.jar的区别,之间的差异 在使用Oracle JDBC驱动时,有些问题你是不是通过替换不同版本的Oracle JDBC驱动来解决的?最常使用的ojdbc14.jar有多...

i33
2012/02/20
334
0
Scala和Java在多核处理性能的一次对比和思考

今天在网络上看到了一篇关于Scala和java多线程对比的文章《Simple Scala actor Vs java Thread Vs Kilim Test,原文链接:http://www.blogjava.net/BlueDavy/archive/2009/11/25/303662.html......

qinhui99
2012/05/13
1K
3

没有更多内容

加载失败,请刷新页面

加载更多

最简单的获取相机拍照的图片

  import android.content.Intent;import android.graphics.Bitmap;import android.os.Bundle;import android.os.Environment;import android.provider.MediaStore;import andr......

MrLins
今天
5
0
说好不哭!数据可视化深度干货,前端开发下一个涨薪点在这里~

随着互联网在各行各业的影响不断深入,数据规模越来越大,各企业也越来越重视数据的价值。作为一家专业的数据智能公司,个推从消息推送服务起家,经过多年的持续耕耘,积累沉淀了海量数据,在...

个推
今天
8
0
第三方支付-返回与回调注意事项

不管是支付宝,微信,还是其它第三方支付,第四方支付,支付机构服务商只要涉及到钱的交易都要进行如下校验,全部成功了才视为成功订单 1.http请求是否成功 2.校验商户号 3.校验订单号及状态...

Shingfi
今天
4
0
简述Java内存分配和回收策略以及Minor GC 和 Major GC(Full GC)

内存分配: 1. 栈区:栈可分为Java虚拟机和本地方法栈 2. 堆区:堆被所有线程共享,在虚拟机启动时创建,是唯一的目的是存放对象实例,是gc的主要区域。通常可分为两个区块年轻代和年老代。更...

DustinChan
今天
6
0
Excel插入批注:可在批注插入文字、形状、图片

1.批注一直显示:审阅选项卡-------->勾选显示批注选项: 2.插入批注快捷键:Shift+F2 组合键 3.在批注中插入图片:鼠标右键点击批注框的小圆点【重点不可以在批注文本框内点击】----->调出批...

东方墨天
今天
6
1

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部