验证码居然有如此神奇作用

原创
2016/10/27 09:44
阅读数 39

提问

每天都有那么多人没日没夜的在上网、玩游戏,能不能把这些能量收集起来为人所用?

         能,不过不是机械能。这个问题让作者想起聪明的 Luis von Ahn 和他的 reCAPTCHA。作者觉得这个问题的问的很好,大多数人都把焦点集中在发电上了,题目主要是问这个过程中的能量能不能被利用,广义的能量作者想也可以包括人类的精力和智力,从这个侧面来说就是个众包(crowdsourcing)的问题。

        神人 Luis von Ahn 和 reCAPTCHA 很多人已经知道,Luis von Ahn 是 CMU 教授,2000 年左右和别人提出了 CAPTCHA,就是万恶的验证码。现在看来也许验证码是个显而易见的点子,但是从历史上看,它绝对是个判断正在输入的是人类还是机器的简单高效方法。再后来,这个教授就想了,每天这么多人都在识别输入一串字符,能不能利用它呢?于是后来他就又搞出了 reCAPTCHA。

        如果我们想电子化一些从前的文档,比如 19 世纪的纽约时报,我们要不得依靠人力,手动地一个一个字地输入到电脑,不然就直接扫描,然后再用软件识别。然而软件识别的准确率是不能保证的,尤其是扫描或者文档本身质量很差的时候,比如:

reCAPTCHA 做的,简单来说就是把上图的单词切割抽取出来,然后与一组自动生成的字符混合,生成验证码,发送到各各网站上,像这样:

reCAPTCHA 默认如果电脑产生的字符你输入正确,那么从文档中抽取的字符你的输入也将是正确的,然后通过交叉验证,重复验证,各种算法保证准确率。于是坐在电脑前上网的我们,每次输入验证码的时候,就可能顺便为某个图书馆的文档录入做出了贡献。

        一个经常被提到的实例就是,借助广大网民之手,纽约时报从 1851 年到现在的所有报纸,总共超过 1 千 3 百万篇文章都已经成功录入计算机。如果依靠手工输入,人力,资金,时间都将是巨大的,然而借助 reCAPTCHA, 以及每天上网的我们,这项工作在短时间内就已经完成了。

        2009 年 reCAPTCHA 被谷歌收购了,大家可能也都注意到了,谷歌更进一步利用验证码来帮助它们识别门牌号,路牌等等,用来修正谷歌地图的精度。这样谷歌地图的准确度,以及用户的体验都得到了提升。像这样:

 

       Luis von Ahn 真是很有想法的人,后来他又创办了很火的 Duolingo,帮助大家学外语。

 

 

展开阅读全文
打赏
0
0 收藏
分享
加载中
更多评论
打赏
0 评论
0 收藏
0
分享
返回顶部
顶部