[无限牛逼]验证码本来还有那个感化(转载)

21小时前 (04:51:50)阅读1回复0
海上森林一只猫
海上森林一只猫
  • 管理员
  • 注册排名5
  • 经验值78865
  • 级别管理员
  • 主题15773
  • 回复0
楼主

老网民们可能都记得,刚起头上彀的时候,是不存在验证码(capcha)那么一种工具的。那形成的成果是,垃圾评论和垃圾邮件能够轻松通过任何一个网站的注册法式,通过各类体例轰炸人民群寡的眼球。

   更先想要处理那一问题的是雅虎——做为互联网时代早期最重要的免费邮件供给商,他们一方面要处理用户们天天碰着的数以百计的垃圾邮件轰炸,另一方面,他们本身的免费邮箱,恰好又是垃圾邮件的更爱——消耗无数资本所阻遏的垃圾邮件,都来自于本身的办事器。那让雅虎起头认实考虑若何处理人机辨识问题。

   他们找到一位其时刚刚21岁的天才——Luis von Ahn。 而Luis Von Ahn给出的计划,就是那个让人民群寡微微皱眉,但是让计算机耸肩挠头的验证码。计算机辨识手艺还很落后,关于颠末扭曲、污染的文字,无法辨识。而人类却能够轻松认出那些文字。那是一个简单而巧妙的设想,计算机先是产生一个随机的字符串,然后用法式把那个字符串的图像停止随机的污染,扭曲,再展现给展现器前的人或者机器。但凡可以辨识那些字符的,即为人类。

   故事还没完,Luis Von Ahn是那种逃求完美的科学家。当全世界数以十亿计的人天天城市浪费几秒钟的时间参与辨认文字那一简单活动的时候,他起头根究,此中浪费的人脑智力能否能得到更好的利用呢?Luis Von Ahn的最末设想是,让人们用那些脑力处理一些计算机无法处理的“图书数字化”。

   在计算机时代以前,印刷术已经存在了数百年,但那些印刷术所产生的书本和报纸等等,关于计算机来说都是模仿信号,仅以图像的形式存在,而非以数字化的形式存在。但是,早期的印刷术其实不切确,文字大小纷歧,形象有区别。并且因为印刷品年代长远,拥有各类细微的缺损和污染。那对人眼来说不是什么大问题,但对计算机来说就费事了。

   因而,2002年,luis Von Ahn起头让capcha引用各类无法被计算机辨识的文字图像,目前,已经有上万网站摘用他的新一代capcha。天天搀扶帮助辨识数以百万计的古老文档。问题在于,关于最后的capcha来说,计算机现实上是晓得谜底的。而Luis期看人们辨识的文字,计算机现实上是不晓得谜底的,那若何能验证返回的谜底到底是不是实的呢?

   处理那个问题的办法照旧表现了Luis一贯的简洁和斑斓,他让人们每次辨识两个,而非一个验证码,此中一个来自于计算机随机生成的字符串,而另一个则是从文档中拔取的计算机不熟悉的字符图像。只要人们对前一个字符串给出的谜底是准确的,那么就断定,人们对后一个验证码的辨识是准确的。

   用那一办法,luis的capcha2.0 已经搀扶帮助完成了整个纽约时报130年的报纸存档数字化——那一本可能破费无数时间和资本的工程,在几个月之内就由列位网友们完成了。

  源地址:

0
回帖

[无限牛逼]验证码本来还有那个感化(转载) 期待您的回复!

取消
载入表情清单……
载入颜色清单……
插入网络图片

取消确定

图片上传中
编辑器信息
提示信息