CAPTCHA的新用途:书籍数字化
今天在solidot上看到下面这篇文章,突然想到很多国外网站都是用CAPTCHA来做验证输入,其中有名facebook就是了用它如图:
利用CAPTCHAs ( 全自动区分计算机和人类的图灵测试 )技术不仅可以反spam,而且可以用来进行书籍的数字化。发表在Science Express上的一个报告,利用人脑在解码 CAPTCHAs 时所花的努力来译解来自书本的、由计算机化的光学字符识别软件所无法识别的被扫描的词来帮助将老旧的印刷品数码化。这被称作reCAPTCHA。 reCAPTCHA程序展现给使用者一个无法用光学扫描阅读的词及一个“对照的”答案已知的 CAPTCHA 词。如果能够正确解读对照词表明使用者是人,这时该程序会纪录使用者对无法阅读的词的回答并将其添加到它的数据库中。这一程序可以以字词超过 99% 的精确度来转录文本,这相当于专业化的人类誊写员所达到的标准。”
来自:http://internet.solidot.org/internet/08/09/10/0228217.shtml
