我放弃登录
这些仿佛是在搞笑的验证码经常让网友们做到怀疑人生:我是谁?我在哪儿?我为啥要填验证码?
这些测试被称为 CAPTCHA,“Completely Automated Public Turing test to tell Computers and Humans Apart”的缩写,意为“区分计算机和人类的完全自动公共图灵测试”,这个名词看起来极其科幻又神秘,但通俗的说法就是“验证码”。
它的诞生可以追溯到上世纪末,当时黑客非常猖狂,他们创造了一种能够大量重复编写信息的程序,伪装成人类用户,肆无忌惮地朝网络上倾倒 “僵尸”信息,垃圾邮件、垃圾广告、垃圾评论泛滥成灾。还有程序机器人恶意破解密码、恶意刷票,严重损害商家和消费者的利益。
电子邮件提供商 Yahoo(雅虎)公司为了解决垃圾邮件的问题,找到了卡内基梅陇大学的学生路易斯·冯·安。2002 年,路易斯·冯·安的 CAPTCHA 验证码应运而生,赢得了众多网民的鲜花与掌声。2009 年,谷歌收购 CAPTCHA,将它应用在谷歌图书的数字化上。
验证码的发明者路易斯·冯·安
但是随着技术的发展,机器迎头赶上,CAPTCHA 面临新的问题。2014 年,谷歌让一种机器学习算法与人类进行了对抗,双方需要辨识一套极度失真的文本 CAPTCHA。结果是,计算机完成了99.8% 的测试,而人类仅完成了33%。这就很尴尬了,机器人没被排查出去,真实用户倒是被拦截得死死的。
随后,谷歌对此进行了改进,升级版就是现在我们常见到的 reCAPTCHA。它的运行方式是什么样的呢?
首先网页中会显示出一个勾选的方框和一句 “I’m not a robot(我不是机器人)”的字符。用户点击方框确认后,谷歌会用“风险分析引擎” 对该用户进行无缝分析。
如果检测结果正常,则该用户可以顺利进入网站或账户。但如果检测结果异常,比如使用了 VPN 的用户就容易被认作是 “恶意机器人” ,该用户便会经历一个识别验证的过程,即按照要求在图像网格中选出目标物体。这个过程对于机器人来说,还是比较困难的。