互联网产品从免费转为付费,对于任何一家厂商而言无疑都是一次大考,稍有不慎就可能会口碑下降、用户流失。所以如何以更怀柔的方式让用户付钱绝对是一门学问,毕竟习惯了免费后突然又要从荷包里掏钱,几乎必然会沸反盈天。然而日前谷歌方面突然宣布reCAPTCHA将于2024年4月1日做调整的消息,却让不少网友直呼喜大普奔。
根据谷歌方面向网站站长发送的邮件显示,reCAPTCHA企业版/免费版的免费验证额度将从每月100万次缩减至1万次,同时将r其免费版本改名为reCAPTCHA- Lite。谷歌会对超过1万次的部分进行收费,每增加1000次调用就需支付1美元,并推出了新的reCAPTCHA标准版本订阅服务,每月8美元即可调用最多10万次reCAPTCHA。
有的朋友可能不清楚reCAPTCHA究竟是什么。其实它就是大家上网时,可能会在不同网站看到“请证明你不是机器人”的验证码,正就是它会让你必须在九宫格里准确选到红绿灯、路牌、自行车、消防栓等目标。因此与验证码斗智斗勇,向网站验证自己并不是机器人,几乎是每一位网民上网的“日常任务”。
甚至在全球知名CDN服务商Cloudflare发布的报告中就显示,“人类每天花大约500年的时间来解决验证码——荒度时间并制造挫败感。”
此次谷歌将reCAPTCHA的免费额度降低99%,每月仅1万次验证的免费限额,可以说只要稍有规模的网站都能轻轻松松突破。显而易见,收费会导致使用reCAPTCHA服务的网站大幅度减少,未来网民遇到各种奇形怪状验证码的概率自然也就会下降,所以喜迎谷歌收费还真不是开玩笑。
不过大家遇到谷歌reCAPTCHA的可能性降低,并不代表图片验证码这一体系就会彻底消失。
验证码这一技术为何会被提出,盖因互联网世界垃圾信息泛滥,各种自动化工具无时无刻不在攻击互联网厂商、个人站长,乃至普通用户的数据资产。而验证码的核心理论就是区分正常人与机器,所提出的问题要容易被人解答、并让机器无法解答。然而验证码作为一个反向的“图灵测试”,如果机器解读验证码能力的提升,也是人工智能取得技术进步的一种体现。
海量网友每天辨识验证码上的内容,本质上是数据标注的一种。本世纪初,卡内基梅隆大学的Luis von Ahn有感于雅虎邮箱垃圾邮件泛滥的现状,曾提出了一种假设,“如果人类与机器各有擅长,能不能利用验证码系统,让人类和机器共同处理问题呢?”因此他在2007年参与创立reCAPTCHA,并在2012年将此公司卖给了谷歌。
“选出下图中的xxx”这类验证码,虽然表面上是让用户标出特定目标,但背地里是却借助用户积累的数据来训练自己的AI模型。有了超大数量级的数据标注,谷歌的无人驾驶自然进步飞速。其实谷歌对这件事情也承认的很痛快,其曾在reCAPTCHA官网公开表示就是要用网友的力量标注数据,进而为深度学习技术提供燃料。
不得不说,让网友用验证码来做数据标注是一个相当天才的解决方案。由于黑客希望攻破验证码系统来实现批量化的推送垃圾广告、打造机器人水军获利,而互联网厂商则有保护账号体系安全和稳定的需求,双方的攻防也成为了互联网世界亘古长存的现象。但黑产毕竟是一个典型讲求成本收益的“生意”,只要收益不能覆盖成本自然就会知难而退,所以验证码的出现就是抬高了黑产使用互联网厂商正常服务的门槛。
随着AI大模型、乃至AI Agent的发展,区分人类与机器的需求不仅没有减少,反而还在持续不断的增加。因为互联网厂商、个人站长设计的服务是要提供给能挖掘变现潜力的人类用户、而不是机器人,毕竟人类用户有从免费到付费的转化空间,但没有财产权的人工智能显然无法让厂商赚到钱。要不然马斯克当初收购Twitter时,为啥一直以机器人账户泛滥为由,要求与Twitter重新商讨收购价格。
在某种意义上,验证码其实与杀毒软件、防火墙是同一类产品。看看目前卡巴斯基等厂商的现状就知道,单纯做杀毒软件几乎是没有未来的。与此同时,数据标注又是产生可供AI训练语料资源的前置步骤,例如ChatGPT就是靠着2美元时薪的肯尼亚外包数据清洗人员,完成了史无前例的1750亿参数量、45TB的训练数据。但数据标注与流水线上工人“打螺丝”的工作并没有区别,对着电脑屏幕根据给定的规则给数据打上各式各样的标注,可完全可以称为“赛博搬砖”。
从客观上来说,数据标注本身还是很费钱的,0.2块钱/条是过去两年均价,别看单价没多少,可架不住数量大,AI厂商对于被清洗过数据集的需求往往都是以亿为单位。这时候,reCAPTCHA的出现就从另一方面代表着谷歌可以免费使用全球用户的力量,来实现聚沙成塔的效果,其他大厂推出的相关验证码服务实际上也是这个道理。
reCAPTCHA想要将使用者当成免费的数据标注工,免费提供给网站使用显然才是正道,但谷歌方面为什么又要收费呢?这是因为数据标注在AI业务中是一个标准的“中间件”,它并不能直接产生价值,而目前全球科学技术企业几乎都在追求降本增效。所以reCAPTCHA就成为了立竿见影的“增效”手段,毕竟没了验证码拦截机器人,网站基本就等于是在“裸奔”。
因此有观点就认为,reCAPTCHA突然转向收费,这其实是谷歌向长期资金市场低头、追求更好看的财务表现,而放弃长期主义的一种表现。