2022年末上线的ChatGPT催生出庞大的AI智能体生态。如今,这类程序产生的网络流量,已经超过全球所有人类网民的总和。但AI智能体的行为和人类截然不同:它们不会观看广告、点击链接或是网购,只是抓取网络信息完成任务后便离去。
互联网最初的运转逻辑完全依托人类行为与使用意图,可如今绝大多数网络访问都来自机器,各大网站因此开始采取对抗措施。目前已有250万个网站封禁AI爬虫,Perplexity等平台也遭到相关诉讼。Cloudflare甚至搭建了“蜜罐陷阱”,让爬虫陷入由AI生成的无意义文本循环中,以此阻拦数据抓取行为。
但部分高阶AI智能体已经能够绕过这类防护。为此,业界开始着手打造一套更完善的真人身份验证体系。这套机制可以识别出操作者是否具备人类特征:操作时的迟疑、打字失误、光标细微的抖动,这些都是人类神经系统独有的表现。本文将解析这一趋势的成因、相关技术的研发方,以及我们面临的选择:是接受中心化生物识别监控,还是依托加密技术实现匿名真人证明?
背后的利益博弈
网站封禁AI智能体,本质是因为AI从两端同时冲击了互联网原有的商业模式。传统网络生态依靠用户注意力盈利:用户访问网页、浏览广告,网站运营方即可获得收益。
如今,AI智能体替人选购商品时,动辄检索数千个网站,远多于普通人浏览的四五个站点。它读取信息的速度远超人类眨眼的速度,几分钟内就能完成比价甚至下单,全程不会产生任何广告曝光量。网站承担着服务器成本,却得不到一分收益。
与此同时,AI摘要功能也在分流网站流量。谷歌在搜索结果顶部展示AI总结内容后,仅有8%的用户会点击进入原始网页,网站从谷歌获得的流量整体下滑33%。该功能上线仅一年,月活用户就突破10亿,查询量每季度翻倍增长。
知名学习平台Chegg便是典型受害者,其原本依靠作业答疑搜索流量立足,如今已彻底关停问答业务,并将原因归咎于ChatGPT。网站运营方陷入双重挤压:爬虫肆意抓取站内内容,AI摘要又在用户访问前截留流量。
数据抓取比例更是触目惊心:OpenAI每为网站引流1次,其爬虫会先抓取400个页面;Anthropic的比例更是达到38000:1。这些企业免费利用全网数据训练模型,随后又用模型分流原本属于原网站的流量。
在其他行业,如此夸张的“掠夺式抓取”早已引来诉讼;但在AI领域,这类企业却收获了万亿美元级的估值。
身体:新一代身份密码
过去25年里,互联网主要依靠验证码(CAPTCHA)区分人机:识别交通信号灯、辨认扭曲字符。这套体系之所以有效,是因为早年机器的视觉识别能力远不及人类。
如今局面彻底改变。OpenAI的智能工具突破了谷歌人机验证系统,点击位置精准无误,还能自动复制粘贴表单内容;AI生成的仿自拍照片可骗过身份核验,深度伪造视频通话甚至被用于完成真实的银行转账。传统验证手段的设计前提——“机器能力弱于人类”,已经不复存在。
业界转而聚焦AI难以复刻的领域:人类操作电子设备时的肢体行为,也就是行为生物识别技术。IBM、BioCatch等企业打造的系统,可全程监测用户行为,不止限于登录环节。
监测维度十分丰富:光标移动速度、页面滑动习惯、打字节奏、按键力度、删改文字的行为,手机端还会借助陀螺仪捕捉握持角度、拇指滑动轨迹等细节。IBM只需采集8次使用记录,就能建立专属行为档案,后续每一步操作都会实时与基准数据比对。
BioCatch的系统还能识别网络诈骗:当受害者按照诈骗分子的口述输入账号时,断断续续的打字特征会被系统捕捉。该平台一年内已协助257家银行标记出约200万个洗钱账户。欧盟也开始在边境试点步态识别技术。AI智能体时代才开启三年,人类的行走姿态就已成为监管识别的依据。
研究人员还结合斯特鲁普效应优化识别逻辑:当绿色字体写出“蓝色”这个单词时,人类大脑会因文字含义和视觉颜色冲突,出现明显的反应延迟,而AI的响应速度不会受此影响。研究发现,这种认知差异会体现在打字行为上。系统无需额外弹窗测试,仅凭击键特征,就能判断操作者是不是真人。
以往的网络追踪,只会记录你的浏览、点击、消费行为,用户可以通过屏蔽Cookie、使用VPN、关闭定位来规避。但行为生物识别直接读取你的肢体特征:光标移动习惯、打字节奏都是与生俱来、无法刻意模仿的,每个人的行为档案都像指纹一样独一无二,而且不像密码可以随时更换。
一旦这类技术普及,各大平台会被迫纷纷跟进。目前语音模拟技术已能在通话中以假乱真,视频伪造也紧随其后。当行为生物识别成为主流,最核心的问题浮出水面:谁来掌控这些人体生物数据?
两大技术路线:谁掌握真人验证权?
目前业界分化为两大阵营,分别探索真人身份验证方案。
路线一:中心化生物识别——World(原Worldcoin)
该方案需要用户走到名为“光球”的专用设备前完成虹膜扫描,设备会生成一份加密凭证,证明你是独一无二的自然人。目前全球160个国家、超1800万人完成了认证。2026年4月,World与探探、Zoom、DocuSign达成合作,为其用户提供身份核验服务;同时联合Coinbase推出AgentKit工具,用户可将名下AI智能体与真人身份绑定,平台既能确认智能体背后是真实人类,又不会泄露个人隐私。
但虹膜扫描也遭到多国抵制,民众担忧生物数据被滥用。《麻省理工科技评论》的调查显示,该设备除扫描虹膜外,还会在未获得有效授权的情况下,采集心率、呼吸等多项生命体征数据。
路线二:加密零知识证明(ZK-Proof)
这一理念由维塔利克・布特林在2023年提出:用户无需泄露姓名、地理位置、面部信息,就能通过加密技术证明自己是真人。他认为,如果去中心化的真人验证体系无法落地,互联网终将被中心化身份体系主导。若加密行业不研发相关工具,政府与企业就会接管这项工作,监控也会随之嵌入网络底层。
不过去中心化真人验证模式的大规模落地尝试,此前已宣告失败。Idena区块链曾主打“一人一身份”理念,但上线两年内,仅23个主体就掌控了全网40%的账号与48%的奖励。印尼、俄罗斯等地出现身份收购产业链,组织者以不足每小时1美元的报酬收购普通人的认证身份,获利最高可达成本的55倍。甚至还出现盗用儿童照片注册账号的乱象。
维塔利克早已预判到这类风险:“真人验证体系最大的威胁,并非深度伪造或高级黑客攻击,而是花钱雇佣低收入地区的人出借身份。”
问题的根源在于激励机制:无论是虹膜扫描设备,还是区块链验证网络,都需要资金维持运转。一旦身份与经济价值挂钩,身份租借市场便会应运而生。在贫富差距悬殊的当下,资本总会掌控这类市场。他也曾直言:“在存在实际经济利益的体系中强行推行一人一票,最终都会重蹈过往失败实验的覆辙。”
两条路的困境与未来
两条技术路线各有缺陷:中心化方案可以规模化落地,但用户的生物数据会交由企业保管,而这类企业本身就存在过度采集数据的问题;加密路线理论上能保护隐私,却难以摆脱现实中的经济失衡问题,容易被资本钻空子。
即便如此,我依然更看好加密方案。行为生物识别、中心化虹膜扫描会永久留存你的身体特征数据,数据一旦被企业获取,既无法删除,也不能迁移。
而零知识证明技术,只验证“你是真人”,不泄露任何额外信息。即便这套体系仍会被人钻漏洞,也值得继续研发。否则未来的互联网,每一个网站都会留存你的肢体行为数据。如今,偏向监控的中心化方案,落地速度已经远超加密方案。
