几年前,“打开App、阅读全文”堪称是大家上网时一个几乎无法逃脱的“毒瘤”,稍有不慎就会被强制跳转到应用商店下载App。以至于在2022年春季,工信部发文督促相关互联网企业整改、不得要求用户不下载App就不给看全文,并不得自动或强制下载应用。然而近日有网友爆料称,知乎网页端又开始出现了非登录用户无法查看全文的情况。

根据我们的实测,非登录用户如果点击“展开阅读全文”,知乎确实会自动弹出登录窗口。不过让人意外的的是,在WAP端以非登录状态查看知乎的网页仍可以完整查看内容。这也就意味着,知乎似乎没有走上当年一众资讯类App的老路,即完整内容只对登录用户开放、非登录用户只能看到片段。但就像目前一众头部电商网站的网页版必须完成验证才能使用完整功能一样, 背后其实都有商业方面的考量。

自进入大数据时代以来,用户数据的价值就陆续被充分挖掘,互联网厂商也发现通过分析用户的行为,进而可以总结出某一类用户群体的偏好,因此也就有了所谓的用户画像。而借助用户画像,互联网厂商可以知道每一位用户是什么的年龄、性别、购物偏好,由此数字广告行业也就有了完成精准投放的可能。

但用户画像的完善和更新都依赖用户登录,如果用户“退化”为访客,这一切就变成了空中楼阁,互联网厂商也就无法知道你的行为了。但广告无疑都是大量互联网厂商最重要的业务,所以为了自家的钱袋子,这些厂商当然就有强烈的动力去“督促”用户登录自己的账号。

为了给非登录用户“添堵”,长期以来知乎其实对于未登录用户都不那么友好,只要打开子页面就会一直使用弹窗要求用户登录。在有了弹窗唤醒用户登录的操作在前,进一步强制要求用户必须登录才能查看完整内容的也就不那么令人感到意外了。

更何况,与之前用户可以通过油猴脚本等方式屏蔽知乎的登录弹窗不同,这一次知乎做得“更绝”。打开F12查看网页的源代码就会发现,在没有登录的情况下,知乎压根就没有传输回答的完整数据。换而言之,就算通过技术手段屏蔽登录弹窗,用户也不能在非登录状态下查看完整的知乎回答。

那么知乎为什么要这样做呢?如果再结合近期知乎修改robots.txt文件,答案也就呼之欲出了。

robots.txt是一种存放于网站根目录下的ASCII编码的文本文件,是控制网站被搜索内容的一种策略,它的唯一作用就是告诉搜索引擎的user-agent(网络爬虫),网站中的哪些内容是不对搜索引擎开放、哪些内容又可以被爬取。

在这一次robots.txt的修改之后,知乎方面已经只允许百度和搜狗这两个搜索引擎抓取内容,此前的谷歌和Bing则被从名单上移除,这也就意味着用户在知乎发布的任何新内容都不会被谷歌和Bing收录。为何只有搜狗和百度例外,当然是两者与和知乎有着紧密的关系。根据知乎回港上市时披露的信息显示,搜狗背后的腾讯是知乎的大股东,百度也在2019年联合快手对知乎进行了4.5亿美元的战略投资。

先是不再向未登录用户传输完整的回答数据,再是修改robots.txt、屏蔽谷歌和Bing,知乎的这一套组合拳指向性其实已经非常明确,为的就是不让谷歌和Bing再继续爬取自己的内容。

事实上,目前内容平台向AI厂商卖数据已经成为常态,并且不同于网络巨魔频出的Reddit,作为问答社区的知乎在内容质量上是更有保障的。当初微软的New Bing搞AI搜索时,就把知乎的回答作为了重要的参考文献。

知乎创始人周源在一年前发布“知海图AI”中文大模型的时候就曾强调,知乎拥有中文互联网大量高质量内容,这正是其研发大语言模型的优势所在。到了2024知乎发现大会,周源更是表示,专业、真实的真人分享,认真、友善的人际交流,和透明、高效的信息机制,让知乎可以成为AI时代的可信赖社区。由此可见,知乎管理层对于平台内容在AI领域的价值是有清晰认知的。

既然如此,无论是强制登录、还是禁止搜索引擎抓取,都是知乎为了避免自家内容被某些AI厂商抓取、成为训练AI大模型的语料,所做出的防御性措施。既然百度和腾讯是知乎的股东、是重要的合作伙伴,向其开放数据就是应有之义,而在业务上没有联系的微软和谷歌,自然是不可能继续免费获取数据了。但如果将知乎的这一操作视为是向谷歌和微软询价,似乎也不是不可以。

只可惜在这一过程中,知乎方面似乎没有把用户体验当回事。

友情提示

本站部分转载文章,皆来自互联网,仅供参考及分享,并不用于任何商业用途;版权归原作者所有,如涉及作品内容、版权和其他问题,请与本网联系,我们将在第一时间删除内容!

联系邮箱:1042463605@qq.com