许多主要新闻媒体正屏蔽 OpenAI 爬虫-IT资讯网

许多主要新闻媒体正屏蔽 OpenAI 爬虫

时间：2025-11-26 23:30:34 来源：IT资讯网

自OpenAI的许多内容生成式人工智能模型面世以来，大量互联网数据成为了不断训练和优化模型的主新“饵料”，但据路透社研究所的闻媒一项调查，有越来越多的体正新闻媒体已对OpenAI的数据爬取说“不”，在传统媒体领域，屏蔽爬虫这一比例甚至超过了50% 。许多

路透社研究所分析了《纽约时报》、模板下载主新《华尔街日报》、闻媒《华盛顿邮报》、体正CNN、屏蔽爬虫NPR 等多家主流新闻媒体，许多涵盖美国、主新英国、闻媒德国、体正印度等10个国家，屏蔽爬虫并将其归为传统印刷媒体（纸媒）、广播电视媒体、数字媒体三大类。高防服务器研究发现，57%的传统印刷媒体屏蔽了OpenAI 的爬虫程序，广播电视媒体和数字媒体的比例分别为48%和 31%。

研究还发现，屏蔽 OpenAI 的新闻网站比例因国家和地区差异而存在很大不同，在美国，这一比例高达79%，源码下载而在墨西哥和波兰仅为 20%。

所研究调查的10个国家新闻媒体对 OpenAI爬虫采取屏蔽措施的比例差异

此外，在屏蔽了OpenAI 爬虫的新闻媒体中，有97%也同样屏蔽了谷歌人工智能的爬虫。

研究揭示了一些新闻媒体不希望他们的内容被人工智能使用，如果人们使用人工智能从网络上获取新闻，免费模板这些媒体会认为自己将被抛弃或取代。Gartner 副总裁、杰出分析师安德鲁·弗兰克 (Andrew Frank) 表示：“路透社的研究强调了生成式人工智能面临的一个根本挑战：它依赖于真实的人生成的真实内容，而这些人将其视为对他们生计的威胁。”

与此同时，康奈尔大学最近的源码库一项研究发现，当新的人工智能模型根据先前模型而不是人类输入的数据进行训练时，它们往往会趋向于“模型崩溃”或退化，导致越来越多地生成错误信息。

OpenAI 于去年 8 月初推出了人工智能爬虫，谷歌也于 9 月紧随其后。根据这项研究，一旦这些媒体做出屏蔽决定，服务器租用恐将很难改变立场对其进行解除。

黑客事件频发如何保护好自己的钱包和NFT资产？

网络安全售前人员必备的五种基础能力

元数据管理在态势感知系统的应用

2024年需要重点关注的15种计算机病毒

CDK Global 遭遇攻击导致系统中断，影响数千家美国汽车经销商

调查表明网络安全对生成式人工智能毫无准备

揭示网络安全运营中的隐藏挑战

恶意代码识别率提升95%！谷歌开源人工智能网络安全防御工具

哨声吹响，与世界杯相关的欺诈也在激增

由xml加密文件引起的渗透

上一篇：大语言模型漏洞缓解指南
下一篇：使用Python进行对称和非对称密钥加密和解密