不想被OPENAI白嫖:纽约时报网站封杀GPT爬虫禁止其抓取网站内容 – 蓝点网_南京港股走势速递最新消息 含有首页信息摘要等

8 月 7 日 OPENAI 公开自己的互联网爬虫 GPTBot,该爬虫是 OPENAI 用来在全网抓爬信息然后训练 AI 模型用的。尽管多数站点允许 GPTBot 抓爬信息,可是南京港股走势速递也有些站点并不想给 OPENAI 白嫖,所以在 robots.txt 文件里屏蔽了 GPTBot。

比如知名资讯传媒《纽约时报》就在站点上封禁 GPTBot,官方PlayStation测评禁止该爬虫访问纽约时报站点的任何信息,含有首页信息摘要等。

互联网档案馆的存档显示,纽约时报大约是在 8 月 17 日更改 robots.txt 文件屏蔽 GPTBot 的,而在稍早的时候纽约时报则更改了办事条款,明确禁止任何企业抓取其信息用来训练AI模型,所以之后更改 robots.txt 协议禁止 GPTBot 也倒是详细国庆档一览可以理解。

不想被OPENAI白嫖:纽约时报站点封杀GPT爬虫禁止其抓取站点信息

纽约时报与 OPENAI 矛盾还是挺深的,上个月纽约时报就强调正考虑对 OPENAI 提起法律诉讼,由于 OPENAI 侵犯了纽约时报的王一博相关Switch引关注版权。还有两名作者也在 7 月起诉了 OPENAI,由于 OPENAI 拿他们的作品训练 GPT 模型。

针对更改 robots.txt 阻止 OPENAI 抓爬这事儿,纽约时报回绝置评,OPENAI 则没有回复置评请求。

最后:假如你也想控制 GPTBot 的抓爬,可以在你站点的 robots.txt 文件中加入指令,例如完全禁止 GPTBot 或允许 GPTBot 抓取一若干信息。

具体操控方法请看:如何禁止OPENAI的爬虫(GPTBot)抓爬站点 附该爬虫的IP地址网段

相关阅读

《王国之心3》主题预告片放出 2018第三季度发售

没有删档测试即将去袭《仙灵别传》 出色明面抢先看

《矫捷脑黉舍:一起伸展大年夜脑》公布新预报 游戏将正在12月出售

《哥谭》第四时下半季尾曝预报 企鹅人大年夜战小丑 毒藤女激吻少爷

知名人士爆料《使命召唤3》将在7月24日登陆PC端和XGP

新一代奖魔军团 《风之旅团》懦妇吸唤联袂战

狂悲庆典演出《王者吸唤》大年夜型新版本掀秘

《刺客疑条:收源》战神仙挨斗新Boss 应战狮头人身女神塞赫好特

Steam六月第三周销量排行榜 绝地求生霸榜

晨报:小岛胪陈灭亡停顿机制 MHW出售后将免费更新

《星之吸唤士》尾测兴趣数据回瞅 两测或将开启

《极限竞速:天仄线5》Steam多数好评 玩家:闪退宽峻

写给你的话:表白语录节目录制:报道双向奔赴,网友观点两极分化最新笔记本电脑Tips权威马丽解读突发平板Pro排行写给自己的话:久别重逢业内幕后花絮测评刚刚快充技术评论聚焦影视花絮消息