6月26日,科技媒体报道《纽约时报》更新对OpenAI及微软的诉状,指控微软为OpenAI定制“超算”系统,未经许可爬取并选择包含《纽约时报》在内的受版权保护作品以训练大语言模型。诉状称该系统不仅提供算力,还参与数据选择与获取,令《纽约时报》内容在训练中被赋予更高权重,导致GPT输出与原文高度重合并能在一定情况下绕过付费墙。此更新将部分指控从单指向OpenAI扩展至微软,强调版权侵权与订阅价值受损。
6 月 27 日消息,科技媒体 Ars Technica 昨日(6 月 26 日)发布博文,报道称《纽约时报》更新诉状,指控微软为 OpenAI 定制超算系统,在未经其许可情况下,爬取受版权保护作品训练 AI 大语言模型。

IT之家援引博文介绍,本次诉讼可以追溯到 2023 年 12 月,让《纽约时报》成为全球首家起诉生成式 AI 公司的大型出版机构。
《纽约时报》在 2023 年的核心指控主要针对 OpenAI 公司,指其训练 ChatGPT 过程中,非法使用《纽约时报》文章,并在输出中复现其受版权保护内容,从而削弱付费订阅价值。
而在最新更新的诉状中,《纽约时报》把矛头调整指向微软公司,指控微软为 OpenAI 量身定制超算系统,专门用于爬取包括《纽约时报》在内的网络资源,用于帮助 OpenAI 训练相关模型。
按照诉状说法,微软设计的这台“异常复杂”的机器,不只提供算力,还参与了选择与获取被侵权作品。《纽约时报》称,该系统使用“几乎整个互联网”训练模型,同时经过筛选,让《纽约时报》作品获得更高权重。

诉状称 GPT 输出内容和《纽约时报》内容高度重合
诉讼披露材料显示,部分用户要求 ChatGPT 帮助绕过付费墙,例如不断索取“下一段”内容;还有一些情况下,模型会直接输出多段接近原文的文字。

ChatGPT 可以绕过付费墙获取相关内容