• 我的订阅
  • 科技

史蒂芬·金、扎迪·史密斯等人作品被用于训练人工智能

类别:科技 发布时间:2023-08-24 16:25:00 来源:新京报

据介绍,扎迪·史密斯、史蒂芬·金等人的小说被纳入一个叫Book3的人工智能工具数据集,用于训练Meta旗下的大型语言模型LLaMA——这类语言模型中最著名的就是今年年初极受关注的OpenAI公司旗下ChatGPT。此外,该数据集还被彭博公司用于训练他们的模型BloombergGPT。

英国《卫报》的报道表示,Book3中包含的图书数据大约三分之一是小说,三分之二是非虚构作品,这些作品基本是过去二十年中出版的。除了以上已经列出的作品外,费兰特、阿特伍德、村上春树、乔纳森·弗兰岑等人的多部作品也包括其中。而已经输入到Meta等公司的语言模型中用于训练的数据也已包括了超过170000本书。

用于训练的图书覆盖的出版商十分广泛,包括企鹅兰登书屋(30000多本)、哈珀·柯林斯出版(14000本)、麦克米伦(7000本)、牛津大学出版社(1800本)等。未来计划纳入的作品可能还包括约翰·麦克阿瑟(John MacArthur)、丽贝卡·索尔尼特 (Rebecca Solnit)等人。

史蒂芬·金、扎迪·史密斯等人作品被用于训练人工智能

史蒂芬·金。图源英国《卫报》。

用于“喂养”这些模型的数据常来自开放网络,其中也包括Library Genesis、Zlibrary等影子图书馆,其中包含的大量图书资源成为大公司眼中绝佳的分析材料。2020年发布的一篇论文显示,OpenAI训练语言模型的数据来源中,有一个名为Book2的包含30万本图书的数据库。今年6月的一份诉讼案中提到,Book2的数据很可能就源自影子图书馆,而这些被纳入数据库的作品常常受到版权的保护。

ChatGPT等大型语言模型对作家版权的侵犯已经是一个被争论了许久的问题。今年7月,莎拉·西尔弗曼 (Sarah Silverman)、理查德·卡德雷 (Richard Kadrey)和克里斯托弗·戈尔登 (Christopher Golden)三位作家就针对Meta的LLaMA提起诉讼,表示自己受版权保护的作品被Book3利用。

此前,作家莫娜·阿瓦德(Mona Awad)和保罗·特伦布莱(Paul Tremblay)也针对OpenAI提起诉讼,声称公司未经作者许可将他们的小说用于训练语言模型,侵犯了作者版权。两人的律师表示,对于大公司的语言模型来说,系统化的书籍是用于训练的最好选择,因为相较于自由散乱的网络在线数据,它们经过了高质量的编辑。当时的诉状称,OpenAI等公司从窃取来的原创想法中“不公平地获利”,理应向作者赔偿。然而,英国《卫报》的报道显示,两位作者很难证明自己因小说被用于语言模型训练而蒙受经济损失。

最初创建 Books3 的独立人工智能开发人员肖恩·普雷瑟(Shawn Presser)在接受采访时表示,他理解作者们的担忧,但他创建这个数据集的目的恰恰是为了让任何人都可以开发生成式人工智能工具,避免大公司垄断技术的风险。Meta的发言人拒绝了就使用Book3发表评论。

人工智能对内容行业的冲击可能在未来很长一段时间里都是值得忧虑的课题。《洛杉矶时报》今年5月的一篇报道就梳理了ChatGPT等语言模型可能对文学、艺术创作者带来的多方面影响。文中提到,相较于职业的媒体工作者、专业作家等,缺乏工会保护的自由职业者、独立艺术家更需要受到关注,因为他们面对人工智能不经同意就利用其作品用于增强自身的行为几乎毫无反抗能力。

在侵权争议之外,人工智能还正在深度参与内容行业的审查工作。据《滚石》等杂志报道,美国已有学校的图书馆开始利用ChatGPT辅助图书中敏感内容的审查。ChatGPT判定出《追风筝的人》《使女的故事》等畅销书包含对性行为的“描述”并建议其下架。然而,后续的多次验证也说明这种判定有其不稳定性。

参考链接:

1. Zadie Smith, Stephen King and Rachel Cusk’s pirated works used to train AI

https://www.theguardian.com/books/2023/aug/22/zadie-smith-stephen-king-and-rachel-cusks-pirated-works-used-to-train-ai

2. This article is more than 1 month oldAuthors file a lawsuit against OpenAI for unlawfully ‘ingesting’ their books

https://www.theguardian.com/books/2023/jul/05/authors-file-a-lawsuit-against-openai-for-unlawfully-ingesting-their-books

3. Column: Your boss wants AI to replace you. The writers’ strike shows how to fight back

https://www.latimes.com/business/technology/story/2023-05-11/column-the-writers-strike-is-only-the-beginning-a-rebellion-against-ai-is-underway

4. Sarah Silverman Sues OpenAI and Meta Over Copyright Infringement

https://www.nytimes.com/2023/07/10/arts/sarah-silverman-lawsuit-openai-meta.html?action=click&module=RelatedLinks&pgtype=Article

编译/刘亚光

编辑/张婷

校对/柳宝庆

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-08-24 17:45:03

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

搞笑,詹姆斯成背锅侠,扣篮大赛衰落怪詹姆斯,全明星下滑也怪吗
...超级巨星勒布朗·詹姆斯成为了众矢之的,而ESPN的评论员史蒂芬·A·史密斯认为,詹姆斯直接“搅乱了”扣篮大赛的局面。在勒布朗詹姆斯的第20次全明星比赛中,他再次展现出他不可思
2024-02-20 09:14:00
A·史密斯:勇士时代已终结,就是勇士没能把杜兰特签下来的时候
...是勇士没能把杜兰特签下来的时候勇士队濒临淘汰之际,史蒂芬·A·史密斯坦诚地谈到了斯蒂芬·库里与凯文·杜兰特争夺总冠军的可能性。由于金州勇士队和斯蒂芬·库里的季后赛希望渺茫,关
2025-05-15 04:41:00
霸气,名嘴A·史密斯对尼克斯和湖人做出大胆的声明,湖人不会喜欢
...史密斯对尼克斯和湖人做出大胆的声明,湖人不会喜欢。史蒂芬·A·史密斯对尼克斯的保证将激怒湖人球迷据史蒂芬·A·史密斯称,纽约尼克斯队在东部联盟球队中处于上层。与洛杉矶湖人队相
2025-01-08 02:05:00
有意思,A·史密斯将巴特勒对勇士队的影响与克莱汤普森进行了比较
有意思,史蒂芬·A·史密斯将吉米·巴特勒对勇士队的影响与克莱·汤普森进行了比较吉米·巴特勒对勇士队产生了巨大影响。自从交易来吉米·巴特勒后,金州勇士队似乎找到了新的生命,现在他们
2025-03-04 04:08:00
快船队主帅要本·西蒙斯多得分,A·史密斯批评本·西蒙斯“偷钱”
...钱”在泰伦·卢要求本·西蒙斯得分方面更多侵略性后,史蒂芬·A·史密斯点名批评了这位快船队后卫。洛杉矶快船队将在NBA季后赛首轮对阵丹佛掘金队,球迷们都在期待本·西蒙斯将如何与
2025-04-19 02:50:00
意难平呀,A·史密斯批评戴维斯和文班亚马没有入选全明星首发阵容
...A·史密斯批评戴维斯和文班亚马没有入选全明星首发阵容史蒂芬·A·史密斯批评 NBA 全明星首发阵容被排除在安东尼·戴维斯和维克多·文班亚马之外
2025-01-25 03:53:00
搞笑,尽管快船队大胜骑士队,A·史密斯仍对伦纳德严厉批评
...A·史密斯仍对伦纳德严厉批评尽管快船队战胜了骑士队,史蒂芬·A·史密斯仍对科怀·伦纳德大发雷霆。洛杉矶快船队当地时间周二晚间将连胜纪录延续到四场,以 132-119 战胜联盟
2025-03-20 04:04:00
被看好,A·史密斯对伦纳德带领的快船队打进NBA总决赛寄予厚望
...,A·史密斯对伦纳德带领的快船队打进NBA总决赛寄予厚望史蒂芬·A·史密斯认为,在科怀·伦纳德的带领下,快船队有望打进NBA总决赛ESPN分析师史蒂芬·A·史密斯在周四的《First Take》节目中对洛杉矶快船队进行了大胆的评估
2025-04-25 01:31:00
官宣!巴特勒被禁赛7场,火箭遭重创,勇士酝酿大交易,库里独1档
...们拭目以待!库里独一档在昨日对阵费城76人的比赛里,史蒂芬库里打出了久违的超巨表现!全场15中11,三分8中8,狂轰30分6篮板10助攻
2025-01-04 09:03:00
更多关于科技的资讯:
中新经纬10月9日电 工信部网站9日消息,工业和信息化部、国家标准化管理委员会近期联合发布《云计算综合标准化体系建设指南(2025版)》(下称《指南》)
2025-10-09 13:06:00
当下,网络热搜榜单已经成为我们感知世界的一个重要窗口。这个窗口展示的内容是否真实、健康、积极,直接影响着数亿网民的认知判断
2025-10-09 10:31:00
高低2025年国庆中秋双节,中国电影市场成绩亮眼:国庆档总票房破17亿元,10月2日年度总票房达425.02亿元,超2024年全年
2025-10-09 10:49:00
厦门网讯(厦门日报记者 李晓平)如今,拍照不再停留在平面,“一站式”3D人像打印,正让影像“立”起来,成为更多人的选择
2025-10-08 08:12:00
小牛FX风速款首销战报:5小时全渠道销量14252台,以“价值重构”引爆全民抢购潮
2025年9月29日,全球高端智能电动车领导品牌小牛电动正式发布FX风速款首销战报。数据显示,这款被业界称为“价格屠夫”的新品在9月28日首发后
2025-10-08 09:00:00
稳就业 稳企业 稳市场 稳预期|从 “设备制造” 到 “全链服务”:陕西电子长岭电气纺织机电产业的进阶之路
9月29日,由陕西省委宣传部举办的“稳就业、稳企业、稳市场、稳预期”主题媒体行活动,带领陕西多家主流媒体走进陕西电子陕西长岭电气有限责任公司参观考察
2025-10-08 17:51:00
近日,中国物流与采购联合会公布全国第十批5A级供应链服务企业名单,华远国际陆港集团正式通过评审,获评“5A级供应链服务企业”
2025-10-08 18:01:00
货丰价稳、活动密集、销售井喷、消费升级……在这个中秋国庆假期,我市消费市场“热”力值拉满,处处繁荣兴旺、活力十足。10月8日
2025-10-08 18:32:00
佳盛机电乘风而上,今年前8月产值同比增长超38%抢占新赛道,270多名员工假期忙“冲刺”南报网讯(通讯员单维亮记者张希)“我们是智能电网产业链条上的配套企业
2025-10-07 08:41:00
培育壮大十大千亿级产业集群丨十堰臻融:创新与技改“双轮”驱动 产值同比增长30%
十堰广电讯(全媒体记者 何旭 通讯员 胡新)科技创新是提升核心竞争力关键。十堰臻融汽车科技有限公司以智能化装备升级与专利技术研发为双引擎
2025-10-07 20:43:00
沉浸式AR科技盛宴:打造“可触摸”的科普实验室,重构科普新形态
这个国庆去哪玩?中国科学技术馆告诉你!2025年10月1日——10月7日由中国科学技术馆、北京峰火文化科技有限公司、Rokid联合打造的以“探境・AR科技智慧”为主题的AR体验活动正火热开展中
2025-10-07 09:05:00
2025年全国大学生计算机大赛总决赛落幕 西工大获奖数量质量再创新高
近日,2025年全国大学生计算机系统能力大赛各赛道总决赛圆满落幕。本届大赛吸引了来自清华大学、北京大学、复旦大学、华中科技大学
2025-10-07 11:40:00
太划算!遵义多重补贴点燃消费热情
多彩贵州网讯国庆中秋“双节”同至,遵义市推出的“悦·遵义‘双节’欢乐购”促消费活动覆盖整个长假,其中“焕新过节·乐享生活”家电家居促销活动形式丰富
2025-10-07 14:51:00
□南京日报/紫金山新闻记者 张安琪9月23日,2025南京金秋经贸洽谈会开幕式上,一批全球首个、国内首批、性能全球最高的科技成果密集亮相
2025-10-06 09:49:00
国庆中秋长假期间,新能源汽车已成为众多家庭出游的重要选择。为进一步破解高速服务区“充电难、排队久”的现实困境,山西交控集团坚持“科技创新+服务升级”双轮驱动
2025-10-06 18:01:00