• 我的订阅
  • 科技

史蒂芬·金、扎迪·史密斯等人作品被用于训练人工智能

类别:科技 发布时间:2023-08-24 16:25:00 来源:新京报

据介绍,扎迪·史密斯、史蒂芬·金等人的小说被纳入一个叫Book3的人工智能工具数据集,用于训练Meta旗下的大型语言模型LLaMA——这类语言模型中最著名的就是今年年初极受关注的OpenAI公司旗下ChatGPT。此外,该数据集还被彭博公司用于训练他们的模型BloombergGPT。

英国《卫报》的报道表示,Book3中包含的图书数据大约三分之一是小说,三分之二是非虚构作品,这些作品基本是过去二十年中出版的。除了以上已经列出的作品外,费兰特、阿特伍德、村上春树、乔纳森·弗兰岑等人的多部作品也包括其中。而已经输入到Meta等公司的语言模型中用于训练的数据也已包括了超过170000本书。

用于训练的图书覆盖的出版商十分广泛,包括企鹅兰登书屋(30000多本)、哈珀·柯林斯出版(14000本)、麦克米伦(7000本)、牛津大学出版社(1800本)等。未来计划纳入的作品可能还包括约翰·麦克阿瑟(John MacArthur)、丽贝卡·索尔尼特 (Rebecca Solnit)等人。

史蒂芬·金、扎迪·史密斯等人作品被用于训练人工智能

史蒂芬·金。图源英国《卫报》。

用于“喂养”这些模型的数据常来自开放网络,其中也包括Library Genesis、Zlibrary等影子图书馆,其中包含的大量图书资源成为大公司眼中绝佳的分析材料。2020年发布的一篇论文显示,OpenAI训练语言模型的数据来源中,有一个名为Book2的包含30万本图书的数据库。今年6月的一份诉讼案中提到,Book2的数据很可能就源自影子图书馆,而这些被纳入数据库的作品常常受到版权的保护。

ChatGPT等大型语言模型对作家版权的侵犯已经是一个被争论了许久的问题。今年7月,莎拉·西尔弗曼 (Sarah Silverman)、理查德·卡德雷 (Richard Kadrey)和克里斯托弗·戈尔登 (Christopher Golden)三位作家就针对Meta的LLaMA提起诉讼,表示自己受版权保护的作品被Book3利用。

此前,作家莫娜·阿瓦德(Mona Awad)和保罗·特伦布莱(Paul Tremblay)也针对OpenAI提起诉讼,声称公司未经作者许可将他们的小说用于训练语言模型,侵犯了作者版权。两人的律师表示,对于大公司的语言模型来说,系统化的书籍是用于训练的最好选择,因为相较于自由散乱的网络在线数据,它们经过了高质量的编辑。当时的诉状称,OpenAI等公司从窃取来的原创想法中“不公平地获利”,理应向作者赔偿。然而,英国《卫报》的报道显示,两位作者很难证明自己因小说被用于语言模型训练而蒙受经济损失。

最初创建 Books3 的独立人工智能开发人员肖恩·普雷瑟(Shawn Presser)在接受采访时表示,他理解作者们的担忧,但他创建这个数据集的目的恰恰是为了让任何人都可以开发生成式人工智能工具,避免大公司垄断技术的风险。Meta的发言人拒绝了就使用Book3发表评论。

人工智能对内容行业的冲击可能在未来很长一段时间里都是值得忧虑的课题。《洛杉矶时报》今年5月的一篇报道就梳理了ChatGPT等语言模型可能对文学、艺术创作者带来的多方面影响。文中提到,相较于职业的媒体工作者、专业作家等,缺乏工会保护的自由职业者、独立艺术家更需要受到关注,因为他们面对人工智能不经同意就利用其作品用于增强自身的行为几乎毫无反抗能力。

在侵权争议之外,人工智能还正在深度参与内容行业的审查工作。据《滚石》等杂志报道,美国已有学校的图书馆开始利用ChatGPT辅助图书中敏感内容的审查。ChatGPT判定出《追风筝的人》《使女的故事》等畅销书包含对性行为的“描述”并建议其下架。然而,后续的多次验证也说明这种判定有其不稳定性。

参考链接:

1. Zadie Smith, Stephen King and Rachel Cusk’s pirated works used to train AI

https://www.theguardian.com/books/2023/aug/22/zadie-smith-stephen-king-and-rachel-cusks-pirated-works-used-to-train-ai

2. This article is more than 1 month oldAuthors file a lawsuit against OpenAI for unlawfully ‘ingesting’ their books

https://www.theguardian.com/books/2023/jul/05/authors-file-a-lawsuit-against-openai-for-unlawfully-ingesting-their-books

3. Column: Your boss wants AI to replace you. The writers’ strike shows how to fight back

https://www.latimes.com/business/technology/story/2023-05-11/column-the-writers-strike-is-only-the-beginning-a-rebellion-against-ai-is-underway

4. Sarah Silverman Sues OpenAI and Meta Over Copyright Infringement

https://www.nytimes.com/2023/07/10/arts/sarah-silverman-lawsuit-openai-meta.html?action=click&module=RelatedLinks&pgtype=Article

编译/刘亚光

编辑/张婷

校对/柳宝庆

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-08-24 17:45:03

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

搞笑,詹姆斯成背锅侠,扣篮大赛衰落怪詹姆斯,全明星下滑也怪吗
...超级巨星勒布朗·詹姆斯成为了众矢之的,而ESPN的评论员史蒂芬·A·史密斯认为,詹姆斯直接“搅乱了”扣篮大赛的局面。在勒布朗詹姆斯的第20次全明星比赛中,他再次展现出他不可思
2024-02-20 09:14:00
A·史密斯:勇士时代已终结,就是勇士没能把杜兰特签下来的时候
...是勇士没能把杜兰特签下来的时候勇士队濒临淘汰之际,史蒂芬·A·史密斯坦诚地谈到了斯蒂芬·库里与凯文·杜兰特争夺总冠军的可能性。由于金州勇士队和斯蒂芬·库里的季后赛希望渺茫,关
2025-05-15 04:41:00
霸气,名嘴A·史密斯对尼克斯和湖人做出大胆的声明,湖人不会喜欢
...史密斯对尼克斯和湖人做出大胆的声明,湖人不会喜欢。史蒂芬·A·史密斯对尼克斯的保证将激怒湖人球迷据史蒂芬·A·史密斯称,纽约尼克斯队在东部联盟球队中处于上层。与洛杉矶湖人队相
2025-01-08 02:05:00
有意思,A·史密斯将巴特勒对勇士队的影响与克莱汤普森进行了比较
有意思,史蒂芬·A·史密斯将吉米·巴特勒对勇士队的影响与克莱·汤普森进行了比较吉米·巴特勒对勇士队产生了巨大影响。自从交易来吉米·巴特勒后,金州勇士队似乎找到了新的生命,现在他们
2025-03-04 04:08:00
快船队主帅要本·西蒙斯多得分,A·史密斯批评本·西蒙斯“偷钱”
...钱”在泰伦·卢要求本·西蒙斯得分方面更多侵略性后,史蒂芬·A·史密斯点名批评了这位快船队后卫。洛杉矶快船队将在NBA季后赛首轮对阵丹佛掘金队,球迷们都在期待本·西蒙斯将如何与
2025-04-19 02:50:00
意难平呀,A·史密斯批评戴维斯和文班亚马没有入选全明星首发阵容
...A·史密斯批评戴维斯和文班亚马没有入选全明星首发阵容史蒂芬·A·史密斯批评 NBA 全明星首发阵容被排除在安东尼·戴维斯和维克多·文班亚马之外
2025-01-25 03:53:00
搞笑,尽管快船队大胜骑士队,A·史密斯仍对伦纳德严厉批评
...A·史密斯仍对伦纳德严厉批评尽管快船队战胜了骑士队,史蒂芬·A·史密斯仍对科怀·伦纳德大发雷霆。洛杉矶快船队当地时间周二晚间将连胜纪录延续到四场,以 132-119 战胜联盟
2025-03-20 04:04:00
被看好,A·史密斯对伦纳德带领的快船队打进NBA总决赛寄予厚望
...,A·史密斯对伦纳德带领的快船队打进NBA总决赛寄予厚望史蒂芬·A·史密斯认为,在科怀·伦纳德的带领下,快船队有望打进NBA总决赛ESPN分析师史蒂芬·A·史密斯在周四的《First Take》节目中对洛杉矶快船队进行了大胆的评估
2025-04-25 01:31:00
官宣!巴特勒被禁赛7场,火箭遭重创,勇士酝酿大交易,库里独1档
...们拭目以待!库里独一档在昨日对阵费城76人的比赛里,史蒂芬库里打出了久违的超巨表现!全场15中11,三分8中8,狂轰30分6篮板10助攻
2025-01-04 09:03:00
更多关于科技的资讯:
2025雷达无线电产业大会在宁落幕“空中卫士”筑起低空防线配套设备穿上“防护铠甲”南报网讯(记者张甜甜曹丽珍)11月8日
2025-11-09 09:34:00
小米Hyper AI获2025“直通乌镇”全球互联网大赛智能终端赛道特等奖
11月9日,2025“直通乌镇”全球互联网大赛智能终端赛道成绩揭晓。Xiaomi HyperAI获得该赛道特等奖。“直通乌镇”全球互联网大赛是世界互联网大会乌镇峰会标杆性赛事
2025-11-09 18:10:00
11月8日下午,在2025年全球互联网大会“互联网之光”博览会现场,各类机器人成为最耀眼的明星,它们既是舞台上的表演者
2025-11-09 10:23:00
日常生活中,电梯是高层楼宇里不可或缺的垂直交通工具。超过80%的电梯在发生故障前都会释放“求救信号”。这些容易被忽视的异常现象
2025-11-08 05:24:00
进博会上,南京“买手团”大逛“世界超市”全球直采,优品好物装进“购物车”□南京日报/紫金山新闻记者 黄琳燕11月7日,第八届进博会7
2025-11-08 09:31:00
八赴进博彰显深耕决心!凯克携 77 年加拿大真洋牌伟博天然,以全维优势点亮健康新生态
2025 年第八届中国国际进口博览会(进博会)盛大启幕,凯克集团再度携手 webbernaturals 伟博天然荣耀参展
2025-11-08 14:40:00
双11调研:家庭日用类消费成65.89%人大促固定选择,京东成消费者下单日百和服务首选平台
双11已步入第十七个年头,消费者的心态与行为模式也发生了深刻变化。越来越多的中国家庭将双11视为进行生活规划与品质升级的关键节点
2025-11-08 14:42:00
从巴黎歌剧院到家庭客厅,海信激光电视携手 DEVIALET 帝瓦雷开启“家庭影院新世代”
法国当地时间11月4日,全球显示领军品牌海信与知名高端音响品牌 DEVIALET 帝瓦雷在巴黎举办了一场科技与艺术的跨界盛宴
2025-11-08 14:43:00
双11囤货别忘囤“快乐”!华为应用解锁花式娱乐新体验
这个双11,你的购物车是不是已经塞满了心仪的好物?从智能家电到秋冬新装,从母婴用品到家居日用。在忙着为全家人囤货的同时
2025-11-08 14:44:00
在乌镇遇见更懂你的AI,科大讯飞携星火大模型及全场景应用亮相2025世界互联网大会
当千年舟楫摇橹的乌镇,再次成为全球互联网的焦点,一场关于未来的想象正在这里变为现实。2025年11月6日至9日,以“AI共生
2025-11-08 14:44:00
工厂数智化升级,安全建设别再原地踏步!深信服安全托管常态守护
某全球知名的智能制造企业拥有多个生产基地,高智能化产线7*24H运转,而随之而来的安全挑战,却成了企业信息部门“心病”
2025-11-08 14:44:00
双11“精神囤货”指南:华为音乐、视频、阅读,承包你的快乐源泉
又是一年双十一,当购物车被各种生活好物填满,你是否想过,也该为自己的休闲娱乐体验升个级?无论是上下班通勤路上、午休小憩时刻
2025-11-08 14:44:00
11月7日,在2025年世界互联网大会“互联网之光”博览会现场,两位机器人乐手用灵巧的双手演奏钢琴,引人驻足。“我很想去拍拍他们手的细节
2025-11-08 15:52:00
蚂蚁集团CEO韩歆毅:AQ承载蚂蚁健康新使命,让看病更简单、生活更健康
11月8日,乌镇峰会上,蚂蚁集团CEO韩歆毅作为企业代表分享了在AI医疗健康领域的思考与实践。此前,继旗下AI健康应用AQ月活用户突破千万后
2025-11-08 17:00:00
近日,2025福布斯中国・最具影响力华人精英TOP100榜单公布,山西美锦能源股份有限公司董事长姚锦龙上榜。据悉,本届榜单从“产业重塑者”“价值创造者”“趋势勘探者”三大维度
2025-11-08 18:06:00