• 我的订阅
  • 科技

史蒂芬·金、扎迪·史密斯等人作品被用于训练人工智能

类别:科技 发布时间:2023-08-24 16:25:00 来源:新京报

据介绍,扎迪·史密斯、史蒂芬·金等人的小说被纳入一个叫Book3的人工智能工具数据集,用于训练Meta旗下的大型语言模型LLaMA——这类语言模型中最著名的就是今年年初极受关注的OpenAI公司旗下ChatGPT。此外,该数据集还被彭博公司用于训练他们的模型BloombergGPT。

英国《卫报》的报道表示,Book3中包含的图书数据大约三分之一是小说,三分之二是非虚构作品,这些作品基本是过去二十年中出版的。除了以上已经列出的作品外,费兰特、阿特伍德、村上春树、乔纳森·弗兰岑等人的多部作品也包括其中。而已经输入到Meta等公司的语言模型中用于训练的数据也已包括了超过170000本书。

用于训练的图书覆盖的出版商十分广泛,包括企鹅兰登书屋(30000多本)、哈珀·柯林斯出版(14000本)、麦克米伦(7000本)、牛津大学出版社(1800本)等。未来计划纳入的作品可能还包括约翰·麦克阿瑟(John MacArthur)、丽贝卡·索尔尼特 (Rebecca Solnit)等人。

史蒂芬·金、扎迪·史密斯等人作品被用于训练人工智能

史蒂芬·金。图源英国《卫报》。

用于“喂养”这些模型的数据常来自开放网络,其中也包括Library Genesis、Zlibrary等影子图书馆,其中包含的大量图书资源成为大公司眼中绝佳的分析材料。2020年发布的一篇论文显示,OpenAI训练语言模型的数据来源中,有一个名为Book2的包含30万本图书的数据库。今年6月的一份诉讼案中提到,Book2的数据很可能就源自影子图书馆,而这些被纳入数据库的作品常常受到版权的保护。

ChatGPT等大型语言模型对作家版权的侵犯已经是一个被争论了许久的问题。今年7月,莎拉·西尔弗曼 (Sarah Silverman)、理查德·卡德雷 (Richard Kadrey)和克里斯托弗·戈尔登 (Christopher Golden)三位作家就针对Meta的LLaMA提起诉讼,表示自己受版权保护的作品被Book3利用。

此前,作家莫娜·阿瓦德(Mona Awad)和保罗·特伦布莱(Paul Tremblay)也针对OpenAI提起诉讼,声称公司未经作者许可将他们的小说用于训练语言模型,侵犯了作者版权。两人的律师表示,对于大公司的语言模型来说,系统化的书籍是用于训练的最好选择,因为相较于自由散乱的网络在线数据,它们经过了高质量的编辑。当时的诉状称,OpenAI等公司从窃取来的原创想法中“不公平地获利”,理应向作者赔偿。然而,英国《卫报》的报道显示,两位作者很难证明自己因小说被用于语言模型训练而蒙受经济损失。

最初创建 Books3 的独立人工智能开发人员肖恩·普雷瑟(Shawn Presser)在接受采访时表示,他理解作者们的担忧,但他创建这个数据集的目的恰恰是为了让任何人都可以开发生成式人工智能工具,避免大公司垄断技术的风险。Meta的发言人拒绝了就使用Book3发表评论。

人工智能对内容行业的冲击可能在未来很长一段时间里都是值得忧虑的课题。《洛杉矶时报》今年5月的一篇报道就梳理了ChatGPT等语言模型可能对文学、艺术创作者带来的多方面影响。文中提到,相较于职业的媒体工作者、专业作家等,缺乏工会保护的自由职业者、独立艺术家更需要受到关注,因为他们面对人工智能不经同意就利用其作品用于增强自身的行为几乎毫无反抗能力。

在侵权争议之外,人工智能还正在深度参与内容行业的审查工作。据《滚石》等杂志报道,美国已有学校的图书馆开始利用ChatGPT辅助图书中敏感内容的审查。ChatGPT判定出《追风筝的人》《使女的故事》等畅销书包含对性行为的“描述”并建议其下架。然而,后续的多次验证也说明这种判定有其不稳定性。

参考链接:

1. Zadie Smith, Stephen King and Rachel Cusk’s pirated works used to train AI

https://www.theguardian.com/books/2023/aug/22/zadie-smith-stephen-king-and-rachel-cusks-pirated-works-used-to-train-ai

2. This article is more than 1 month oldAuthors file a lawsuit against OpenAI for unlawfully ‘ingesting’ their books

https://www.theguardian.com/books/2023/jul/05/authors-file-a-lawsuit-against-openai-for-unlawfully-ingesting-their-books

3. Column: Your boss wants AI to replace you. The writers’ strike shows how to fight back

https://www.latimes.com/business/technology/story/2023-05-11/column-the-writers-strike-is-only-the-beginning-a-rebellion-against-ai-is-underway

4. Sarah Silverman Sues OpenAI and Meta Over Copyright Infringement

https://www.nytimes.com/2023/07/10/arts/sarah-silverman-lawsuit-openai-meta.html?action=click&module=RelatedLinks&pgtype=Article

编译/刘亚光

编辑/张婷

校对/柳宝庆

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-08-24 17:45:03

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

搞笑,詹姆斯成背锅侠,扣篮大赛衰落怪詹姆斯,全明星下滑也怪吗
...超级巨星勒布朗·詹姆斯成为了众矢之的,而ESPN的评论员史蒂芬·A·史密斯认为,詹姆斯直接“搅乱了”扣篮大赛的局面。在勒布朗詹姆斯的第20次全明星比赛中,他再次展现出他不可思
2024-02-20 09:14:00
A·史密斯:勇士时代已终结,就是勇士没能把杜兰特签下来的时候
...是勇士没能把杜兰特签下来的时候勇士队濒临淘汰之际,史蒂芬·A·史密斯坦诚地谈到了斯蒂芬·库里与凯文·杜兰特争夺总冠军的可能性。由于金州勇士队和斯蒂芬·库里的季后赛希望渺茫,关
2025-05-15 04:41:00
霸气,名嘴A·史密斯对尼克斯和湖人做出大胆的声明,湖人不会喜欢
...史密斯对尼克斯和湖人做出大胆的声明,湖人不会喜欢。史蒂芬·A·史密斯对尼克斯的保证将激怒湖人球迷据史蒂芬·A·史密斯称,纽约尼克斯队在东部联盟球队中处于上层。与洛杉矶湖人队相
2025-01-08 02:05:00
有意思,A·史密斯将巴特勒对勇士队的影响与克莱汤普森进行了比较
有意思,史蒂芬·A·史密斯将吉米·巴特勒对勇士队的影响与克莱·汤普森进行了比较吉米·巴特勒对勇士队产生了巨大影响。自从交易来吉米·巴特勒后,金州勇士队似乎找到了新的生命,现在他们
2025-03-04 04:08:00
快船队主帅要本·西蒙斯多得分,A·史密斯批评本·西蒙斯“偷钱”
...钱”在泰伦·卢要求本·西蒙斯得分方面更多侵略性后,史蒂芬·A·史密斯点名批评了这位快船队后卫。洛杉矶快船队将在NBA季后赛首轮对阵丹佛掘金队,球迷们都在期待本·西蒙斯将如何与
2025-04-19 02:50:00
意难平呀,A·史密斯批评戴维斯和文班亚马没有入选全明星首发阵容
...A·史密斯批评戴维斯和文班亚马没有入选全明星首发阵容史蒂芬·A·史密斯批评 NBA 全明星首发阵容被排除在安东尼·戴维斯和维克多·文班亚马之外
2025-01-25 03:53:00
搞笑,尽管快船队大胜骑士队,A·史密斯仍对伦纳德严厉批评
...A·史密斯仍对伦纳德严厉批评尽管快船队战胜了骑士队,史蒂芬·A·史密斯仍对科怀·伦纳德大发雷霆。洛杉矶快船队当地时间周二晚间将连胜纪录延续到四场,以 132-119 战胜联盟
2025-03-20 04:04:00
被看好,A·史密斯对伦纳德带领的快船队打进NBA总决赛寄予厚望
...,A·史密斯对伦纳德带领的快船队打进NBA总决赛寄予厚望史蒂芬·A·史密斯认为,在科怀·伦纳德的带领下,快船队有望打进NBA总决赛ESPN分析师史蒂芬·A·史密斯在周四的《First Take》节目中对洛杉矶快船队进行了大胆的评估
2025-04-25 01:31:00
官宣!巴特勒被禁赛7场,火箭遭重创,勇士酝酿大交易,库里独1档
...们拭目以待!库里独一档在昨日对阵费城76人的比赛里,史蒂芬库里打出了久违的超巨表现!全场15中11,三分8中8,狂轰30分6篮板10助攻
2025-01-04 09:03:00
更多关于科技的资讯:
河北新闻网讯(王杨、王雪威)近日,河钢集团张宣科技生产的2万吨绿色汽车板材料下线,经检验,产品各项性能指标均满足订单标准
2026-01-02 22:20:00
鲁南眼科自有品牌「鲁南博视」光学镜片发布会暨成人验光配镜门诊一周年成功举办
鲁网1月1日讯2025年12月31日,鲁南眼科医院成功举办自有品牌「鲁南博视」光学镜片发布会暨成人验光配镜门诊一周年庆典
2026-01-02 16:41:00
新年第一天 燕赵沐朝晖|“雄安一号”星 测试太阳翼
编者按岁序更替,华章日新。2026年是“十五五”开局之年。锐始者必图其终,成功者先计于始。新年第一天,燕赵大地欣欣向荣
2026-01-02 07:05:00
注意缺陷与多动障碍 这个疾病越来越常见 都说长大就好了 为何缠上成人?
2025年12月31日凌晨,罗永浩在微博发文回应“科技春晚”发布会迟到40分钟事件,首次公开坦承自己受注意缺陷与多动障碍(ADHD)困扰多年
2026-01-02 08:06:00
近日,湘湖首部AI动画《湘湖漫游记》第五集上线,该系列作品正式收官。本片不仅是杭州湘湖(白马湖)研究院在“文化+科技”融合上的一次重要突破
2026-01-02 06:35:00
在杭州湖滨银泰in77的B区、D区之间,复古的国王十字车站、9站台出现在现场,仿佛下一秒就有巫师推着行李箱穿墙而过;一辆编号5972的霍格沃茨特快列车静静停靠在街区中央
2026-01-02 06:35:00
2025年度票房破518亿元 动画电影成亮点 安徽全国排名第十
大皖新闻讯 国家电影局2026年1月1日公布,2025年电影票房为518.32亿元,同比增长21.95%,城市院线观影人次为12
2026-01-01 17:14:00
免费抢鲜体验!香飘飘魔芋啵啵奶茶快闪体验活动空降临沂泰盛广场 健康爆款掀起跨年打卡热潮
鲁网1月1日讯 (记者 李文静)2025年12月31日晚,国民奶茶品牌香飘飘携新品“魔芋啵啵”奶茶,在山东临沂泰盛广场开启奶茶快闪体验活动
2026-01-01 15:52:00
厦门动漫嘉年华启幕 众多热门国漫IP集中参展
厦门动漫嘉年华各项活动精彩纷呈。(记者 林铭鸿 摄)厦门网讯(厦门日报记者 林露虹)展览面积超5万平方米,汇聚众多热门国漫IP
2026-01-01 08:41:00
助力低空应急产业发展——三明市应急管理局引进低空防御项目
东南网1月1日讯 2025年12月30日,由三明市应急管理局引进,南京云麒防务科技有限公司投资的福建鹏鑫智能科技有限公司
2026-01-01 09:33:00
近日,太长高速太原收费站智慧化升级改造全面完成并投入运营。项目以数字化转型为核心,围绕高峰期通行效率低、车辆拥堵等运营痛点
2026-01-01 07:17:00
沈洁任蓟州区代理区长 扫码阅读手机版
据“掌上蓟州”微信公众号消息,天津市蓟州区第二届人民代表大会常务委员会第三十五次会议决定:沈洁为天津市蓟州区人民政府代理区长。
2025-12-31 23:10:00
东南网12月31日讯(本网记者 卢金福)元旦佳节将至,消费市场迎来新一轮热潮。面对促销活动纷至沓来、消费场景多元拓展的新形势
2025-12-31 23:29:00
皖企长鑫科技向上交所递交IPO招股书
大皖新闻讯 2025年12月30日,总部位于合肥的长鑫科技集团股份有限公司(以下简称“长鑫科技”)正式向上海证券交易所递交招股书
2025-12-31 21:33:00
大河网讯 这一年,我们没有走遍世界,但世界,走进了《Global Talk》。2025年,《Global Talk》结识了来自全球近30个国家和地区的朋友——他们带着各自的故事
2025-12-31 22:33:00