• 我的订阅
  • 科技

史蒂芬·金、扎迪·史密斯等人作品被用于训练人工智能

类别:科技 发布时间:2023-08-24 16:25:00 来源:新京报

据介绍,扎迪·史密斯、史蒂芬·金等人的小说被纳入一个叫Book3的人工智能工具数据集,用于训练Meta旗下的大型语言模型LLaMA——这类语言模型中最著名的就是今年年初极受关注的OpenAI公司旗下ChatGPT。此外,该数据集还被彭博公司用于训练他们的模型BloombergGPT。

英国《卫报》的报道表示,Book3中包含的图书数据大约三分之一是小说,三分之二是非虚构作品,这些作品基本是过去二十年中出版的。除了以上已经列出的作品外,费兰特、阿特伍德、村上春树、乔纳森·弗兰岑等人的多部作品也包括其中。而已经输入到Meta等公司的语言模型中用于训练的数据也已包括了超过170000本书。

用于训练的图书覆盖的出版商十分广泛,包括企鹅兰登书屋(30000多本)、哈珀·柯林斯出版(14000本)、麦克米伦(7000本)、牛津大学出版社(1800本)等。未来计划纳入的作品可能还包括约翰·麦克阿瑟(John MacArthur)、丽贝卡·索尔尼特 (Rebecca Solnit)等人。

史蒂芬·金、扎迪·史密斯等人作品被用于训练人工智能

史蒂芬·金。图源英国《卫报》。

用于“喂养”这些模型的数据常来自开放网络,其中也包括Library Genesis、Zlibrary等影子图书馆,其中包含的大量图书资源成为大公司眼中绝佳的分析材料。2020年发布的一篇论文显示,OpenAI训练语言模型的数据来源中,有一个名为Book2的包含30万本图书的数据库。今年6月的一份诉讼案中提到,Book2的数据很可能就源自影子图书馆,而这些被纳入数据库的作品常常受到版权的保护。

ChatGPT等大型语言模型对作家版权的侵犯已经是一个被争论了许久的问题。今年7月,莎拉·西尔弗曼 (Sarah Silverman)、理查德·卡德雷 (Richard Kadrey)和克里斯托弗·戈尔登 (Christopher Golden)三位作家就针对Meta的LLaMA提起诉讼,表示自己受版权保护的作品被Book3利用。

此前,作家莫娜·阿瓦德(Mona Awad)和保罗·特伦布莱(Paul Tremblay)也针对OpenAI提起诉讼,声称公司未经作者许可将他们的小说用于训练语言模型,侵犯了作者版权。两人的律师表示,对于大公司的语言模型来说,系统化的书籍是用于训练的最好选择,因为相较于自由散乱的网络在线数据,它们经过了高质量的编辑。当时的诉状称,OpenAI等公司从窃取来的原创想法中“不公平地获利”,理应向作者赔偿。然而,英国《卫报》的报道显示,两位作者很难证明自己因小说被用于语言模型训练而蒙受经济损失。

最初创建 Books3 的独立人工智能开发人员肖恩·普雷瑟(Shawn Presser)在接受采访时表示,他理解作者们的担忧,但他创建这个数据集的目的恰恰是为了让任何人都可以开发生成式人工智能工具,避免大公司垄断技术的风险。Meta的发言人拒绝了就使用Book3发表评论。

人工智能对内容行业的冲击可能在未来很长一段时间里都是值得忧虑的课题。《洛杉矶时报》今年5月的一篇报道就梳理了ChatGPT等语言模型可能对文学、艺术创作者带来的多方面影响。文中提到,相较于职业的媒体工作者、专业作家等,缺乏工会保护的自由职业者、独立艺术家更需要受到关注,因为他们面对人工智能不经同意就利用其作品用于增强自身的行为几乎毫无反抗能力。

在侵权争议之外,人工智能还正在深度参与内容行业的审查工作。据《滚石》等杂志报道,美国已有学校的图书馆开始利用ChatGPT辅助图书中敏感内容的审查。ChatGPT判定出《追风筝的人》《使女的故事》等畅销书包含对性行为的“描述”并建议其下架。然而,后续的多次验证也说明这种判定有其不稳定性。

参考链接:

1. Zadie Smith, Stephen King and Rachel Cusk’s pirated works used to train AI

https://www.theguardian.com/books/2023/aug/22/zadie-smith-stephen-king-and-rachel-cusks-pirated-works-used-to-train-ai

2. This article is more than 1 month oldAuthors file a lawsuit against OpenAI for unlawfully ‘ingesting’ their books

https://www.theguardian.com/books/2023/jul/05/authors-file-a-lawsuit-against-openai-for-unlawfully-ingesting-their-books

3. Column: Your boss wants AI to replace you. The writers’ strike shows how to fight back

https://www.latimes.com/business/technology/story/2023-05-11/column-the-writers-strike-is-only-the-beginning-a-rebellion-against-ai-is-underway

4. Sarah Silverman Sues OpenAI and Meta Over Copyright Infringement

https://www.nytimes.com/2023/07/10/arts/sarah-silverman-lawsuit-openai-meta.html?action=click&module=RelatedLinks&pgtype=Article

编译/刘亚光

编辑/张婷

校对/柳宝庆

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-08-24 17:45:03

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

搞笑,詹姆斯成背锅侠,扣篮大赛衰落怪詹姆斯,全明星下滑也怪吗
...超级巨星勒布朗·詹姆斯成为了众矢之的,而ESPN的评论员史蒂芬·A·史密斯认为,詹姆斯直接“搅乱了”扣篮大赛的局面。在勒布朗詹姆斯的第20次全明星比赛中,他再次展现出他不可思
2024-02-20 09:14:00
A·史密斯:勇士时代已终结,就是勇士没能把杜兰特签下来的时候
...是勇士没能把杜兰特签下来的时候勇士队濒临淘汰之际,史蒂芬·A·史密斯坦诚地谈到了斯蒂芬·库里与凯文·杜兰特争夺总冠军的可能性。由于金州勇士队和斯蒂芬·库里的季后赛希望渺茫,关
2025-05-15 04:41:00
霸气,名嘴A·史密斯对尼克斯和湖人做出大胆的声明,湖人不会喜欢
...史密斯对尼克斯和湖人做出大胆的声明,湖人不会喜欢。史蒂芬·A·史密斯对尼克斯的保证将激怒湖人球迷据史蒂芬·A·史密斯称,纽约尼克斯队在东部联盟球队中处于上层。与洛杉矶湖人队相
2025-01-08 02:05:00
有意思,A·史密斯将巴特勒对勇士队的影响与克莱汤普森进行了比较
有意思,史蒂芬·A·史密斯将吉米·巴特勒对勇士队的影响与克莱·汤普森进行了比较吉米·巴特勒对勇士队产生了巨大影响。自从交易来吉米·巴特勒后,金州勇士队似乎找到了新的生命,现在他们
2025-03-04 04:08:00
快船队主帅要本·西蒙斯多得分,A·史密斯批评本·西蒙斯“偷钱”
...钱”在泰伦·卢要求本·西蒙斯得分方面更多侵略性后,史蒂芬·A·史密斯点名批评了这位快船队后卫。洛杉矶快船队将在NBA季后赛首轮对阵丹佛掘金队,球迷们都在期待本·西蒙斯将如何与
2025-04-19 02:50:00
意难平呀,A·史密斯批评戴维斯和文班亚马没有入选全明星首发阵容
...A·史密斯批评戴维斯和文班亚马没有入选全明星首发阵容史蒂芬·A·史密斯批评 NBA 全明星首发阵容被排除在安东尼·戴维斯和维克多·文班亚马之外
2025-01-25 03:53:00
搞笑,尽管快船队大胜骑士队,A·史密斯仍对伦纳德严厉批评
...A·史密斯仍对伦纳德严厉批评尽管快船队战胜了骑士队,史蒂芬·A·史密斯仍对科怀·伦纳德大发雷霆。洛杉矶快船队当地时间周二晚间将连胜纪录延续到四场,以 132-119 战胜联盟
2025-03-20 04:04:00
被看好,A·史密斯对伦纳德带领的快船队打进NBA总决赛寄予厚望
...,A·史密斯对伦纳德带领的快船队打进NBA总决赛寄予厚望史蒂芬·A·史密斯认为,在科怀·伦纳德的带领下,快船队有望打进NBA总决赛ESPN分析师史蒂芬·A·史密斯在周四的《First Take》节目中对洛杉矶快船队进行了大胆的评估
2025-04-25 01:31:00
官宣!巴特勒被禁赛7场,火箭遭重创,勇士酝酿大交易,库里独1档
...们拭目以待!库里独一档在昨日对阵费城76人的比赛里,史蒂芬库里打出了久违的超巨表现!全场15中11,三分8中8,狂轰30分6篮板10助攻
2025-01-04 09:03:00
更多关于科技的资讯:
双轮驱动,智启未来:刘晓春与AI智能体×机器人“姊妹组合战略”的全球布局
2026,智能时代的分水岭2026年的春天,马年春晚的舞台上,一场科技盛宴惊艳了全球观众——30多台国产机器人协同起舞
2026-02-22 12:05:00
新春走基层丨厦企加快数字化转型步伐 提前返岗忙生产赶订单
明翰电气的工人春节期间坚守岗位。(记者 林铭鸿 摄)厦门网讯(厦门日报记者 林露虹)放置材料、调试机台……正月初五,厦门明翰电气股份有限公司(以下简称“明翰电气”)已忙碌起来
2026-02-22 08:50:00
新春走基层 | 森一量子为赶订单全员在线 生产线满负荷运转
昨日记者走进森一量子,这一企业春节期间全员加班加点。厦门网讯(厦门日报记者 李晓平)长晶、 切割、减薄、抛光、镀膜……当大多数人还沉浸在春节的喜庆中
2026-02-22 08:50:00
我带着一款AI眼镜回家过年
记者带回家的AI眼镜二伯买的宇树机器狗Go2今年的春晚有一个格外醒目的变化——“AI含量”明显提升。年夜饭桌上,亲戚们都在聊各自手机里的各种“AI”App
2026-02-22 07:49:00
中国科大实现碳化硅改性双空位色心的电荷态调控
大皖新闻讯 2月21日,大皖新闻记者从中国科学技术大学获悉,该校郭光灿院士团队在碳化硅改性双空位色心电荷态调控的研究中取得了新进展
2026-02-21 16:48:00
戛纳世界人工智能大会探讨“音乐人工智能”
中国青年报客户端讯(中青报·中青网记者 蒋肖斌)2026戛纳世界人工智能大会(WAICF 2026),近日在法国戛纳举办
2026-02-21 12:10:00
杭州一家高科技创业公司员工 每人领一个陪伴机器人回家过年
春节去各地见见世面长长“脑子”这个春节,大多数打工人都卸下KPI返乡团聚。杭州一家名为镭萌科技的创业公司,却有一群特殊的“员工”在忙着长“脑子”
2026-02-21 08:11:00
建设一流创新生态 激发创新投资需求杭州日报讯 日前,浙江(杭州)知识产权创新产业园内,一场旨在连接技术与资本的专利产业化投融资专项对接活动火热举行
2026-02-21 08:11:00
新春佳节,浙江不少企业春节“不打烊”,抢订单、赶交付、跑海外,把年过在了车间里和海外展台前。走进宁波这家科技企业,工作人员正紧盯屏幕
2026-02-20 15:04:00
马年春节,杭城消费市场持续升温。一批全国首店、浙江首店、杭州首店密集登陆湖滨、武林、钱江新城、奥体等核心商圈,覆盖潮玩
2026-02-20 07:31:00
大年初三,杭州苏宁易购庆春路店暖意融融。大厅里“焕新幸福年”的红色标语格外醒目。店内客流平稳,多为全家同行的家庭顾客,虽不似年前拥挤
2026-02-20 08:01:00
“库迪咖啡竟然涨价了,9.9元的咖啡以后还能闭眼冲吗?”春节前最后一个工作日,东北姑娘小乔中午赶到杭州火车东站,准备坐高铁回老家
2026-02-20 08:01:00
潮声丨从“Made in”到“Design by”,浙江品牌出海记
新春,义乌老板们已经忙碌起来。这几天,24家义乌企业亮相2026年美国拉斯维加斯服装服饰及面料展,带着新品抢订单、拓市场
2026-02-19 16:24:00
新春走基层|“解码”潮玩盲盒:Z世代用情绪消费点亮团圆年
中青报·中青网记者沈杰群余冰玥李怡蒙见习记者蒋欣雨95后北京职员王之怡在新加坡休假时,特意去了环球影城附近的泡泡玛特,店内挤满了年轻人
2026-02-19 12:05:00