• 我的订阅
  • 科技

“盗窃”而来的3000亿单词?ChatGPT摊上事了,遭索赔217亿元!

类别:科技 发布时间:2023-07-05 17:12:00 来源:CSDN

整理 | 郑丽媛

出品 | CSDN(ID:CSDNnews)

2016 年 10 月 19 日,英国剑桥大学理论物理学教授 Stephen Hawking 曾预言:“强大 AI 的崛起,可能将是人类遇到的最好的事情,也可能是最坏的事情。”

此后 7 年还不到,Stephen Hawking 教授的预言似乎就“成真”了:在近半年的 ChatGPT 热潮下,很多人看见了它的强悍和优势,但同时也有越来越多人开始担心 AI 时代下的隐私保护——于是,近来凭借 ChatGPT 和 GPT-4 风头正盛的 OpenAI 和微软,突然就被告了。

上周,16 位匿名人士决定起诉微软和 OpenAI,称这两家公司基于 ChatGPT 的 AI 产品在未获得同意或提供充分通知的情况下,收集并泄露了他们的个人信息,要求索赔 30 亿美元(约合人民币217亿元)。

“盗窃”而来的3000亿单词?ChatGPT摊上事了,遭索赔217亿元!

01 “盗窃”而来的 3000 亿单词?

根据这 16 人提交给加利福尼亚州旧金山联邦法院、长达 157 页的诉讼书显示,OpenAI 和微软被指控违反了《电子通讯隐私法》,即无视获取 AI 模型数据的合法途径,选择在不付费的情况下收集数据。

“尽管存在购买和使用个人信息的既定程序,但被告(OpenAI 和微软)还是采取了不同的方式:盗窃。”

在最初 ChatGPT 刚爆火的时候,OpenAI 就曾介绍过 ChatGPT 的强大功能,来自大规模预训练——它有 3000 亿单词的语料库预训练。但原告称,OpenAI 从互联网上的书籍、文章和发帖中所获取的 3000 亿字内容,远远超过其合理授权的范围。

具体来说,这 16 人指控 OpenAI 和微软通过其 AI 产品“收集、存储、跟踪、共享和披露”数百万人的个人信息,并且获得的信息范围很广,包括产品细节、账户信息、姓名、联系方式、登录凭证、电子邮件、支付信息、交易记录、浏览器数据、社交媒体信息、聊天日志、Cookie、搜索记录和其他在线活动等等。

原告坚称,在“从全球数百万毫无戒心的消费者那里非法收集个人资料”后,微软和 OpenAI 将其嵌入至他们的 AI 模型中,这才创造出了现在的 ChatGPT 等 AI 产品:

▶ “OpenAI 大规模使用窃取并盗用个人信息,以此创造了强大且利润丰厚的 AI 产品,并不顾风险地将其对外发布。”

▶ “OpenAl 的技术价值已高达到数百亿美元,而且其进入每一个公共和私营行业的范围还在继续迅速扩大。由于对被盗、盗用数据的培训,这些产品才达到了如今的复杂程度。”

除了指控 OpenAI “盗窃”数百万互联网用户的个人隐私,诉讼书中还强调了 OpenAI 和微软之间的密切合作关系:“微软对 OpenAl 持续投资,并在其多个平台上都引入了 ChatGPT,强调其与 OpenAl 合作的深度。通过这些投资,微软还获得了独家使用整个 OpenAI 代码库的权利。”

02很少提到 AI 的具体伤害案例

整整 157 页诉讼书中,引用了大量媒体报道和学术论文,反复强调了原告对 AI 模型发展下道德规范的担忧。不过据了解,其中并没有提到多少 AI 对人类的具体伤害案例。

例如,在提到 2019 年 OpenAI 重组为一家“有限营利企业”时,诉讼书表示 “OpenAI 放弃了最初的目标和原则,选择以牺牲隐私安全和道德为代价来追求利润”,并由此推断 OpenAI 加大了从互联网上“秘密获取”大量个人数据的力度,而不通知这些数据的所有者或用户。

此外,在指控 OpenAI 无视隐私法的同时,文件引用了 OpenAI 首席执行官 Sam Altman 的一句发言:“AI 很可能会导致世界末日,但与此同时,也会出现伟大的公司。”而基于这句话,诉讼书表示:“被告对隐私法的漠视,与他们对人类潜在灾难性风险的漠视不相上下。”

总体而言,在这份 157 页的诉讼书中,微软和 OpenAI 被指控违反了《电子隐私通信法》,即在没有获得授权的情况下使用私人信息以求牟利。同时,因为插件拦截互动数据,微软和 OpenAI 也违反了《计算机欺诈和滥用法》。

基于以上,考虑到被“盗取”数据的群体应该有数百万人,原告向微软和 OpenAI 提出了 30 亿美元的索赔。

03微软和 OpenAI 并未回应

截至目前,微软和 OpenAI 都没有对这份指控作出回应,而网友对于这起诉讼的讨论早已泛滥。

部分人对于 OpenAI 如何“窃取”并利用个人数据的方式感到好奇,外媒 Firstpost 解释道:“如果你在最近几十年里一直在网上活跃,你的数据就很可能被纳入 OpenAI 的数据集。因此,OpenAI 语言模型产生的任何输出,如果用于盈利,其中就可能包含通过无声搜刮而获得的你的数据片段。”

对此,起诉 OpenAI 的律师事务所方面也进行了补充:用户的个人数据“最初并不是打算给大型语言模型使用的”,所有信息都是 OpenAI 自己去大规模获取的。

至于这场诉讼的最终结果,目前来看应该并不确定。互联网的基础设施很复杂,在线平台与用户有自己的条款和协议,即使用户向这些平台贡献内容,数据所有权也通常属于平台本身而非用户。

对于这个说法,知识产权律师 Katherine Gardner 也是认同的:当用户将内容上传到社交媒体或任何其他网站时,他们通常会授予平台以各种方式使用其内容,因此普通用户可能很难要求因在训练模型中使用其数据而获得相应的补偿。

除此之外,也有不少网友打趣起了这 30 亿美元的索赔金额:

▶ “30 亿不够,怎么也得 80 亿美元,这样我们每个人都能拿到 1 美元!”

▶ “不行,我在网上写了 3 篇东西呢,得给我 3 美元才行!”

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-07-05 21:45:22

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

ChatGPT被起诉索赔30亿!
...为他们在未经允许的情况下使用并泄露了个人隐私数据,索赔金额高达30亿美元。紧接着,2位全职作者提出,OpenAI未经允许使用了他们的小说训练ChatGPT
2023-07-08 23:11:00
索赔 90 亿美元!Copilot 版权集体诉讼案新进展
...尔(JonTigar)本周四驳回了针对微软、OpenAI和GitHub的两项索赔要求,并要求原告修订其它大部分指控
2023-05-13 17:51:00
【科技早报】腾讯微信回应高校费率:沟通存在误解;美团20.65亿收购光年之外
...,有自媒体发布信息称“上海电气被印度诈骗88亿,反被索赔21亿”,对此,上海电气官网发布声明表示,相关报道严重歪曲事实。上海电气称,2008年,上海电气作为印度莎圣电站项目的
2023-06-30 11:01:00
微软更新服务协议以防止通过人工智能服务进行逆向工程和数据抓取
...以监控和防止滥用或有害的服务使用或输出。五、第三方索赔。你全权负责根据适用法律回应有关你使用AI服务的任何第三方索赔(包括但不限于版权侵权或与你使用AI服务期间内容输出相关的
2023-08-13 19:25:00
“美版贴吧”Reddit与OpenAI建立合作,股价涨11%
...新华社记者刘欣摄) 据法新社报道,虽然没有提及具体索赔金额,但《纽约时报》称,侵权行为可能造成“数以十亿美元计的法定和实际损失”。据报道,2023年爆火的AI让很多创意领域
2024-05-17 16:15:00
代码被微软等“抄袭”!程序员起诉两年终迎进展:22项主张仅剩两项
... Tigar作出裁决,再次支持被告方,驳回了原告方的大部分索赔要求,目前,仅剩下违反开源许可和违反合同的两项指控仍在审理中。原告方认为,Copilot在提供代码建议时,删除了
2024-07-12 19:43:00
动视遭《COD》电竞俱乐部起诉 索赔6.8亿美元
据insidergaming消息。美国动视公司因被指控垄断和对《使命召唤》电竞圈的“控制”而遭到OpTicGaming高层成员的起诉
2024-02-18 17:51:00
AI编程工具被起诉侵犯版权,微软、GitHub和OpenAI要求法院驳回
...,说该诉讼有两个本质缺陷:缺乏伤害和缺乏其他可行的索赔。OpenAI 同样说原告“未能提出对可识别的法律权利的侵犯”。这些公司认为,原告依靠“假设的事件”来提出他们的要求,并
2023-01-29 11:00:00
生成100万单词仅需18元、成本骤降90%,OpenAI掀起大模型“价格战”?
...GPT商业化,中国大模型厂商的压力又进一步加大。100万个单词花18元仅为原来1/10,定价不是看成本API是两个或多个计算机程序相互通信的一种方式,是一种软件接口,可以为其
2023-03-04 04:00:00
更多关于科技的资讯:
厦门网讯(厦门日报记者 翁华鸿 通讯员 林雨新)在近日举行的2025全球数据管理峰会“数据要素分论坛暨大数据统计与人工智能技术创新管理研讨会”上
2025-10-03 08:38:00
兴趣-实践-视野:达芬奇金奖少年带来的教育启示录
摘要:2025“你是达芬奇”全球青少年科学与艺术创新赛圆满落幕,其中金奖获奖少年的亲身实践告诉我们,在AI赋能的新时代
2025-10-02 16:22:00
单日调用近1万亿次,高德助力北斗规模化民用跨入新量级
2025年10月1日,随着国庆长假首日出行高峰的到来,高德基于北斗卫星导航系统的定位数量接近1万亿次,支撑导航总里程数超90亿公里
2025-10-02 22:31:00
10月1日,从太钢获悉,今年以来,太钢不锈进料加工团队以“精准备案、高效协同”为核心,在进料铬铁镍铁资源利用方面取得突破性进展
2025-10-02 17:39:00
厦门网讯(厦门日报记者 林露虹)记者昨日从中国移动咪咕公司获悉,该公司打造的“鼓浪屿AI伴游”服务已正式上线。市民和游客只需打开“鼓浪屿元宇宙”微信小程序
2025-10-02 08:57:00
“中国脑机谷”落户新奥新智感知产业园 政企研协同构建脑机接口产业新生态
河北新闻网讯(张新)9月26日,脑机接口产业联盟首届“脑机接口50人论坛”暨天津脑机接口产业创新发展推进会举办。会上,由新奥集团旗下的天津新智感知科技有限公司
2025-10-01 08:40:00
国网三明供电公司:守护灯火庆华诞 主动运维显担当
国网三明供电公司检修人员及时更换损坏器件并调整传动系统并完成设备修复及全套试验。(纪长添 摄)东南网10月1日讯 9月28日
2025-10-01 09:19:00
9月26日,由华东政法大学与上海星瀚律师事务所联合主办的第三届“星瀚杯”走进企业的法律课公益大赛正式启动。腾讯云作为大赛的技术支持单位
2025-10-01 09:56:00
平望实小承办吴江区骨干教师(数学)讲学团活动
为进一步发挥吴江区骨干教师的示范和辐射作用,推进课堂教学改革,有效提升教师教学业务能力。2025年9月24日,由苏州市吴江区教师发展中心主办的2025年吴江区骨干教师(数学)讲学团活动在平望实验小学举行
2025-10-01 09:58:00
AI技术让抗战文物“活起来”,人民日报数字传播联合百度推抗战文物智能体
9月30日,由人民日报数字传播与中国国家博物馆、中国人民大学、百度文心大模型、百度百科联合出品的《80年,80件》智能体和3D文物词条正式上线
2025-10-01 10:00:00
新时达2025工博会圆满落幕 | STEP 2.0战略引领智能制造新篇章
2025年9月23日至27日,第二十五届中国国际工业博览会在国家会展中心(上海)盛大举行。新时达以"智拓无界 共创未来"为主题
2025-10-01 10:00:00
从课堂到产线,河北工大学子开展智慧物流与“地狼”系统自动化技术实训
河北新闻网讯(胡广涛)组装调试机器人、体验智慧仓储系统、探索自动化技术前沿……近日,河北工业大学人工智能与数据科学学院2022级自动化专业全体学生在廊坊分校
2025-10-01 11:12:00
中国青年报客户端讯(中青报·中青网记者 夏瑾)9月30日,由湖州师范学院音乐学院、湖州市音声数据挖掘与智能服务重点实验室主办的“1617系列明代魏氏乐虚拟乐器音源”全球发布会在浙江省杭州市举办
2025-10-01 14:11:00
“智慧武当”给游客带来数字文旅新体验
十堰广电讯(通讯员 汪伟 周琼 耿宇)“一部手机游武当”预约购票、AI导游、《入境武当》VR大空间、问道武当数字客厅……国庆假日
2025-10-01 18:35:00
津云文旅电商版块上线 首发“笑漾海河”优选线路 扫码阅读手机版
10月1日,天津鹏欣水游城14周年庆暨津云新媒体“笑漾海河”文旅电商线路首发仪式成功举办。近年来,随着“文旅+电商”模式的快速发展
2025-10-01 18:55:00