• 我的订阅
  • 科技

openai首席技术官:我们使用的是公开可用的数据和许可数据

类别:科技 发布时间:2024-03-19 02:42:00 来源:浅语科技

3月18日消息,OpenAI近期推出了炙手可热的文本转视频生成模型Sora,然而该公司首席技术官(CTO)MiraMurati在接受华尔街日报采访时却语焉不详,无法明确说明Sora的训练数据来源。

openai首席技术官:我们使用的是公开可用的数据和许可数据

在采访中,记者直接询问Murati关于Sora训练数据来源时,她仅以含糊的官方话术搪塞:“我们使用的是公开可用数据和许可数据。”

当记者追问具体来源是否包含YouTube视频时,Murati竟然表示“我实际上并不确定(I'mactuallynotsureaboutthat)”,并拒绝回答有关Instagram或Facebook视频是否被纳入训练集的问题。她辩称,如果这些视频是公开可用且可以使用的,那么可能会被使用,但她本人对此并不确定。

当记者询问OpenAI是否与其合作伙伴图片素材公司Shutterstock达成过数据训练方面的合作,Murati索性拒绝继续讨论数据来源话题。

Murati甚至回避记者关于OpenAI与图片素材巨头Shutterstock的数据合作,拒绝透露来自该平台的视频是否被用于训练Sora。最终,她干脆中止了相关讨论,坚称数据来源“肯定是公开可用或经过许可的”,却无法给出任何具体细节。

Murati这番闪烁其词的做法让OpenAI陷入尴尬境地。此前,该公司就因数据抓取行为引发广泛争议,甚至面临多起版权诉讼,其中就包括纽约时报的指控。如今,连CTO都无法说清其最热门模型的训练数据来源,难免让人怀疑OpenAI高层对该问题的重视程度。

据报道,采访结束后,Murati私下承认了确有使用Shutterstock视频训练Sora。然而,相较于网络上浩如烟海的视频内容,来自Shutterstock的素材可能只是Sora训练数据的一小部分。

IT之家注意到,Murati的讳莫如深引发了网友热议。不少人认为她缺乏坦诚,质疑其对自身产品的了解程度。有人直言,CTO竟然对如此关键的问题不知情,实在令人难以置信。

然而,也有人为Murati辩护,认为既然内容已经发布到网络,就应该允许人工智能公司加以利用。他们认为,用户既然选择公开内容,就应该承担被使用的风险。

Murati的回避行为究竟是为了防止更多版权纠纷,还是真的对数据来源一无所知,我们不得而知。但可以肯定的是,公众有权质疑这些“公开可用且经过许可”的AI训练数据究竟来自何处。未来,含糊其辞的官方说辞恐怕难以平息人们的疑虑。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-03-19 09:45:07

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

ChatGPT张口就来的“病”应该怎么“治”?
...义的。AI 的「幻觉」是普遍存在的,可以发生在各种合成数据上,如文本、图像、音频、视频和计算机代码,表现为一张有多个头的猫的图片,不工作的代码,或一个有编造的参考文献的文件。
2023-04-14 18:04:00
押注核能!微软决心喂大模型新“弹药”!
...r, SMR)和微反应器集成的技术评估,为微软云和 AI所在的数据中心提供动力。“这一岗位将为技术集成保持清晰且适应性强的路线图,认真选择和管理技术合作伙伴和解决方案,并不断
2023-09-28 11:06:00
对话百图生科首席AI科学家宋乐博士:“xTrimo”生命科学AI大模型,不应止于加速药物研发
...质结构预测模型ESMFold。同样,在百图生科看来,得益于数据、算力以及模型的快速发展,人工智能已经进入了大模型的黄金时代。尤其是生命科学领域积累了海量的数据,而这些数据需要
2023-03-15 09:26:00
...用ChatGPT补充得更完整。这个过程中产生了文本跟视频的数据集,数据集的质量、广度和体量都有明显提升。此外,Sora编码压缩也有所升级。“在新的技术架构升级下,Sora技术
2024-02-20 15:15:00
数据确权的队伍又壮大了 OpenAI与美联社签订授权协议
...。AI企业在训练所谓大语言模型的过程中,会用到大量的数据,例如新闻文章、社交媒体聊天和书籍等大量内容,这也引发新闻组织、书籍作者、社媒平台对版权受到侵犯感到不满。上个月底,超
2023-07-14 05:00:00
微软研究人员正在测试其他ai模型
...乏事实依据”的内容,这意味着AI模型改变了它所给定的数据或添油加醋描述了原本不存在的信息。当然,AI幻觉这种东西也不是所有时候都毫无用处,例如当用户希望AI帮自己写一个科幻故
2024-06-22 09:31:00
美AI巨头被控秘密“侵吞”数据
...自:科技日报繁荣背后存隐忧美AI巨头被控秘密“侵吞”数据对于科技公司来说,庞大的数据“肥料”是生成式AI的核心养分,也是大模型发展的必争之地。唯有足够的数据才能指导技术即时生
2024-04-17 03:27:00
日亏500万的OpenAI想搞钱了
...盒游戏结合AI会有无限可能,能帮助收集大量的人机交互数据,帮助GPT-5在虚拟世界进化。“如果OpenAI能创造出一款成功的游戏,让玩家基于自己的开放式目标而相互作用,这将成
2023-08-25 16:34:00
GPT-4o的识图能力有多牛?四大维度深度体验
...分为4大维度,分别为普通图像、特定专业领域的图像、数据图像和手写图像。一、普通图像识别(1)内容较为单一的图像记者首先选取了一张波士顿动力机器人跨越障碍物的图像,内容较为简单
2024-05-19 14:21:00
更多关于科技的资讯:
当行业从“技术叙事”走向“基础设施”:主线科技如何通过压力测试
如今,物流行业正在对自动驾驶进行一场无声的“验收”。过去几年间,自动驾驶卡车行业的主线任务是技术突破:传感器精度提升了多少
2026-03-25 08:50:00
第20届亚洲品牌盛典落幕:BrandTest助力品牌数字化新航程
近日,由专业品牌评价机构Asiabrand、亚洲数字发展银行联合发起,中国亚洲经济发展协会、“一带一路”总商会、东盟-中国工商总会等共同主办的“第20届亚洲品牌盛典”在香港隆重举行
2026-03-25 09:28:00
AI科技赋能智慧生活AWE2026双展区启幕 引领家电消费电子产业新变革
近日,上海新国际博览中心与东方枢纽国际商务合作区同步点亮“AWE2026”主题标识。作为全球三大家电及消费电子展之一,本届展会以“AI科技・慧享未来”为核心主题
2026-03-25 09:31:00
2026中关村论坛年会今日开幕
2026中关村论坛年会今起至29日在北京举办。本次年会以“科技创新与产业创新深度融合”为年度主题,设置论坛会议、成果发布
2026-03-25 10:20:00
一场AI盛宴,看懂龙虾生态,见证三大产品
今年初,一只被称为“龙虾”的OpenClaw在100天内就火爆了全网。它究竟是产品、生态,还是对技术路线的重新定义?火爆背后
2026-03-25 10:30:00
闲鱼重磅上线:5秒即可完成商品发布,还可AI辅助定价
3月25日,闲鱼正式发布重磅新产品——闲鱼AI相机。打开闲鱼AI相机,用户只需简单拍照,即可5秒实现对商品的一键上架;闲鱼还将通过AI对商品进行辅助定价
2026-03-25 10:34:00
用AI打通信息壁垒火炬成果转化大模型 在厦正式上线东南网3月25日讯(海峡导报记者 陈磊) 由厦门火炬高新区打造的“火炬成果转化大模型”近日正式上线
2026-03-25 10:16:00
最近在微信、抖音等各种网络媒体特别热门的软件OpenClaw,因其官方Logo是一只龙虾而被大家戏称为“龙虾”。不少朋友在手机上刷到相关分享
2026-03-25 08:05:00
从“展厅花瓶”到“可触摸的历史”杭州日报讯 近日,位于西湖区留下老街的林徽因展览馆靠着一块裸眼3D屏在杭城年轻人群体中“出圈”了
2026-03-25 07:58:00
杭州日报讯 3月的绍兴融杭数贸港(以下简称“数贸港”),春潮涌动,“出海”热潮持续升温。近日,两场面向外贸企业的专项活动接连在此举行——一场聚焦跨境电商业绩冲刺中期复盘
2026-03-25 06:57:00
王一凡 河南工业大学一、引言在数字经济快速发展的当下,金融服务正加速向数字化、网络化转型,农村金融生态也随之发生深刻变化
2026-03-25 07:11:00
国家数据局局长刘烈宏3月24日在国新办举行的新闻发布会上表示,到今年3月,我国日均词元(Token)调用量已超过140万亿
2026-03-25 07:30:00
能源结构的清洁低碳转型,让光伏产业成为推动绿色发展的重要力量,随着光伏电站装机规模的持续扩大,电站运维的重要性日益凸显
2026-03-25 07:42:00
近日,由湖南省动漫游戏协会、芒果TV主办的第二届“马栏山杯”小游戏创新创业大赛正式启动,作为本次大赛独家战略合作伙伴,世纪华通旗下盛趣游戏将深度参与赛事全流程
2026-03-25 07:49:00
杭州日报讯 近日,浙江海港物流集团下属浙江海港(中东)供应链管理有限公司(以下简称“海港中东”)首笔仓储业务顺利落地,正式投入运营
2026-03-25 06:57:00