我们正处于一个信息大暴发的时代,每天都能产生数以百万计的新闻资讯!
虽然有大数据推荐,但面对海量数据,通过我们的调研发现,在一个小时的时间里,您通常无法真正有效地获取您感兴趣的资讯!
头条新闻资讯订阅,旨在帮助您收集感兴趣的资讯内容,并且在第一时间通知到您。可以有效节约您获取资讯的时间,避免错过一些关键信息。
3月18日消息,OpenAI近期推出了炙手可热的文本转视频生成模型Sora,然而该公司首席技术官(CTO)MiraMurati在接受华尔街日报采访时却语焉不详,无法明确说明Sora的训练数据来源。
在采访中,记者直接询问Murati关于Sora训练数据来源时,她仅以含糊的官方话术搪塞:“我们使用的是公开可用数据和许可数据。”
当记者追问具体来源是否包含YouTube视频时,Murati竟然表示“我实际上并不确定(I'mactuallynotsureaboutthat)”,并拒绝回答有关Instagram或Facebook视频是否被纳入训练集的问题。她辩称,如果这些视频是公开可用且可以使用的,那么可能会被使用,但她本人对此并不确定。
当记者询问OpenAI是否与其合作伙伴图片素材公司Shutterstock达成过数据训练方面的合作,Murati索性拒绝继续讨论数据来源话题。
Murati甚至回避记者关于OpenAI与图片素材巨头Shutterstock的数据合作,拒绝透露来自该平台的视频是否被用于训练Sora。最终,她干脆中止了相关讨论,坚称数据来源“肯定是公开可用或经过许可的”,却无法给出任何具体细节。
Murati这番闪烁其词的做法让OpenAI陷入尴尬境地。此前,该公司就因数据抓取行为引发广泛争议,甚至面临多起版权诉讼,其中就包括纽约时报的指控。如今,连CTO都无法说清其最热门模型的训练数据来源,难免让人怀疑OpenAI高层对该问题的重视程度。
据报道,采访结束后,Murati私下承认了确有使用Shutterstock视频训练Sora。然而,相较于网络上浩如烟海的视频内容,来自Shutterstock的素材可能只是Sora训练数据的一小部分。
IT之家注意到,Murati的讳莫如深引发了网友热议。不少人认为她缺乏坦诚,质疑其对自身产品的了解程度。有人直言,CTO竟然对如此关键的问题不知情,实在令人难以置信。
然而,也有人为Murati辩护,认为既然内容已经发布到网络,就应该允许人工智能公司加以利用。他们认为,用户既然选择公开内容,就应该承担被使用的风险。
Murati的回避行为究竟是为了防止更多版权纠纷,还是真的对数据来源一无所知,我们不得而知。但可以肯定的是,公众有权质疑这些“公开可用且经过许可”的AI训练数据究竟来自何处。未来,含糊其辞的官方说辞恐怕难以平息人们的疑虑。
以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。
快照生成时间:2024-03-19 09:45:07
本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。
信息原文地址: