我们正处于一个信息大暴发的时代,每天都能产生数以百万计的新闻资讯!
虽然有大数据推荐,但面对海量数据,通过我们的调研发现,在一个小时的时间里,您通常无法真正有效地获取您感兴趣的资讯!
头条新闻资讯订阅,旨在帮助您收集感兴趣的资讯内容,并且在第一时间通知到您。可以有效节约您获取资讯的时间,避免错过一些关键信息。
据凤凰网科技报道,在生成式AI竞争中处于落后的字节跳动想要“抄近道”,该公司一直在秘密使用OpenAI的技术开发自家大语言模型,这违反了OpenAI的服务条款。目前,字节跳动的账户已被OpenAI暂停。
据媒体报道,在AI领域,字节跳动的这一做法通常被视为一种“失礼”行为,也直接违反了OpenAI的服务条款。
OpenAI的服务条款规定,该公司所输出的模型不能被用于“开发任何与我们的产品和服务竞争的AI模型”。字节跳动通过微软购买了OpenAI的访问权限,但是微软也制定了与OpenAI同样的政策。
有媒体获得的字节跳动内部文件证实,字节跳动在几乎每个开发阶段都依赖OpenAI的应用程序接口(API)来开发其代号为“种子计划”(ProjectSeed)的基础大语言模型,包括训练和评估模型。参与“种子计划”的员工都深知这一行为的不良影响。
根据字节跳动员工在内部通讯平台飞书海外版Lark的聊天记录,他们讨论了如何通过“数据脱敏”来粉饰证据。
据媒体报道,字节跳动员工大量使用OpenAI的技术,以至于“种子计划”的员工经常达到OpenAIAPI的最大访问上限。
内部文件显示,字节跳动更多的是在“种子计划”的早期阶段使用OpenAI的技术。
几个月前,该公司命令该团队在“模型开发的任何阶段”停止使用GPT生成的文本。大约在这个时候,该公司获得了批准发布了自家AI大模型“豆包”,从而让“种子计划”上线。
但是,字节跳动继续以违反OpenAI和微软服务条款的方式使用API,包括评估豆包背后模型的性能。
一位对字节跳动内部情况有第一手了解的人指出,“他们说他们想确保一切都是合法的,但他们实际上只是不想被抓住把柄”。
字节跳动发言人约迪・赛斯(JodiSeth)对此回应称,GPT生成的数据在“种子计划”的早期开发中用于注解模型,并且在今年年中左右的时候已从字节跳动的训练数据中删除。“
字节跳动获得了微软的许可能够使用GPTAPI。我们使用GPT驱动非中国市场的产品和功能,但使用我们自主开发的模型驱动豆包。豆包只在中国提供。”赛斯在声明中称。
OpenAI发言人尼克・菲利克斯(NikoFelix)发表声明,确认字节跳动的账户已被暂停。“所有API客户必须遵守我们的使用政策,以确保我们的技术被用于好的一面。虽然字节跳动很少使用我们的API,但我们在进一步调查期间已暂停了他们的帐户。如果我们发现他们的使用不符合公司政策,我们将要求他们做出必要的改变或终止他们的账户。”菲利克斯表示。
微软发言人弗兰克・肖(FrankShaw)在一份声明中表示:“AzureOpenAI服务等微软AI解决方案属于我们有限访问框架的一部分,这意味着所有客户都必须申请并获得微软的批准才能访问。我们还制定了标准并提供资源,帮助我们的客户负责任地使用这些技术,并遵守我们的服务条款。我们还制定了发现滥用行为的流程,并在企业违反我们的行为准则时停止他们的访问。”
而在今日下午,字节跳动相关负责人再度回应称,公司在使用OpenAI相关服务时,强调要遵守其使用条款。我们也正与OpenAI联系沟通,以澄清外部报道可能引发的误解。
IT之家附字节跳动使用OpenAI服务相关情况的介绍:
1、今年年初,当技术团队刚开始进行大模型的初期探索时,有部分工程师将GPT的API服务应用于较小模型的实验性项目研究中。该模型仅为测试,没有计划上线,也从未对外使用。在4月公司引入GPTAPI调用规范检查后,这种做法已经停止。
2、早在今年4月,字节大模型团队已经提出了明确的内部要求,不得将GPT模型生成的数据添加到字节大模型的训练数据集,并培训工程师团队在使用GPT时遵守服务条款。
3、9月,公司内部又进行了一轮检查,采取措施进一步保证对GPT的API调用符合规范要求。例如分批次抽样模型训练数据与GPT的相似度,避免数据标注人员私自使用GPT。
4、未来几天里,我们会再次全面检查,以确保严格遵守相关服务的使用条款。
以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。
快照生成时间:2023-12-18 00:45:31
本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。
信息原文地址: