我们正处于一个信息大暴发的时代,每天都能产生数以百万计的新闻资讯!
虽然有大数据推荐,但面对海量数据,通过我们的调研发现,在一个小时的时间里,您通常无法真正有效地获取您感兴趣的资讯!
头条新闻资讯订阅,旨在帮助您收集感兴趣的资讯内容,并且在第一时间通知到您。可以有效节约您获取资讯的时间,避免错过一些关键信息。
Facebook的母公司MetaPlatforms今日发布了一种能够翻译和转录数十种语言的人工智能模型——SeamlessM4T,可以让说不同语言的人更有效地进行交流,为开发人类通用语言翻译器提供了助力。
Meta声称,SeamlessM4T将与新的翻译数据集SeamlessAlign一同开源,它代表了人工智能驱动的“语音到语音”和“语音到文本”领域的“重大突破”。
Meta表示,该模型可以在近100种语言之间进行文本到语音的翻译,并支持35种语言的完全语音到语音翻译,而此前要想实现类似的操作只能在单独的AI模型中分别进行翻译。SeamlessM4T支持:
1、近100种语言的语音识别。
2、近100种输入和输出语言的语音到文本翻译。
3、支持近100种输入语言和36种输出语言的语音到语音翻译。
4、支持近100种语言的文本到文本翻译。
5、支持近100种输入语言和35种输出语言的文本到语音翻译。
目前,Meta将以研究许可证的形式向公众免费提供该模型(仅限非商业用途),以便研究人员和开发人员在此基础上开展工作。
据介绍,Meta还将发布SeamlessAlign元数据,这是迄今为止最大的开放多模式翻译数据集,挖掘的语音和文本对齐总计达270000小时。
马克・扎克伯格表示,他坚信这些工具将促进来自全球各地的用户在元宇宙中的互动,这也是他对该公司未来的赌注所在。
他还表示,开放AI生态系统对Meta有利,因为该公司通过有效地将创建面向消费者的工具的任务众包来获得更多收益,而不是通过访问模型来收费。
据称,Meta后续还将把这些翻译和转录方面的AI进展整合到Facebook、Instagram、WhatsApp、Messenger和Threads中。
关于SeamlessM4T模型,Meta研究人员在一份研究论文中表示,他们从“爬取的网页数据的公开可用存储库中”收集了400万小时的“原始音频”,但IT之家没有找到具体是哪个存储库的说明,官方只提到文本数据来自去年创建的数据集,而该数据集来自于维基百科及相关网站提取的内容。
以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。
快照生成时间:2023-08-23 05:45:03
本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。
信息原文地址: