• 我的订阅
  • 科技

Meta发布 AI 模型SeamlessM4T,可转录和翻译近100种语言|钛快讯

类别:科技 发布时间:2023-08-23 12:01:00 来源:钛媒体APP
Meta发布 AI 模型SeamlessM4T,可转录和翻译近100种语言|钛快讯

(图片来源@视觉中国)

钛媒体App获悉,当地时间8月22日,科技巨头Facebook母公司Meta 对外发布了一款最新人工智能(AI)翻译引擎SeamlessM4T,可以更轻松地跨文本语音翻译和转录近100种语言。

同时,Meta还公布了新的开源翻译数据集 SeamlessAlign,将44.3万小时的语音与文本、2.9万小时的语音转录数据进行对齐,教会SeamlessM4T如何将语音转录为文本、翻译文本、从文本生成语音。

Meta表示,SeamlessM4T将与SeamlessAlign一同开源。SeamlessM4T代表了 AI 技术驱动的“语音到语音”和“语音到文本”领域的“重大突破”。

Meta发布 AI 模型SeamlessM4T,可转录和翻译近100种语言|钛快讯

据悉,作为最早投资AI的大型科技企业之一,Meta于2013年成立了 AI 基础研究实验室,聘请了AI领域的顶级学者,有大量社交与元宇宙算法,推出Pytorch框架、Zion等软硬件产品。不过,虽然Meta在AI领域也取得了一些进展,但它落后于OpenAI、微软、谷歌等公司。

随着ChatGPT风靡全球,Meta AI团队正在加紧追赶,以及重新组合其关于语言、对话等领域与大模型相关的研究。

去年底之后,Meta陆续发布No Language Left Behind(不留语言)文本到文本的机器翻译模型,支持200种语言,以及开发多语言数据集SpeechMatrix、生成文本到声音的AudioCraft等。另外在今年7月,Meta还发布开源对话大模型Llama 2,引发广泛讨论和关注。

此次公布的SeamlessM4T,建立在Meta AI翻译模型的技术能力基础上,并重新设计Fairseq序列建模工具包,以创建更轻量级的模型和处理更多信息。Meta表示,SeamlessM4T从“爬取的网页数据的公开可用存储库中”收集了400万小时的“原始音频”,该模型可以在近100种语言之间进行文本到语音的翻译,并支持35种语言的完全语音到语音翻译。

对于安全性和脱敏性,Meta表示,在开发SeamlessM4T时,团队构建了一个可以识别敏感词系统,目标是能够过滤了训练数据中不平衡的数据信息,从而检测和输出正确的翻译内容。而且,Meta研究人员还尝试清理误译一些脏话的数据集,以便更准确地检测何时使用。

Meta研究科学家负责人Paco Guzman表示,SeamlessM4T的一大突破是它不依赖中间模型来产生结果,这使得它更加灵活,甚至支持动态更改语言。这将促进更多人使用其进行日程对话。

不过,Meta建议不要使用SeamlessM4T进行长篇翻译,政府专用的认证翻译,以及不鼓励出于医疗或法律目的部署该模型,原因或与专业领域的翻译准确度有关。科技网站《对话》(theconversation)最近表示,AI 翻译有许多缺陷,包括不同形式的性别错误和偏见、语音识别算法偏差等。

据报道称,Meta后续将把这些翻译和转录方面的 AI 进展,整合到Facebook、Instagram、WhatsApp、Messenger和Threads等产品当中。

(本文首发钛媒体App,作者|林志佳,编辑|马金男)返回搜狐,查看更多

责任编辑:

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-08-23 14:45:03

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

Meta推出“AI翻译官”!能翻译和转录近百种语言,已开源
智东西智东西8月23日报道,昨晚,Meta官宣AI大模型SeamlessM4T,该模型可翻译和转录近百种语言。SeamlessM4T能实现近百种语言的自动语音识别
2023-08-24 11:03:00
首个可保留情感的音频LLM!Meta重磅开源7B-Spirit LM,一网打尽「音频+文本」多模态任务
...元导读】Meta最近开源了一个7B尺寸的Spirit LM的多模态语言模型,能够理解和生成语音及文本,可以非常自然地在两种模式间转换,不仅能处理基本的语音转文本和文本转语音任
2024-11-23 09:43:00
让大模型能听会说,国内机构开源首个端到端语音对话模型Mini-Omni
...非与启元世界多模态负责人吴昌桥,研究兴趣为多模态大模型、LLM Agents 等。本论文上线几天内在 github 上斩获 1000+ 星标
2024-09-07 09:44:00
...人工智能研究论文称,研究人员研发出一个人工智能(AI)模型,能即时翻译多达101种语言的语音和文本,包括直接语音到语音翻译。这款名为SEAMLESSM4T的人工智能模型,填补
2025-01-16 22:36:00
...愚 编辑 | 邓咏仪美国时间6月16日,Meta正式发布语音生成模型Voicebox。据官网介绍,通过非自回归“流匹配”(Flow Matching)技术
2023-06-19 17:10:00
亚马逊开发史上最大文本转语音模型
...能研究团队宣布开发了一个据称是史上最大的文本转语音模型,该模型拥有最多的参数,并使用了最大的训练数据集。研究人员已经在arXiv预印本服务器上发表了一篇论文,详细描述了模型的
2024-02-18 12:49:00
Meta 发布全新 AI 模型 SeamlessM4T
...rms今日发布了一种能够翻译和转录数十种语言的人工智能模型——SeamlessM4T,可以让说不同语言的人更有效地进行交流
2023-08-22 23:33:00
一文看尽Meta开源大礼包!全面覆盖图像分割、语音、文本、表征、材料发现、密码安全性等
...【新智元导读】Meta最近开源了多个AI项目,包括图像分割模型SAM 2.1、多模态语言模型Spirit LM、自学评估器和改进的跨语言句子编码器Mexma等
2024-11-28 12:02:00
国产GPT大模型赛道中,如今迎来了一个“国家队”入局。钛媒体App获悉,6月3日,源自中科院自动化所的人工智能(AI)技术公司中科闻歌,发布安全可靠的企业级专属大模型雅意(YAY
2023-06-05 22:00:00
更多关于科技的资讯:
上海乐高乐园票价公布:成人最低价319元!
快科技4月2日消息,上海乐高乐园今天正式公布票价,上海乐高乐园度假区采用六级票价体系,该票价体系基于季节性客流预测,价格从255元到599元不等
2025-04-02 10:40:00
真我GT7官宣本月发布!首批搭载天机9400+
快科技4月2日消息,真我GT7今天正式官宣,将在本月发布。官方还强调“没有3nm,怎敢称性能旗舰”,而真我GT7将首批搭载联发科天机9400+旗舰芯片
2025-04-02 10:40:00
看!宇宙中最惊艳的“光之指环” 爱因斯坦做梦都想见到
快科技4月2日消息,爱因斯坦广义相对论预测的引力透镜效应,相信大家都有所耳闻,而在引力效应的实际体现中,最神秘、最美丽的形态
2025-04-02 11:10:00
欧洲最大廉价航拟购买C919:只要价格比空客便宜20% 就下单
快科技4月2日消息,据媒体报道,近日,欧洲廉航瑞安航空CEO 奥利里表示:“C919飞机只要价格够给力,比空客便宜10%-20%
2025-04-02 11:10:00
一加13T确认6开头电池!唯一一款6000mAh+小屏旗舰
快科技4月2日消息,一加13T日前已经正式官宣,将在本月正式发布,是一款小屏旗舰。今天李杰直接官方爆料:一加13T冰川电池容量6开头
2025-04-02 11:10:00
性价比更高!RTX 5080移动版实测:比RTX 5090移动版低15%
快科技4月2日消息,根据Notebookcheck的最新测试结果,RTX 5080移动版的性能,比RTX 5090移动版低约10%到15%
2025-04-02 11:10:00
全球首例!武汉团队给大脑画出精准“3D地图”
快科技4月2日消息,据报道,华中科技大学同济医学院附属协和医院叶哲伟教授、周弘博士团队与武汉衷华脑机融合科技发展有限公司联合发布了全球首例微米级脑机接口多模态三维图谱
2025-04-02 11:10:00
内蒙老牌科尔沁:风干牛肉4两20元抄底
天猫科尔沁食品旗舰店,科尔沁风干牛肉200g日常售价67元,今日下单3件可用141元冲量券,3袋1.2斤实付60元包邮
2025-04-02 11:10:00
50万内品价比最高SUV!零跑C10交付突破10万大关!3月交付超1.2万台
快科技4月2日消息,零跑汽车宣布零跑C10累计交付突破10万台,3月交付超1.2万台。此外,官方宣布即刻下定可享至高立省51680元
2025-04-02 11:10:00
京东又涨工资了:达达员工今年升至19薪 明年20薪 还送股票
快科技4月2日消息,京东又宣布涨工资了!今天,京东黑板报宣布,达达员工薪酬将在今年升级至19薪,明年升级至20薪。此外
2025-04-02 11:10:00
常思思助阵!生活在左广州塔水上大秀开启非遗时尚新纪元
Deepseek眼里的非遗广州是怎样的?木棉花映红天际时,广绣在绸缎上绽放出灵动的花鸟,醒狮的金毛在阳光下闪烁着威严的光芒
2025-04-02 11:11:00
对话元戎启行周光:“车位到车位”的智驾,依靠的是高精地图,是“缝合怪物”
出品 | 搜狐科技作者 | 梁昌均编辑 | 杨锦“大模型经历了从专家系统到通才系统,再到真正强专家系统的阶段,智驾、机器人也会经历同样阶段
2025-04-02 11:29:00
Walmart线上店铺销量前十品类有哪些
Walmart作为全球最大的零售商之一,其线上店铺同样在全球电商市场中占有重要地位。根据最新的市场数据和趋势分析,带大家了解一下Walmart线上店铺销量前十的品类
2025-04-02 11:33:00
《易达威学术微课堂》首期录制圆满启动!对话五大领域学者
2025年3月——由易达威学术出版社打造的公益栏目《易达威学术微课堂》正式进入录制阶段,首期特邀来自中山大学、陕西科技大学
2025-04-02 11:40:00
强脑科技携非侵入式脑机接口技术亮相交个朋友直播间
4月1日晚,杭州“六小龙”之一的强脑科技,携其领先的非侵入式脑机接口技术走进交个朋友直播间,与罗永浩探讨脑机科技的实际应用
2025-04-02 11:46:00