• 我的订阅
  • 科技

Meta发布 AI 模型SeamlessM4T,可转录和翻译近100种语言|钛快讯

类别:科技 发布时间:2023-08-23 12:01:00 来源:钛媒体APP
Meta发布 AI 模型SeamlessM4T,可转录和翻译近100种语言|钛快讯

(图片来源@视觉中国)

钛媒体App获悉,当地时间8月22日,科技巨头Facebook母公司Meta 对外发布了一款最新人工智能(AI)翻译引擎SeamlessM4T,可以更轻松地跨文本语音翻译和转录近100种语言。

同时,Meta还公布了新的开源翻译数据集 SeamlessAlign,将44.3万小时的语音与文本、2.9万小时的语音转录数据进行对齐,教会SeamlessM4T如何将语音转录为文本、翻译文本、从文本生成语音。

Meta表示,SeamlessM4T将与SeamlessAlign一同开源。SeamlessM4T代表了 AI 技术驱动的“语音到语音”和“语音到文本”领域的“重大突破”。

Meta发布 AI 模型SeamlessM4T,可转录和翻译近100种语言|钛快讯

据悉,作为最早投资AI的大型科技企业之一,Meta于2013年成立了 AI 基础研究实验室,聘请了AI领域的顶级学者,有大量社交与元宇宙算法,推出Pytorch框架、Zion等软硬件产品。不过,虽然Meta在AI领域也取得了一些进展,但它落后于OpenAI、微软、谷歌等公司。

随着ChatGPT风靡全球,Meta AI团队正在加紧追赶,以及重新组合其关于语言、对话等领域与大模型相关的研究。

去年底之后,Meta陆续发布No Language Left Behind(不留语言)文本到文本的机器翻译模型,支持200种语言,以及开发多语言数据集SpeechMatrix、生成文本到声音的AudioCraft等。另外在今年7月,Meta还发布开源对话大模型Llama 2,引发广泛讨论和关注。

此次公布的SeamlessM4T,建立在Meta AI翻译模型的技术能力基础上,并重新设计Fairseq序列建模工具包,以创建更轻量级的模型和处理更多信息。Meta表示,SeamlessM4T从“爬取的网页数据的公开可用存储库中”收集了400万小时的“原始音频”,该模型可以在近100种语言之间进行文本到语音的翻译,并支持35种语言的完全语音到语音翻译。

对于安全性和脱敏性,Meta表示,在开发SeamlessM4T时,团队构建了一个可以识别敏感词系统,目标是能够过滤了训练数据中不平衡的数据信息,从而检测和输出正确的翻译内容。而且,Meta研究人员还尝试清理误译一些脏话的数据集,以便更准确地检测何时使用。

Meta研究科学家负责人Paco Guzman表示,SeamlessM4T的一大突破是它不依赖中间模型来产生结果,这使得它更加灵活,甚至支持动态更改语言。这将促进更多人使用其进行日程对话。

不过,Meta建议不要使用SeamlessM4T进行长篇翻译,政府专用的认证翻译,以及不鼓励出于医疗或法律目的部署该模型,原因或与专业领域的翻译准确度有关。科技网站《对话》(theconversation)最近表示,AI 翻译有许多缺陷,包括不同形式的性别错误和偏见、语音识别算法偏差等。

据报道称,Meta后续将把这些翻译和转录方面的 AI 进展,整合到Facebook、Instagram、WhatsApp、Messenger和Threads等产品当中。

(本文首发钛媒体App,作者|林志佳,编辑|马金男)返回搜狐,查看更多

责任编辑:

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-08-23 14:45:03

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

Meta推出“AI翻译官”!能翻译和转录近百种语言,已开源
智东西智东西8月23日报道,昨晚,Meta官宣AI大模型SeamlessM4T,该模型可翻译和转录近百种语言。SeamlessM4T能实现近百种语言的自动语音识别
2023-08-24 11:03:00
首个可保留情感的音频LLM!Meta重磅开源7B-Spirit LM,一网打尽「音频+文本」多模态任务
...元导读】Meta最近开源了一个7B尺寸的Spirit LM的多模态语言模型,能够理解和生成语音及文本,可以非常自然地在两种模式间转换,不仅能处理基本的语音转文本和文本转语音任
2024-11-23 09:43:00
让大模型能听会说,国内机构开源首个端到端语音对话模型Mini-Omni
...非与启元世界多模态负责人吴昌桥,研究兴趣为多模态大模型、LLM Agents 等。本论文上线几天内在 github 上斩获 1000+ 星标
2024-09-07 09:44:00
...人工智能研究论文称,研究人员研发出一个人工智能(AI)模型,能即时翻译多达101种语言的语音和文本,包括直接语音到语音翻译。这款名为SEAMLESSM4T的人工智能模型,填补
2025-01-16 22:36:00
Meta发布生成式AI语音模型Voicebox,精通六种语言,支持多种语音功能 | 最前线
...愚 编辑 | 邓咏仪美国时间6月16日,Meta正式发布语音生成模型Voicebox。据官网介绍,通过非自回归“流匹配”(Flow Matching)技术
2023-06-19 17:10:00
亚马逊开发史上最大文本转语音模型
...能研究团队宣布开发了一个据称是史上最大的文本转语音模型,该模型拥有最多的参数,并使用了最大的训练数据集。研究人员已经在arXiv预印本服务器上发表了一篇论文,详细描述了模型的
2024-02-18 12:49:00
Meta 发布全新 AI 模型 SeamlessM4T
...rms今日发布了一种能够翻译和转录数十种语言的人工智能模型——SeamlessM4T,可以让说不同语言的人更有效地进行交流
2023-08-22 23:33:00
一文看尽Meta开源大礼包!全面覆盖图像分割、语音、文本、表征、材料发现、密码安全性等
...【新智元导读】Meta最近开源了多个AI项目,包括图像分割模型SAM 2.1、多模态语言模型Spirit LM、自学评估器和改进的跨语言句子编码器Mexma等
2024-11-28 12:02:00
中科闻歌发布自研雅意大模型,支持离线、联网和私域部署|钛快讯
国产GPT大模型赛道中,如今迎来了一个“国家队”入局。钛媒体App获悉,6月3日,源自中科院自动化所的人工智能(AI)技术公司中科闻歌,发布安全可靠的企业级专属大模型雅意(YAY
2023-06-05 22:00:00
更多关于科技的资讯:
三联家电章丘世茂店盛大开业:抢抓“春日经济”,助力市民“焕新家”
鲁网3月13日讯春风送暖,万象更新。在这生机盎然的春日里,三联家电章丘世茂店于3月13日盛大开业。正值“春日经济”消费热潮
2026-03-13 17:40:00
一场对话 “对”出了什么?
鲁网3月13日讯“我们依托 AI 工具实现了内容快速生产,但算力成本高、高端人才缺,政策层面有什么支持?”“有支持的,我们推出了‘算力券’政策
2026-03-13 18:14:00
新华保险河北分公司以高品质服务守护千家万户
近年来,新华保险河北分公司持续推动服务升级,以高品质服务守护千家万户。在今年3·15国际消费者权益日到来之际,新华保险河北分公司党委书记
2026-03-13 20:25:00
中新经纬3月13日电 据国家金融监管总局13日消息,近日,针对互联网助贷业务问题,金融监管总局对分期乐、奇富借条、你我贷借款
2026-03-13 21:29:00
马嘉良 河北公安警察职业学院摘要:自动驾驶技术的演进对传统静态交通管理体系提出了适应性变革要求,为保障混合交通流的安全与效率
2026-03-13 21:36:00
邹宇摘要:随着电子商务平台和移动互联网的发展,消费者在网络环境中的行为逐渐被记录并形成大规模数据资源,为利用统计方法研究消费者购买行为提供了新的数据集
2026-03-13 21:36:00
行业唯一控轴专利!海尔发布中科桌面大路灯Z5 Max,定义护眼新标杆
当前,消费者愈发重视用眼健康,尤其是青少年用眼问题,带动了护眼灯消费。京东去年1-8月数据显示,“护眼灯”类目搜索同比增长42%
2026-03-13 21:49:00
第4届国际文创新品及潮玩(上海)展览会开幕 AI玩具成新风口
3月12日,第4届国际文创新品及潮玩(上海)展览会、第13届上海国际IP授权产业博览会在上海新国际博览中心开幕。本届展会为期3天
2026-03-13 22:19:00
2026年英语口语练习APP推荐!星空外语帮你攻克雅思口语,畅享英语自由!
在雅思考试里,口语是许多考生感到头疼的科目。要在口语部分取得高分并非易事,它要求考生具备扎实的语言基础、流利的表达能力和灵活的应变思维
2026-03-13 21:52:00
海尔AI智能锁Q600Pro斩获AWE艾普兰“创新奖”
3月12日,2026年中国家电及消费电子博览会(AWE2026)在上海启幕,全球最夯的智能家电与智慧生活解决方案悉数亮相
2026-03-13 21:48:00
中国网3月13日讯电 据市场监管总局网站消息,近日,市场监管总局印发《关于强化广告中提示性用语监管工作的通知》(以下简称《通知》)
2026-03-13 19:05:00
近日,国家药监局批准了博睿康医疗科技(上海)有限公司植入式脑机接口手部运动功能代偿系统创新产品注册申请,实现脑机接口医疗器械全球首发上市
2026-03-13 19:45:00
3月12日,在2026年中国家电及消费电子博览会(AWE)上,矿业智能化成为展会关注的焦点之一。一家名为“深脉控股”的企业展示了其通过人工智能技术介入矿产资源勘探与开发的全链条解决方案
2026-03-13 19:46:00
京东自营家装全新亮相 用AI把智能化“好房子”带给更多家庭
3月13日,京东全新发布AI智慧家装品牌——京东家装,通过自营模式入场重新定义家装新标准,并以 AI及超级供应链能力驱动家装行业智能化与标准化升级
2026-03-13 19:46:00
从智能出行到智能家电,探路生态携智能空间全栈产品矩阵亮相AWE
AWE2026上,全球智能空间科技品牌探路首次以覆盖三维立体出行、户外移动空间、生活智能家电与智能空间系统四大方向的全生态阵容亮相
2026-03-13 14:21:00