• 我的订阅
  • 科技

Meta发布 AI 模型SeamlessM4T,可转录和翻译近100种语言|钛快讯

类别:科技 发布时间:2023-08-23 12:01:00 来源:钛媒体APP
Meta发布 AI 模型SeamlessM4T,可转录和翻译近100种语言|钛快讯

(图片来源@视觉中国)

钛媒体App获悉,当地时间8月22日,科技巨头Facebook母公司Meta 对外发布了一款最新人工智能(AI)翻译引擎SeamlessM4T,可以更轻松地跨文本语音翻译和转录近100种语言。

同时,Meta还公布了新的开源翻译数据集 SeamlessAlign,将44.3万小时的语音与文本、2.9万小时的语音转录数据进行对齐,教会SeamlessM4T如何将语音转录为文本、翻译文本、从文本生成语音。

Meta表示,SeamlessM4T将与SeamlessAlign一同开源。SeamlessM4T代表了 AI 技术驱动的“语音到语音”和“语音到文本”领域的“重大突破”。

Meta发布 AI 模型SeamlessM4T,可转录和翻译近100种语言|钛快讯

据悉,作为最早投资AI的大型科技企业之一,Meta于2013年成立了 AI 基础研究实验室,聘请了AI领域的顶级学者,有大量社交与元宇宙算法,推出Pytorch框架、Zion等软硬件产品。不过,虽然Meta在AI领域也取得了一些进展,但它落后于OpenAI、微软、谷歌等公司。

随着ChatGPT风靡全球,Meta AI团队正在加紧追赶,以及重新组合其关于语言、对话等领域与大模型相关的研究。

去年底之后,Meta陆续发布No Language Left Behind(不留语言)文本到文本的机器翻译模型,支持200种语言,以及开发多语言数据集SpeechMatrix、生成文本到声音的AudioCraft等。另外在今年7月,Meta还发布开源对话大模型Llama 2,引发广泛讨论和关注。

此次公布的SeamlessM4T,建立在Meta AI翻译模型的技术能力基础上,并重新设计Fairseq序列建模工具包,以创建更轻量级的模型和处理更多信息。Meta表示,SeamlessM4T从“爬取的网页数据的公开可用存储库中”收集了400万小时的“原始音频”,该模型可以在近100种语言之间进行文本到语音的翻译,并支持35种语言的完全语音到语音翻译。

对于安全性和脱敏性,Meta表示,在开发SeamlessM4T时,团队构建了一个可以识别敏感词系统,目标是能够过滤了训练数据中不平衡的数据信息,从而检测和输出正确的翻译内容。而且,Meta研究人员还尝试清理误译一些脏话的数据集,以便更准确地检测何时使用。

Meta研究科学家负责人Paco Guzman表示,SeamlessM4T的一大突破是它不依赖中间模型来产生结果,这使得它更加灵活,甚至支持动态更改语言。这将促进更多人使用其进行日程对话。

不过,Meta建议不要使用SeamlessM4T进行长篇翻译,政府专用的认证翻译,以及不鼓励出于医疗或法律目的部署该模型,原因或与专业领域的翻译准确度有关。科技网站《对话》(theconversation)最近表示,AI 翻译有许多缺陷,包括不同形式的性别错误和偏见、语音识别算法偏差等。

据报道称,Meta后续将把这些翻译和转录方面的 AI 进展,整合到Facebook、Instagram、WhatsApp、Messenger和Threads等产品当中。

(本文首发钛媒体App,作者|林志佳,编辑|马金男)返回搜狐,查看更多

责任编辑:

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-08-23 14:45:03

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

Meta推出“AI翻译官”!能翻译和转录近百种语言,已开源
智东西智东西8月23日报道,昨晚,Meta官宣AI大模型SeamlessM4T,该模型可翻译和转录近百种语言。SeamlessM4T能实现近百种语言的自动语音识别
2023-08-24 11:03:00
首个可保留情感的音频LLM!Meta重磅开源7B-Spirit LM,一网打尽「音频+文本」多模态任务
...元导读】Meta最近开源了一个7B尺寸的Spirit LM的多模态语言模型,能够理解和生成语音及文本,可以非常自然地在两种模式间转换,不仅能处理基本的语音转文本和文本转语音任
2024-11-23 09:43:00
让大模型能听会说,国内机构开源首个端到端语音对话模型Mini-Omni
...非与启元世界多模态负责人吴昌桥,研究兴趣为多模态大模型、LLM Agents 等。本论文上线几天内在 github 上斩获 1000+ 星标
2024-09-07 09:44:00
...人工智能研究论文称,研究人员研发出一个人工智能(AI)模型,能即时翻译多达101种语言的语音和文本,包括直接语音到语音翻译。这款名为SEAMLESSM4T的人工智能模型,填补
2025-01-16 22:36:00
Meta发布生成式AI语音模型Voicebox,精通六种语言,支持多种语音功能 | 最前线
...愚 编辑 | 邓咏仪美国时间6月16日,Meta正式发布语音生成模型Voicebox。据官网介绍,通过非自回归“流匹配”(Flow Matching)技术
2023-06-19 17:10:00
亚马逊开发史上最大文本转语音模型
...能研究团队宣布开发了一个据称是史上最大的文本转语音模型,该模型拥有最多的参数,并使用了最大的训练数据集。研究人员已经在arXiv预印本服务器上发表了一篇论文,详细描述了模型的
2024-02-18 12:49:00
Meta 发布全新 AI 模型 SeamlessM4T
...rms今日发布了一种能够翻译和转录数十种语言的人工智能模型——SeamlessM4T,可以让说不同语言的人更有效地进行交流
2023-08-22 23:33:00
一文看尽Meta开源大礼包!全面覆盖图像分割、语音、文本、表征、材料发现、密码安全性等
...【新智元导读】Meta最近开源了多个AI项目,包括图像分割模型SAM 2.1、多模态语言模型Spirit LM、自学评估器和改进的跨语言句子编码器Mexma等
2024-11-28 12:02:00
中科闻歌发布自研雅意大模型,支持离线、联网和私域部署|钛快讯
国产GPT大模型赛道中,如今迎来了一个“国家队”入局。钛媒体App获悉,6月3日,源自中科院自动化所的人工智能(AI)技术公司中科闻歌,发布安全可靠的企业级专属大模型雅意(YAY
2023-06-05 22:00:00
更多关于科技的资讯:
GMT for Kids七赴进博会,以科技创新构筑儿童护脊新高度
2025年11月5日,第八届中国国际进口博览会(以下简称"进博会")在上海隆重举行。作为全球首个以进口为主题的国家级展会
2025-11-10 14:09:00
近日,2025年广东省职工职业技能竞赛暨“羊城工匠杯”生成式人工智能系统应用员大赛决赛在广州拉开帷幕。在这场人工智能系统应用领域的巅峰对决中
2025-11-10 14:40:00
2025中国企业全球形象高峰论坛| 完美世界总编辑伊迪:中国文化“出海” 要与世界文明“相融”
大皖新闻讯 完美世界集团是全球领先的文化娱乐产业集团,涵盖影视、游戏、电竞等板块,旗下产品遍布美、欧、亚等全球100多个国家和地区
2025-11-10 15:14:00
近日,民生银行石狮支行通过开展上门为企业客户办理开户的专项服务,将高效便捷的对公账户服务直接送到企业身边,以实际行动诠释了“诚信专业
2025-11-10 15:36:00
2025中国企业全球形象高峰论坛|小红书副总裁许磊:企业形象不仅是产品特征的物理展示
大皖新闻讯 2025年初,随着一大批海外用户的涌入,“小红书”成为沟通中国与国外网民的绝佳窗口。那么,在当前中国企业扬帆出海的背景下
2025-11-10 15:50:00
折叠屏购物新突破 荣耀x淘宝联合推出购物比价功能
随着消费电子大屏化趋势的深化,国内大屏设备市场出货量连续快速增长,折叠屏已成为市场增长的核心引擎。恰逢双十一,“如何选到高性价比的商品”是消费者的核心需求
2025-11-10 16:57:00
随着毕业季的临近,众多广州高校的应届生面临着一个共同的课题:如何选择一家既符合个人职业发展,又具备长远成长潜力的优质企业
2025-11-10 16:57:00
力纳克荣膺EcoVadis可持续发展铜牌评级,跻身全球前35%阵营
近日,全球电动推杆系统领域的头部企业——丹麦力纳克(LINAK)正式宣布,于2025年5月荣获国际公认的企业可持续发展评估机构EcoVadis授予的铜牌评级
2025-11-10 16:57:00
双十一营销大战来袭!号百公司获客宝三大核心服务让中小商户生意更轻松
年底聚餐、亲友小聚、婚庆喜宴……当全网聚焦线上大促时,线下“3公里生活圈”也已进入消费旺季。对于沿街中小商户来说,这正是抢占本地流量的黄金窗口期
2025-11-10 16:58:00
2025华为鸿蒙智家深圳启幕,任鑫朦女士助力智能家居设计创新
2025年9月2日,2025华为鸿蒙智家设计大赛·深圳站开幕礼于鹏瑞莱佛士酒店云颂音乐厅盛大启幕。本次活动以“智美融合
2025-11-10 16:58:00
亚洲策略孵化SAC,AI进入去中心化时代,重写智能的信任边界
在AI成为全球竞争焦点的当下,一个新的问题正在被频繁提起——如果人工智能成为基础设施,谁来为它背书?从算法的透明度到数据的归属权
2025-11-10 17:00:00
2025年天猫双11落下关键节点,星图数据显示截至10月31日,全网大促累计销售额达10026亿元,天猫仍居综合电商平台榜首
2025-11-10 17:00:00
阿克人类营养:进博会“老面孔”,为中国消费者健康注入“海洋动能”
随着社会对健康老龄化的关注持续升温,如何通过科学营养手段维护心脑健康、保持行动能力,正成为社会普遍关注的健康议题。在第八届中国国际进口博览会上
2025-11-10 17:01:00
同行三十载,进博会全勤生高通与中国伙伴共赴智能计算新未来
大河网讯(记者 赵汉青)11月5日至10日,第八届中国国际进口博览会在上海成功举办,上百家跨国企业携前沿技术与创新成果参与展会
2025-11-10 19:18:00
河北建材职业技术学院受邀为天秦装备开展AI办公培训
河北新闻网讯 10月31日,河北建材职业技术学院信息工程系大数据应用专业群带头人肖宇鹏老师受邀走进秦皇岛天秦装备制造股份有限公司
2025-11-10 19:33:00