• 我的订阅
  • 头条热搜
Meta发布 AI 模型SeamlessM4T,可转录和翻译近100种语言|钛快讯
(图片来源@视觉中国)钛媒体App获悉,当地时间8月22日,科技巨头Facebook母公司Meta 对外发布了一款最新人工智能(AI)翻译引擎SeamlessM4T,可以更轻松地跨文本语音翻译和转录近100种语言。同时,Meta还公布了新的开源翻译数据...……更多
Meta推出“AI翻译官”!能翻译和转录近百种语言,已开源
智东西智东西8月23日报道,昨晚,Meta官宣AI大模型SeamlessM4T,该模型可翻译和转录近百种语言。SeamlessM4T能实现近百种语言的自动语音识别、语音到文本翻译,以及近百种输入语言和35种输出语言的语音翻译、文本转语音翻译。...……更多
首个可保留情感的音频LLM!Meta重磅开源7B-Spirit LM,一网打尽「音频+文本」多模态任务
...元导读】Meta最近开源了一个7B尺寸的Spirit LM的多模态语言模型,能够理解和生成语音及文本,可以非常自然地在两种模式间转换,不仅能处理基本的语音转文本和文本转语音任务,还能捕捉和再现语音中的情感和风格。在纯文本...……更多
让大模型能听会说,国内机构开源首个端到端语音对话模型Mini-Omni
...非与启元世界多模态负责人吴昌桥,研究兴趣为多模态大模型、LLM Agents 等。本论文上线几天内在 github 上斩获 1000+ 星标。随着多类型大模型的飞速发展,全球 AI 已经进入到了多模交互时代。2024 年 5 月,OpenAI 推出了全新的多模...……更多
...人工智能研究论文称,研究人员研发出一个人工智能(AI)模型,能即时翻译多达101种语言的语音和文本,包括直接语音到语音翻译。这款名为SEAMLESSM4T的人工智能模型,填补了语言覆盖方面的空白,并且性能优于现有的系统。研究...……更多
Meta发布生成式AI语音模型Voicebox,精通六种语言,支持多种语音功能 | 最前线
...愚 编辑 | 邓咏仪美国时间6月16日,Meta正式发布语音生成模型Voicebox。据官网介绍,通过非自回归“流匹配”(Flow Matching)技术,研究人员无需手动标记不同数据,即可利用长达5万小时的语言和有声书文本训练Voicebox。Voicebox生...……更多
亚马逊开发史上最大文本转语音模型
...能研究团队宣布开发了一个据称是史上最大的文本转语音模型,该模型拥有最多的参数,并使用了最大的训练数据集。研究人员已经在arXiv预印本服务器上发表了一篇论文,详细描述了模型的开发和训练过程。近年来,像ChatGPT这...……更多
Meta 发布全新 AI 模型 SeamlessM4T
...rms今日发布了一种能够翻译和转录数十种语言的人工智能模型——SeamlessM4T,可以让说不同语言的人更有效地进行交流,为开发人类通用语言翻译器提供了助力。Meta声称,SeamlessM4T将与新的翻译数据集SeamlessAlign一同开源,它代表...……更多
一文看尽Meta开源大礼包!全面覆盖图像分割、语音、文本、表征、材料发现、密码安全性等
...【新智元导读】Meta最近开源了多个AI项目,包括图像分割模型SAM 2.1、多模态语言模型Spirit LM、自学评估器和改进的跨语言句子编码器Mexma等,提升了AI在图像处理和语音识别领域的能力,进一步推动了AI研究的进展。开源绝对是AI...……更多
中科闻歌发布自研雅意大模型,支持离线、联网和私域部署|钛快讯
国产GPT大模型赛道中,如今迎来了一个“国家队”入局。钛媒体App获悉,6月3日,源自中科院自动化所的人工智能(AI)技术公司中科闻歌,发布安全可靠的企业级专属大模型雅意(YAYi)大模型,具备5大核心能力,包括实时联...……更多
仅用4块GPU、不到3天训练出开源版GPT-4o,这是国内团队最新研究
...4o 的平均音频响应延迟 320ms。以 ChatGPT 为代表的大型语言模型(LLM)已成为强大的通用任务解决器,但大多数 LLM 仅支持基于文本的交互,这限制了它们在不适合文本输入输出的场景中的应用。GPT-4o 的出现使得通过语音与 LLM 进...……更多
→国常会审议通过《关于深入实施“人工智能+”行动的意见》7月31日召开的国务院常务会议,审议通过《关于深入实施“人工智能+”行动的意见》。会议指出,当前人工智能技术加速迭代演进,要深入实施“人工智能+”行动...……更多
谷歌发布Translatotron 3 模型
...今天发布新闻稿,正式介绍推出了名为Translatotron3的新AI模型,无需任何并行语音数据下,可以实现语音对语音的同声传译翻译。谷歌于2019年推出了TranslatotronS2ST系统,于2021年7月推出第2个版本,在2023年5月27日发布的一篇论文中...……更多
...日宣布,其已经扩展了平台服务,推出了新的文本转语音模型“ElevenMultilingualv2”。这款新模型能够自动识别28种语言,并将文本转换为语音。这一扩展标志着该平台正式完成了测试阶段,可以为企业和个人提供服务。ElevenLabs使...……更多
首个VR端3D角色扮演AI发布!南洋理工公开SOLAMI技术报告,端到端VLA模型驱动,唱跳都能陪你玩
...进行沉浸式互动。该系统利用先进的社交视觉-语言-行为模型,结合合成的数据集,提供更自然的交流体验,超越了传统的文本和语音交互。世界上第一个VR端 3D版的角色扮演AI就在刚刚诞生了!AI角色扮演类游戏(如C.AI、Talkie)...……更多
2022生成模型进展有多快,新论文盘点9类生成模型代表作
ChatGPT的出现,彻底将生成AI推向爆发。但别忘了,AI生成模型可不止ChatGPT一个,光是基于文本输入的就有7种——图像、视频、代码、3D模型、音频、文本、科学知识……尤其2022年,效果好的AI生成模型层出不穷,又以OpenAI、Meta...……更多
标贝科技GPT语音助手测评:看语音大模型如何重塑语音交互体验
...步,语音助手已经融入了我们生活的方方面面。同时在大模型落地千行百业的大潮之下,语音助手也快速卷入AI革命的浪潮中。GPT大模型作为一种强大的语言生成模型,通过语言理解、生成能力和上下文记忆能力,不断地自我完...……更多
openai语音翻译又出新功能了!
...喜欢的声音。 这项新的语音功能由一个新的文本到语音模型支持,能够在短时间内从纯文本生成与人类相似的音频。团队与专业配音演员合作,为每种声音创设独特的音调。同时,他们使用了自己的开源语音识别系统Whisper,将...……更多
语音克隆达到人类水平,微软全新VALL-E 2模型让DeepFake堪比配音员
【新智元导读】继去年初的第一代VALL-E模型之后,微软最近又上新了VALL-E 2模型,标志着第一个在合成语音稳健性、相似度、自然程度等方面达到人类水平的文本到语音模型。最近,微软发布了零样本的文本到语音(TTS)模型VAL...……更多
刚刚,我们感受了一波最「像人」的国产AI,模型还是开源的
...EglhJA与此同时,智谱还重磅宣布,该功能背后的情感语音模型 GLM-4-Voice 同步正式开源。不久后,相关能力还将上线视频通话,为所有用户提供一个既能「看」又能「说」的 AI 语音助理。开源地址:https://github.com/THUDM/GLM-4-Voice自...……更多
刚刚,重磅发布!阿里、腾讯、科大讯飞在列
...首批公开的算法备案清单。值得注意的是,此次名单中大模型算法并不多,除了百度PLATO大模型算法和讯飞星火认知大模型算法之外,阿里的多模态算法达摩院交互式多能型合成算法也在列。受到这一消息刺激,AI概念股午后突...……更多
vivo发布自研大模型,为用户和开发者带来诸多惊喜
...发者大会于10月10日在广东深圳正式召开,vivo发布自研大模型——全新蓝心大模型矩阵,为用户和开发者带来诸多惊喜。在同日举办的人工智能会场上,vivoAI团队分享了在AI领域取得的最新成果,以前沿解决方案引领大模型创新...……更多
多个中国团队斩获EMNLP\'24最佳论文!UCLA华人学者中三篇杰出论文
...,跨文化再创作应运而生。作者构建了三个包含SOTA生成模型的管道:e2e-instruct 直接编辑图像,cap-edit 通过字幕和 LLM 编辑后处理图像,cap-retrieve 利用编辑后的字幕检索图像,还创建了概念和应用两部分评估数据集。 结果发现...……更多
智能客服是人工智能领域的“急先锋”
...能看见的主流产品形态,就是这个成熟产品。三、大语言模型时代的智能客服2022年,大语言模型爆炸式的发展,给很多行业带来了巨大冲击。应用AI人工智能技术已心得颇深的智能客服产品亦不可避免, 我们都深知,每次技术...……更多
科大讯飞大模型新升级:20秒制作PPT,拟人语音能力超越ChatGPT|最前线
...编辑|邓咏仪1月30日,科大讯飞发布新升级的讯飞认知大模型星火V3.5,并发布了自研的语音大模型,以及星火开源大模型——星火开源-13B。过去一年,科大讯飞的重点都在大模型方向上,临近岁末放出大量更新,某种程度也展...……更多
抢先OpenAI!Hume AI发布第二代情感智能AI,支持自定义语音,在线可玩
...提升,还支持自定义语音EVI 2集成了一个先进的语音生成模型和情感大型语言模型(eLLM),能够处理和生成文本及音频。这种多模态方法使得EVI 2生成的语音听起来更自然,语调更恰当,表现力更高,输出更连续。此外,在同一...……更多
科大讯飞入局大模型混战,刘庆峰:10月底将赶超ChatGPT
出品 | 搜狐科技作者 | 梁昌均国内大模型混战之下,科大讯飞成为最新的入局者。自去年12月15日,科大讯飞启动1+N的大模型专项攻关后,历时近半年终于发布了最新技术成果。5月6日,科大讯飞正式对外发布讯飞星火认知大模...……更多
科大讯飞刘庆峰:讯飞星火大模型10月底整体赶超ChatGPT
星星之火,可以燎原。5月6日,讯飞星火认知大模型成果发布会在安徽合肥如期举行。科大讯飞董事长刘庆峰、研究院院长刘聪发布讯飞星火认知大模型,现场实测大模型七大核心能力,并发布教育、办公、汽车、数字员工四大...……更多
思必驰天琴语音助手全面接入DeepSeek:中枢大模型驱动车载交互持续进化
...:依托车端、云端感知数据和DUI平台、客户端编译中台、模型训练中台、大数据中台等,实现多车协同与云端数据联动,提升了整体的效率和决策能力。这一底层架构全方位提升了天琴语音助手 8.0 的性能,实现了从指令执行到全场景...……更多
APUS发布1000亿天燕大模型AiLMe,CEO称日活用户已超百万|钛快讯
APUS公司创始人、CEO李涛(图片来源:钛媒体App编辑拍摄)又一个国产人工智能(AI)大模型来了。钛媒体App 4月19日消息,麒麟合盛网络技术股份有限公司(APUS)昨天(18日)下午在北京推出1000亿个参数、自研多模态的天燕大模...……更多
更多关于科技的资讯:
2025北京文化论坛“虚实无界:视听产业融合破圈”平行论坛举办
中国青年报客户端北京9月23日电(中青报·中青网记者 沈杰群)今天,2025北京文化论坛平行论坛——“虚实无界:视听产业融合破圈”在北京国际饭店会议中心举行
2025-09-24 00:03:00
中信银行南京分行成功举办“小天元”企业生态服务平台江苏区域发布会
9月22日下午,在百余家江苏企业代表的共同见证下,中信银行“小天元”企业生态服务平台江苏区域发布会暨“进万企 信服惠企”系列活动在南京成功举办
2025-09-23 23:15:00
聚焦京津冀协同发展|一个平台,推动黄骅模具迈向高端
北京市科学技术委员会牵头,京冀相关单位共建智能模具科技成果转化中试平台一个平台,推动黄骅模具迈向高端9月11日,智能模具科技成果转化中试平台工作人员正在操作四轴机床进行生产
2025-09-23 08:49:00
AI赋能千行百业一线故事(十二):数智化转型,让电厂越来越智慧
数智化转型,让电厂越来越智慧——AI赋能千行百业一线故事(十二)8月28日,石家庄良村热电有限公司生产技术部专业主管苏朝宏介绍智慧展厅
2025-09-23 08:53:00
“产业炬光灯”系列短视频首期聚焦中材航特
“产业炬光灯”系列短视频于厦门日报官方视频号、抖音号、快手号、B站账号、央视频账号等全媒体平台同步上线,首期节目走进中材航特
2025-09-23 08:58:00
厦门网讯(厦门日报记者 林雯)旧低效工业用地加速变身科创高地。近日,随着位于思明区前埔片区的2025P13、2025P14地块成功出让
2025-09-23 08:58:00
国网厦门供电公司持续推进“EASIER用电”品牌建设
国网厦门供电公司为厦门天马微电子有限公司创造更优质、更稳定的用电环境。(国网厦门供电公司 供图)“EASIER用电”品牌厦门网讯(厦门日报记者 刘艳 通讯员 林艳婷 高芳 郭芷祎)近年来
2025-09-23 08:58:00
山东移动泰安分公司数智融合加速 赋能企业蝶变升级
鲁网9月22日讯数字化浪潮正在席卷千行百业,山东移动泰安分公司(简称:泰安移动)以“技术赋能、生态协同、梯次服务”为核心
2025-09-23 10:01:00
企鹅网络(Q学友)与腾讯云达成战略合作,携手共创“AI+职业教培”新范式
9月16日-17日,2025腾讯全球数字生态大会在深圳举办。大会期间,深圳市企鹅网络科技有限公司(以下简称“企鹅网络”)与腾讯云正式签署战略合作协议
2025-09-23 10:39:00
本报记者 赵 曦 □ 花沁昕“白天的时间都用于工作和社交,只有夜晚的时间才真正属于自己,我舍不得睡,但真想睡的时候又睡不着了
2025-09-23 10:48:00
科学为基,爱心为桥:儿童营养品牌inne携手德甲冠军俱乐部启动全球公益计划
在全民健康意识提高与消费升级的双重驱动下,新一代父母对儿童营养的重视程度前所未有。消费需求愈发细分、专业,推动儿童营养品行业从“标准化供给”向“专业化服务”转变
2025-09-23 11:20:00
《金刚狼》《权游》供应商分拆机器人数据业务,腾讯、字节大牛加入 | 智能涌现独家
文|邱晓芬编辑|苏建勋2023年底,全球出货量最大的动作捕捉设备提供商"诺亦腾(Noitom)"联合创始人戴若犁,一度以为自己被骗了
2025-09-23 20:47:00
近8成职场人每周都会使用AI工具 通用对话型AI占比最高
在人工智能技术日臻成熟的2025年,AI已不再是科幻概念或实验室产物,而是深度融入职场生态的“数字同事”。从“工具”走向“伙伴”
2025-09-23 11:37:00
罗永浩宣布“将测评预制菜”,网友:气氛都烘托到这了,要不转型做预制菜吧
9月23日凌晨,罗永浩在微博发文称,将和团队一起,对市面在售的预制菜进行测评。他表示自己“陷入了深深的思考:为什么电商网站上能买到的预制菜
2025-09-23 11:54:00
首届“洞见未来·乡村振兴共创周” 及“怀柔乡村振兴新主体联盟”启动仪式在北京怀柔成功举办
金秋九月,长城栗乡,9月20日至21日,首届“洞见未来·乡村振兴共创周”在北京市怀柔区精彩启幕。活动以“探索新路径、凝聚新合力
2025-09-23 12:10:00