模型,语音,语言,模型,文本,工具头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...人工智能研究论文称，研究人员研发出一个人工智能(AI)模型，能即时翻译多达101种语言的语音和文本，包括直接语音到语音翻译。这款名为SEAMLESSM4T的人工智能模型，填补了语言覆盖方面的空白，并且性能优于现有的系统。研究...……更多

2025-01-16 22:36:00人工智能,人工,模型,语言,智能,国际

谷歌发布Translatotron 3 模型

...今天发布新闻稿，正式介绍推出了名为Translatotron3的新AI模型，无需任何并行语音数据下，可以实现语音对语音的同声传译翻译。谷歌于2019年推出了TranslatotronS2ST系统，于2021年7月推出第2个版本，在2023年5月27日发布的一篇论文中...……更多

2023-12-02 17:28:00模型,语音,语言,模型,文本,工具

刚刚，我们感受了一波最「像人」的国产AI，模型还是开源的

...EglhJA与此同时，智谱还重磅宣布，该功能背后的情感语音模型 GLM-4-Voice 同步正式开源。不久后，相关能力还将上线视频通话，为所有用户提供一个既能「看」又能「说」的 AI 语音助理。开源地址：https://github.com/THUDM/GLM-4-Voice自...……更多

2024-10-26 09:49:00一波,模型,国产,还是,语音,模型

vivo发布自研大模型，为用户和开发者带来诸多惊喜

...发者大会于10月10日在广东深圳正式召开，vivo发布自研大模型——全新蓝心大模型矩阵，为用户和开发者带来诸多惊喜。在同日举办的人工智能会场上，vivoAI团队分享了在AI领域取得的最新成果，以前沿解决方案引领大模型创新...……更多

2024-10-14 01:53:00开发者,模型,惊喜,用户,开发,模型

AIGC工具测评：生成式AI的产品表现如何

...这一年，AI展现出了前所未有的发展势头，无论是在基础模型能力、实际应用场景，还是资本投入方面都取得了显著进展。特别是在2022年11月30日，OpenAI发布了ChatGPT，标志着AI技术的一个新纪元。紧接着，在2023年1月，ChatGPT的月...……更多

2024-03-25 13:00:00生成,工具,产品,用户,界面,通义

全面透视豆包：功能、版本、价格、优势、应用

...率与竞争力。一、豆包介绍豆包是字节跳动公司基于云雀模型开发的 AI 工具，提供聊天机器人、写作助手以及英语学习助手等功能，它可以回答各种问题并进行对话，帮助人们获取信息，支持网页、客户端、APP、插件等形式。...……更多

2024-07-24 14:44:00豆包,优势,版本,功能,应用,价格

首个可保留情感的音频LLM！Meta重磅开源7B-Spiri

...元导读】Meta最近开源了一个7B尺寸的Spirit LM的多模态语言模型，能够理解和生成语音及文本，可以非常自然地在两种模式间转换，不仅能处理基本的语音转文本和文本转语音任务，还能捕捉和再现语音中的情感和风格。在纯文本...……更多

2024-11-23 09:43:00音频,模态,重磅,文本,任务,情感

科大讯飞大模型新升级：20秒制作PPT，拟人语音能力超越Ch

...编辑｜邓咏仪1月30日，科大讯飞发布新升级的讯飞认知大模型星火V3.5，并发布了自研的语音大模型，以及星火开源大模型——星火开源-13B。过去一年，科大讯飞的重点都在大模型方向上，临近岁末放出大量更新，某种程度也展...……更多

2024-01-31 07:32:00讯飞,拟人,语音,模型,能力,升级

让大模型能听会说,国内机构开源首个端到端语音对话模型Mini

...非与启元世界多模态负责人吴昌桥，研究兴趣为多模态大模型、LLM Agents 等。本论文上线几天内在 github 上斩获 1000+ 星标。随着多类型大模型的飞速发展，全球 AI 已经进入到了多模交互时代。2024 年 5 月，OpenAI 推出了全新的多模...……更多

2024-09-07 09:44:00模型,语音,对话,机构,语音,文本

四大新功能让生成式AI“如虎添翼”

...能（AI）技术，通过已有数据寻找规律，并通过预训练大模型、生成式对抗网络等方法，自动生成各种类型的内容，例如文章、视频、图片、音乐、代码等。AIGC代表了AI技术发展的新趋势。过去传统AI偏向分析能力，而现在AI正在...……更多

2023-12-15 01:28:00如虎,新功能,生成,生成,机器人,机器

一块GPU都没用，苹果自研大模型干翻GPT-4？

...，上线Apple Intelligence的首个版本，同时47页的苹果自研大模型技术报告重磅发布。Apple Intelligence首个版本上线了以下AI功能：1、Siri升级。Siri唤醒后具备屏幕边缘发光特效，能理解用户表述不通顺的指令，且能回答关于苹果产品...……更多

2024-07-31 09:37:00模型,苹果,模型,苹果,开发者,开发

融资1600万美元，这家法国AI创企推新语音转录引擎，支持1

...识别他的法语口音。他说：“考虑到目前大多数语音识别模型主要在英语音频数据上训练，存在固有的偏见，Gladia优先构建了第一个真正多语言的实时产品。”此外，Gladia引擎的特别之处在于能够即时从对话中提取信息，如来电...……更多

2024-10-17 09:45:00法国,融资,语音,语言,引擎,支持

亚马逊开发史上最大文本转语音模型

...能研究团队宣布开发了一个据称是史上最大的文本转语音模型，该模型拥有最多的参数，并使用了最大的训练数据集。研究人员已经在arXiv预印本服务器上发表了一篇论文，详细描述了模型的开发和训练过程。近年来，像ChatGPT这...……更多

2024-02-18 12:49:00开发史,亚马,亚马逊,语音,模型,文本

语音克隆达到人类水平，微软全新VALL-E 2模型让Deep

【新智元导读】继去年初的第一代VALL-E模型之后，微软最近又上新了VALL-E 2模型，标志着第一个在合成语音稳健性、相似度、自然程度等方面达到人类水平的文本到语音模型。最近，微软发布了零样本的文本到语音（TTS）模型VAL...……更多

2024-07-25 09:34:00堪比,微软,配音,语音,模型,人类

一文看尽Meta开源大礼包！全面覆盖图像分割、语音、文本、表

...【新智元导读】Meta最近开源了多个AI项目，包括图像分割模型SAM 2.1、多模态语言模型Spirit LM、自学评估器和改进的跨语言句子编码器Mexma等，提升了AI在图像处理和语音识别领域的能力，进一步推动了AI研究的进展。开源绝对是AI...……更多

2024-11-28 12:02:00一文,大礼包,大礼,安全性,语音,图像

思必驰天琴语音助手全面接入DeepSeek：中枢大模型驱动车

...:依托车端、云端感知数据和DUI平台、客户端编译中台、模型训练中台、大数据中台等,实现多车协同与云端数据联动,提升了整体的效率和决策能力。这一底层架构全方位提升了天琴语音助手 8.0 的性能,实现了从指令执行到全场景...……更多

2025-03-03 17:09:00中枢,接入,进化,语音,助手,模型

仅用4块GPU、不到3天训练出开源版GPT-4o，这是国内团

...4o 的平均音频响应延迟 320ms。以 ChatGPT 为代表的大型语言模型（LLM）已成为强大的通用任务解决器，但大多数 LLM 仅支持基于文本的交互，这限制了它们在不适合文本输入输出的场景中的应用。GPT-4o 的出现使得通过语音与 LLM 进...……更多

2024-09-24 13:42:00团队,训练,这是,研究,语音,文本

Sora再度颠覆AI视频行业，A股哪些公司有相关布局？

...智能（AI）巨头OpenAI又出王炸，其最新推出的文生视频大模型Sora因其“逼真”和“富有想象力”被广泛赞誉，其生成视频可达60秒也颠覆了传统视频生成领域平均只有4秒的视频生成长度。OpenAI官网介绍，Sora是一种扩散模型，它...……更多

2024-02-19 08:10:00颠覆,布局,行业,视频,公司,模型

chatrtx正式上线：ai加速、语音交互、ai语音识别

...它用到了TensorRT-LLM和NVIDIARTX加速技术，是显卡应用大语言模型的一个技术演示demo。最近，NVIDIA宣布——ChatwithRTX正式更名为ChatRTX。这次的更新增加了许多新功能，例如在新版本中加入了对智谱AI的ChatGLM3-6B这个中文LLM的支持，同...……更多

2024-05-15 17:03:00语音,支持,显卡,数据,用户,功能

Galaxy S24系列上线大模型！三星：不排除未来Gala

...厂商如华为、小米、vivo和荣耀均在旗舰手机上搭载了AI大模型功能。业内人士认为，目前需要先让用户感知到AI大模型带来的便利性，才会让消费者产生换机的欲望，并且目前手机端的AI大模型尚处于初期，收费和盈利模式都需...……更多

2024-01-18 11:00:00三星,可能性,模型,收费,三星,模型

谷歌史上最强大模型！Gemini 2.0正式发布

...今天凌晨，谷歌正式发布了为新智能体时代构建的下一代模型——Gemini 2.0。这是谷歌迄今为止功能最强的AI模型，带来了更强的性能、更多的多模态表现（如原生图像和音频输出）和新的原生工具应用。Gemini 2.0关键基准测试中...……更多

2024-12-12 07:15:00模型,音频,模态,自然语言,文生,多语

首个VR端3D角色扮演AI发布！南洋理工公开SOLAMI技术

...进行沉浸式互动。该系统利用先进的社交视觉-语言-行为模型，结合合成的数据集，提供更自然的交流体验，超越了传统的文本和语音交互。世界上第一个VR端 3D版的角色扮演AI就在刚刚诞生了！AI角色扮演类游戏（如C.AI、Talkie）...……更多

2024-12-10 09:53:00南洋,角色扮演,理工,模型,角色,驱动

讯飞星火首发AI合同助手，大模型时代的“超级知识助手”来了

...服务已备案信息》，截止至今年 3 月，我国已有 117 家大模型成功备案。除了部分面向 B 端的行业大模型之外，过去一年，不少通用大模型已经开始面向 C 端提供服务，诸如科大讯飞的讯飞星火、百度的文心一言、字节跳动的豆...……更多

2024-04-30 17:00:00讯飞,星火,助手,模型,合同,知识

昆仑万维：“天工大模型3.0”将于4月17日正式发布同步开

...新闻网2023年4月17日，昆仑万维发布自研双千亿级大语言模型“天工1.0”。即将到来的2024年4月17日，在“天工”大模型一周年之际，昆仑万维重磅宣布，“天工3.0”正式开启公测！“天工3.0”采用4千亿级参数MoE混合专家模型，并...……更多

2024-04-01 19:56:00万维,昆仑,模型,将于,同步,参数

微软宣布Team Copilot发布，年内将推出初步预览版

...可用本地API的Copilot库WindowsCopilotLibrary，称有40多种端侧AI模型“开箱即用”，展示了将Copilot全面融入个人电脑（PC）的新型PCCopilot+PC如何与AI应用程序（App）密切结合。周一微软介绍过WindowsCopilotRuntime中包含超过……更多

2024-05-22 20:01:00微软,微软,纳德拉,纳德,模型,功能