• 我的订阅
  • 头条热搜
openai推出large-turbo语音转录模型
...10月1日举办的DevDay活动日中,宣布推出了Whisperlarge-v3-turbo语音转录模型,共有8.09亿参数,在质量几乎没有下降的情况下,速度比large-v3快8倍。Whisperlarge-v3-turbo语音转录模型是large-v3的优化版本,并且只有4层解码器层(Dec……更多
亚马逊开发史上最大文本转语音模型
...工智能研究团队宣布开发了一个据称是史上最大的文本转语音模型,该模型拥有最多的参数,并使用了最大的训练数据集。研究人员已经在arXiv预印本服务器上发表了一篇论文,详细描述了模型的开发和训练过程。近年来,像Chat...……更多
...能研究院(TeleAI)发布业内首个支持30种方言自由混说的语音识别大模型——星辰超多方言语音识别大模型,打破单一模型只能识别特定单一方言的困境,可同时识别理解粤语、上海话、四川话、温州话等30多种方言,是国内支...……更多
讯飞星火V4.0将于6月下旬发布 刘庆峰详解五大战略打赢大模型之战
...27日发布,将会进一步强化国内的领先地位。日前,随着语音和音视频能力都有所提升的GPT-4o的发布,底座大模型再次迎来智慧升级,对此刘庆峰也表示,站在当前语音和大模型全新的战略机遇交汇处,讯飞星火要通过五大核心...……更多
科大讯飞大模型新升级:20秒制作PPT,拟人语音能力超越ChatGPT|最前线
...发布新升级的讯飞认知大模型星火V3.5,并发布了自研的语音大模型,以及星火开源大模型——星火开源-13B。过去一年,科大讯飞的重点都在大模型方向上,临近岁末放出大量更新,某种程度也展示了讯飞的投入决心。就在1月29...……更多
高斯混合模型在概率建模中的应用
...斯混合模型的应用高斯混合模型在图像处理、对象追踪、语音识别、信号处理等领域具有广泛的应用。以下是一些常见的GMM应用:图像分割图像分割是指将同一图像中不同的物体或场景划分成不同的区域。GMM可以用来对图像进行...……更多
...。华为宣布手机系统接入盘古大模型,开启内置大模型的语音助手“小艺”的众测。荣耀表示即将推出自研70亿参数端侧AI大模型和全新云服务。北京博瑞恒咨询有限公司咨询总监张扬表示,现阶段手机端AI大模型应用主要集中在...……更多
《永劫无间》手游首次将具有18亿参数的大语言模型引入终端侧
...ChatGLM能够支持三种终端侧交互方式:使用相机进行实时语音对话、上传照片进行对话、上传视频进行对话。丰富的多模态输入输出方式赋能智能助手ChatGLM实现了跨家庭、出行、工作和教育等多个场景的应用,例如:通过手机摄...……更多
一年投入数十亿,手机厂商抢滩大模型 | 焦点分析
...五个大模型矩阵;上个月,小米也将搭载大模型能力后的语音助手小爱同学,整体嵌套到了澎湃OS上;在更早的8月份,华为鸿蒙OS 4也宣布接入大模型。手机厂商对于大模型的投入不低。vivo副总裁周围透露,vivo的大模型经过了6...……更多
让大模型能听会说,国内机构开源首个端到端语音对话模型Mini-Omni
...类相近的自然语言交互能力,实现了 AI 能同时读懂人类语音中的内容及情绪,并实时做出反馈。同时,GPT4o 也给众多语音研究人员带来「新的春天」,语音文本多模态大模型成为热门研究方向。实现类似 GPT4o 实时语音交互能力...……更多
字节跳动推出对话式ai实时交互解决方案
...载火山方舟大模型服务平台。该方案通过火山引擎RTC实现语音数据的采集、处理和传输,并深度整合豆包・语音识别模型和豆包・语音合成模型,简化语音到文本和文本到语音的转换过程,提供智能对话和自然语言处理能力,帮...……更多
2022生成模型进展有多快,新论文盘点9类生成模型代表作
...示词产生自然连贯的音色。在人类评估中,认为它是人类语音的占51.2%、与合成语音比率接近,说明合成效果接近真人。Jukebox 由OpenAI开发的音乐模型,可生成带有唱词的音乐。通过分层VQ-VAE体系将音频压缩到离散空间中,损失...……更多
大模型这把大火,烧到了手机领域
...互体验。业内人士表示,随着大模型技术的引入,用户跟语音助手交互知识问答类的问题,占比会有更显著的增长。目前OPPO语音助手小布的整个月活是1.5亿+,每天产生的交互数据大几千万次。在部署方面,主要是云端+本地部署...……更多
OpenAI推迟上线语音功能,GPT-5或要等到明年,大模型技术速度正在放缓
...昌均大模型技术进展肉眼可见地放缓了,OpenAI此前说好的语音功能也鸽了。OpenAI针对此前展示的高级语音功能发布最新进展称,原计划在六月底开始向少部分ChatGPT Plus用户推出alpha版本,但需要再花一个月时间才能达到发布标准...……更多
三星S24系列正式发布,AI功能很强?国产旗舰丝毫不惧!
...生通话应用程序内置了通话实时翻译,可以提供实时双向语音和文字翻译,而且于设备端的AI可以确保用户的对话隐私。三星键盘模块也内置了AI翻译功能,支持实时处理13种语言,能够为用户翻译短信、邮件等文本,此外还有全...……更多
全球首个端侧应用 70 亿参数大语言模型手机OPPO Find X7发布
...机。用户可以体验全新的 AIGC 消除功能,首个 AI 大模型语音摘要,文字生成图片等100多种能力。OPPO透露,20年来,OPPO 成为中国排名第二、全球第六的专利储备大厂。OPPO目前拥有超过5万件的授权专利,并且 90% 是发明专利,而...……更多
仅用4块GPU、不到3天训练出开源版GPT-4o,这是国内团队最新研究
LLaMA-Omni能够接收语音指令,同步生成文本和语音响应,响应延迟低至 226ms,低于 GPT-4o 的平均音频响应延迟 320ms。以 ChatGPT 为代表的大型语言模型(LLM)已成为强大的通用任务解决器,但大多数 LLM 仅支持基于文本的交互,这限...……更多
OPPO FindX7安第斯大模型上手:智能语音助手脱胎换骨
...样,基于安第斯大模型的小布也不再只是功能较为单一的语音助手,而是拥有超级问答、用机助手、生成创作等强大能力的个人专属智能助理,那现在让我们一起看看,OPPO自研的AI大模型能带给我们什么样的惊喜吧。修图大师,...……更多
抢先OpenAI!Hume AI发布第二代情感智能AI,支持自定义语音,在线可玩
...为全球首个具有情商的对话式AI。EVI能够通过分析用户的语音,如口音、语气、语调、拟声词、节奏和停顿等,来理解用户的情绪和心理状态,并做出实时响应。与EVI 1相比,新发布的EVI 2的响应延迟减少了40%,且成本降低了30%。...……更多
...注入全新生命力。中国运营商发布首个支持30种方言混说语音大模型。25日,在第七届数字中国建设峰会上,中国电信人工智能研究院发布业内首个支持30种方言自由混说的语音识别大模型——星辰超多方言语音识别大模型,打破...……更多
刚刚,我们感受了一波最「像人」的国产AI,模型还是开源的
今年 5 月,OpenAI 首次展示了 GPT-4o 的语音功能,无论是对话的响应速度还是与真人声音的相似度,都颇为惊艳。特别是它允许用户随时打断,充分感知到用户的情绪并给予回应。大家突然发现,原来 AI 语音通话还能这么玩?但...……更多
大模型重塑版讯飞输入法来了!能懂每个人的AI输入
...。在此之上,搭载着讯飞星火端侧输入大模型、讯飞星火语音大模型的讯飞输入法14.0亮相,再次让人眼前一亮。讯飞输入法14.0的”AI输入增强“可以直接让输入法“猜你喜欢”,输入上句就能秒出下句,聊天气、游玩计划都不...……更多
全国产算力平台“飞星一号”的首个成果发布:讯飞星火V3.5来了
...此等“打工神器”获得台下一阵掌声点赞。正式发布星火语音大模型“大模型带来了语音技术发展的全新机会。”刘庆峰强调,让机器具备学习、推理和决策的能力,就是认知大模型要干的主要工作。“简单来说,借助大模型,...……更多
荣耀magicos9.0发布,提供小窗运行功能
...的各类需求。系统自研魔法大模型现已覆盖语言、图像、语音、多模态四大领域,且AI算力按需分配,效率提升。YOYO还可以帮助用户查找微信、支付宝中的自动续费服务,汇总后列出,询问用户是否需要取消自动续费。YOYO还可...……更多
十多年来最重要的一次!库克会暗掷“王炸”吗?
...门用于处理人工智能任务,并能提高速度,或者让公司的语音助手Siri更深入地嵌入应用程序以帮助用户执行任务。更大的期待来自于苹果是否会在WWDC上与OpenAI联手“出大招”。此前已经有消息称,苹果正在考虑与OpenAI或谷歌的...……更多
标贝科技携智能客服语音交互方案亮相中国呼叫中心及企业通信大会并荣获年度编辑推荐奖
...叫中心及企业通信大会在北京隆重举办。标贝科技携多款语音技术产品出席会议,“智能客服语音交互解决方案”凭借全面的定制能力、灵活的运维部署以及综合性能等多方面优势,荣获“2023年度编辑推荐奖”。中国呼叫中心...……更多
vivo自研大模型全家桶炸场,亮出PhoneGPT智能体,蓝心小V一键搞定衣食住行
...你需要的反馈和服务。依托文本大模型,结合自监督学习语音编解码、多语音任务学习和模态对齐等技术,蓝心小V在文本能力外,进一步具备了强大的语音表征理解与生成能力,进而让手机能够与人自然对话、翻译语言、模拟...……更多
中国电信在大模型领域成功布局ai技术
...大模型研发领域表现出了强烈的积极性,包括语义理解、语音识别、图像处理和多模态交互等方面。这些研发成果已经在多个行业和应用场景中得到了有效应用,展现了中国电信在AI技术本土化方面的成果,即更加符合中国的语...……更多
中国电信星辰AI大模型开源自研AI创新成果助推数字中国建设“正当时”
...完全自主研发的国内领先星辰系列大模型,构建了语义、语音、视觉及多模态大模型完备的基础框架。其中语义大模型于11月份发布千亿参数版本,在大模型知名榜单CSL排名第五、GAOKAO排名第七、AGIEval排名第八。视觉大模型赋能...……更多
英伟达发布80亿参数的ai模型
...面,这款AI模型将广泛应用于自然语言处理、图像识别、语音识别以及智能推荐等多个领域。 ……更多
更多关于科技的资讯:
聚焦2025中国国际数字经济博览会·访谈|沈昌祥:发挥优势,不断筑牢人工智能安全底座
发挥优势,不断筑牢人工智能安全底座——访中国工程院院士沈昌祥中国工程院院士沈昌祥。 河北日报记者 李东宇摄2025中国国际数字经济博览会的主题为“可信数据赋能产业发展”
2025-10-18 08:25:00
10月17日,2025中国国际数字经济博览会,一款AI绘画机器人精准识别人脸神态,快速绘画出人脸素描,被这只机械臂画得心服口服。(摄制:苏畅、白中豪、朱泊宇)
2025-10-18 08:27:00
深化开发利用,让高质量数据“动”起来——2025中国国际数字经济博览会探新之一机器人亮绝活、大模型总动员、虚拟空间沉浸体验……10月17日
2025-10-18 08:37:00
厦门网讯(厦门日报记者 薛尧)苹果iPhone17 Air昨日正式开启预售,这款取消实体卡槽、仅支持eSIM(嵌入式虚拟SIM卡)的新机
2025-10-18 08:59:00
近日,建设银行正式启动“‘享趣’玩·惠游中华”信用卡活动,为客户提供涵盖景区票务、特色餐饮、文创消费等多方面的用卡优惠
2025-10-18 10:41:00
海信贾少谦:AI重塑企业管理模式,打法要快,生意要慢
10月17日,第十五届中国管理·全球论坛暨首届“中国企业管理最佳实践榜”发布盛典在青岛举办。作为C50+2025年度轮值企业家召集人
2025-10-18 10:57:00
竹溪县数字经济产业链招商签约超亿元
十堰广电讯(全媒体记者 白孟尧 通讯员 付延峰)竞逐数字经济新赛道,孕育产业链招商硕果。10月18日,湖北十堰竹溪县竹溪数字经济产业链招商暨2025“国芯一号”生态合作伙伴大会在桃花岛夯土小镇举行
2025-10-18 13:47:00
东南网龙岩10月17日讯(通讯员 陈碧霞)近日,工行龙岩漳平支行组织青年志愿者主动深入当地企业园区,精心开展集“个人金融产品精准营销”与“金融反诈知识普及”于一体的“一站式”综合服务活动
2025-10-18 16:32:00
烟台银行荣登2025上半年度高质量数字化转型十大典型案例榜单
近日,由中国信通院主办的以“洞见十五五”为主题的2025数字生态发展大会暨“铸基计划”年中会议在北京盛大召开。会上,烟台银行联合长亮科技申报的《DataOps赋能烟台银行建设高质量智能数据中枢》案例
2025-10-18 17:45:00
视源股份广交会展示AI全场景创新实力,机器人机器人系列产品亮相成焦点
在第138届中国进出口商品交易会(广交会)上,视源股份以“AI+未来教育、AI+企业服务、AI+机器人、AI+生活”为主线
2025-10-18 18:18:00
本土智造重磅升级,医科达将八度亮相进博
第八届中国国际进口博览会(进博会)进入倒计时,作为八年“全勤生”,全球精准放疗先锋医科达将以“共建本土生态,共筑抗癌未来”为主题
2025-10-18 18:42:00
不用等到20号了!现在来京东11.11 iPhone 17 Pro系列可领300元惊喜券
每年11.11对于广大果粉而言无疑是换新的绝佳时机,无论是追求最新款还是预算有限入手上一代机型都能享受到极具吸引力的价格
2025-10-18 18:43:00
破局重构引领前行,联众优车持续锻造二手车服务新基建
近年来,在国内汽车消费结构持续升级的背景下,二手车市场已成为拉动汽车消费的重要引擎。特别是随着国家一系列利好政策的推出
2025-10-18 18:43:00
从龙虎到鹤年堂 京东七鲜十月品牌日再造下一个老字号联名爆款
随着“养生年轻化”与“即食化养生”成为主流,当代消费者愈发青睐“轻松养生、即时进补”。如何让传统养生智慧通过自有品牌融入日常
2025-10-18 18:43:00
全时段畅飞 全年不限次:长龙航空“365畅飞卡”10月19日在京东旅行限时开售
国内随心飞历史新低,全时段畅飞、全年不限次!在推出海航随心飞,并创下2天超25万用户下单、2亿销售额的纪录之后,京东11
2025-10-18 18:45:00