• 我的订阅
  • 头条热搜
openai推出large-turbo语音转录模型
...10月1日举办的DevDay活动日中,宣布推出了Whisperlarge-v3-turbo语音转录模型,共有8.09亿参数,在质量几乎没有下降的情况下,速度比large-v3快8倍。Whisperlarge-v3-turbo语音转录模型是large-v3的优化版本,并且只有4层解码器层(Dec……更多
亚马逊开发史上最大文本转语音模型
...工智能研究团队宣布开发了一个据称是史上最大的文本转语音模型,该模型拥有最多的参数,并使用了最大的训练数据集。研究人员已经在arXiv预印本服务器上发表了一篇论文,详细描述了模型的开发和训练过程。近年来,像Chat...……更多
...能研究院(TeleAI)发布业内首个支持30种方言自由混说的语音识别大模型——星辰超多方言语音识别大模型,打破单一模型只能识别特定单一方言的困境,可同时识别理解粤语、上海话、四川话、温州话等30多种方言,是国内支...……更多
讯飞星火V4.0将于6月下旬发布 刘庆峰详解五大战略打赢大模型之战
...27日发布,将会进一步强化国内的领先地位。日前,随着语音和音视频能力都有所提升的GPT-4o的发布,底座大模型再次迎来智慧升级,对此刘庆峰也表示,站在当前语音和大模型全新的战略机遇交汇处,讯飞星火要通过五大核心...……更多
科大讯飞大模型新升级:20秒制作PPT,拟人语音能力超越ChatGPT|最前线
...发布新升级的讯飞认知大模型星火V3.5,并发布了自研的语音大模型,以及星火开源大模型——星火开源-13B。过去一年,科大讯飞的重点都在大模型方向上,临近岁末放出大量更新,某种程度也展示了讯飞的投入决心。就在1月29...……更多
高斯混合模型在概率建模中的应用
...斯混合模型的应用高斯混合模型在图像处理、对象追踪、语音识别、信号处理等领域具有广泛的应用。以下是一些常见的GMM应用:图像分割图像分割是指将同一图像中不同的物体或场景划分成不同的区域。GMM可以用来对图像进行...……更多
...。华为宣布手机系统接入盘古大模型,开启内置大模型的语音助手“小艺”的众测。荣耀表示即将推出自研70亿参数端侧AI大模型和全新云服务。北京博瑞恒咨询有限公司咨询总监张扬表示,现阶段手机端AI大模型应用主要集中在...……更多
《永劫无间》手游首次将具有18亿参数的大语言模型引入终端侧
...ChatGLM能够支持三种终端侧交互方式:使用相机进行实时语音对话、上传照片进行对话、上传视频进行对话。丰富的多模态输入输出方式赋能智能助手ChatGLM实现了跨家庭、出行、工作和教育等多个场景的应用,例如:通过手机摄...……更多
一年投入数十亿,手机厂商抢滩大模型 | 焦点分析
...五个大模型矩阵;上个月,小米也将搭载大模型能力后的语音助手小爱同学,整体嵌套到了澎湃OS上;在更早的8月份,华为鸿蒙OS 4也宣布接入大模型。手机厂商对于大模型的投入不低。vivo副总裁周围透露,vivo的大模型经过了6...……更多
让大模型能听会说,国内机构开源首个端到端语音对话模型Mini-Omni
...类相近的自然语言交互能力,实现了 AI 能同时读懂人类语音中的内容及情绪,并实时做出反馈。同时,GPT4o 也给众多语音研究人员带来「新的春天」,语音文本多模态大模型成为热门研究方向。实现类似 GPT4o 实时语音交互能力...……更多
字节跳动推出对话式ai实时交互解决方案
...载火山方舟大模型服务平台。该方案通过火山引擎RTC实现语音数据的采集、处理和传输,并深度整合豆包・语音识别模型和豆包・语音合成模型,简化语音到文本和文本到语音的转换过程,提供智能对话和自然语言处理能力,帮...……更多
2022生成模型进展有多快,新论文盘点9类生成模型代表作
...示词产生自然连贯的音色。在人类评估中,认为它是人类语音的占51.2%、与合成语音比率接近,说明合成效果接近真人。Jukebox 由OpenAI开发的音乐模型,可生成带有唱词的音乐。通过分层VQ-VAE体系将音频压缩到离散空间中,损失...……更多
大模型这把大火,烧到了手机领域
...互体验。业内人士表示,随着大模型技术的引入,用户跟语音助手交互知识问答类的问题,占比会有更显著的增长。目前OPPO语音助手小布的整个月活是1.5亿+,每天产生的交互数据大几千万次。在部署方面,主要是云端+本地部署...……更多
OpenAI推迟上线语音功能,GPT-5或要等到明年,大模型技术速度正在放缓
...昌均大模型技术进展肉眼可见地放缓了,OpenAI此前说好的语音功能也鸽了。OpenAI针对此前展示的高级语音功能发布最新进展称,原计划在六月底开始向少部分ChatGPT Plus用户推出alpha版本,但需要再花一个月时间才能达到发布标准...……更多
三星S24系列正式发布,AI功能很强?国产旗舰丝毫不惧!
...生通话应用程序内置了通话实时翻译,可以提供实时双向语音和文字翻译,而且于设备端的AI可以确保用户的对话隐私。三星键盘模块也内置了AI翻译功能,支持实时处理13种语言,能够为用户翻译短信、邮件等文本,此外还有全...……更多
全球首个端侧应用 70 亿参数大语言模型手机OPPO Find X7发布
...机。用户可以体验全新的 AIGC 消除功能,首个 AI 大模型语音摘要,文字生成图片等100多种能力。OPPO透露,20年来,OPPO 成为中国排名第二、全球第六的专利储备大厂。OPPO目前拥有超过5万件的授权专利,并且 90% 是发明专利,而...……更多
仅用4块GPU、不到3天训练出开源版GPT-4o,这是国内团队最新研究
LLaMA-Omni能够接收语音指令,同步生成文本和语音响应,响应延迟低至 226ms,低于 GPT-4o 的平均音频响应延迟 320ms。以 ChatGPT 为代表的大型语言模型(LLM)已成为强大的通用任务解决器,但大多数 LLM 仅支持基于文本的交互,这限...……更多
OPPO FindX7安第斯大模型上手:智能语音助手脱胎换骨
...样,基于安第斯大模型的小布也不再只是功能较为单一的语音助手,而是拥有超级问答、用机助手、生成创作等强大能力的个人专属智能助理,那现在让我们一起看看,OPPO自研的AI大模型能带给我们什么样的惊喜吧。修图大师,...……更多
抢先OpenAI!Hume AI发布第二代情感智能AI,支持自定义语音,在线可玩
...为全球首个具有情商的对话式AI。EVI能够通过分析用户的语音,如口音、语气、语调、拟声词、节奏和停顿等,来理解用户的情绪和心理状态,并做出实时响应。与EVI 1相比,新发布的EVI 2的响应延迟减少了40%,且成本降低了30%。...……更多
...注入全新生命力。中国运营商发布首个支持30种方言混说语音大模型。25日,在第七届数字中国建设峰会上,中国电信人工智能研究院发布业内首个支持30种方言自由混说的语音识别大模型——星辰超多方言语音识别大模型,打破...……更多
刚刚,我们感受了一波最「像人」的国产AI,模型还是开源的
今年 5 月,OpenAI 首次展示了 GPT-4o 的语音功能,无论是对话的响应速度还是与真人声音的相似度,都颇为惊艳。特别是它允许用户随时打断,充分感知到用户的情绪并给予回应。大家突然发现,原来 AI 语音通话还能这么玩?但...……更多
大模型重塑版讯飞输入法来了!能懂每个人的AI输入
...。在此之上,搭载着讯飞星火端侧输入大模型、讯飞星火语音大模型的讯飞输入法14.0亮相,再次让人眼前一亮。讯飞输入法14.0的”AI输入增强“可以直接让输入法“猜你喜欢”,输入上句就能秒出下句,聊天气、游玩计划都不...……更多
全国产算力平台“飞星一号”的首个成果发布:讯飞星火V3.5来了
...此等“打工神器”获得台下一阵掌声点赞。正式发布星火语音大模型“大模型带来了语音技术发展的全新机会。”刘庆峰强调,让机器具备学习、推理和决策的能力,就是认知大模型要干的主要工作。“简单来说,借助大模型,...……更多
荣耀magicos9.0发布,提供小窗运行功能
...的各类需求。系统自研魔法大模型现已覆盖语言、图像、语音、多模态四大领域,且AI算力按需分配,效率提升。YOYO还可以帮助用户查找微信、支付宝中的自动续费服务,汇总后列出,询问用户是否需要取消自动续费。YOYO还可...……更多
十多年来最重要的一次!库克会暗掷“王炸”吗?
...门用于处理人工智能任务,并能提高速度,或者让公司的语音助手Siri更深入地嵌入应用程序以帮助用户执行任务。更大的期待来自于苹果是否会在WWDC上与OpenAI联手“出大招”。此前已经有消息称,苹果正在考虑与OpenAI或谷歌的...……更多
标贝科技携智能客服语音交互方案亮相中国呼叫中心及企业通信大会并荣获年度编辑推荐奖
...叫中心及企业通信大会在北京隆重举办。标贝科技携多款语音技术产品出席会议,“智能客服语音交互解决方案”凭借全面的定制能力、灵活的运维部署以及综合性能等多方面优势,荣获“2023年度编辑推荐奖”。中国呼叫中心...……更多
vivo自研大模型全家桶炸场,亮出PhoneGPT智能体,蓝心小V一键搞定衣食住行
...你需要的反馈和服务。依托文本大模型,结合自监督学习语音编解码、多语音任务学习和模态对齐等技术,蓝心小V在文本能力外,进一步具备了强大的语音表征理解与生成能力,进而让手机能够与人自然对话、翻译语言、模拟...……更多
中国电信在大模型领域成功布局ai技术
...大模型研发领域表现出了强烈的积极性,包括语义理解、语音识别、图像处理和多模态交互等方面。这些研发成果已经在多个行业和应用场景中得到了有效应用,展现了中国电信在AI技术本土化方面的成果,即更加符合中国的语...……更多
中国电信星辰AI大模型开源自研AI创新成果助推数字中国建设“正当时”
...完全自主研发的国内领先星辰系列大模型,构建了语义、语音、视觉及多模态大模型完备的基础框架。其中语义大模型于11月份发布千亿参数版本,在大模型知名榜单CSL排名第五、GAOKAO排名第七、AGIEval排名第八。视觉大模型赋能...……更多
英伟达发布80亿参数的ai模型
...面,这款AI模型将广泛应用于自然语言处理、图像识别、语音识别以及智能推荐等多个领域。 ……更多
更多关于科技的资讯:
江西热敏灸机器人获批上市 赋能百亿产业链提速
本报讯(全媒体记者李芳)10月9日,省药监局正式批准热敏灸机器人第二类医疗器械上市。这标志着江西热敏灸产业进入数智化时代
2025-10-17 07:10:00
厦门网讯 (厦门日报记者 薛尧)无人机、运动相机迎来降价潮!近日有市民发现相关热门产品价格跳水,记者走访了解到,我市多家大疆授权体验店中
2025-10-16 08:38:00
助力视弱群体畅行 公交视弱辅助系统“喊”您上车
视弱人士庄先生在公交视弱辅助系统的帮助下乘车。厦门网讯(文/图 厦门日报记者 林钦圣 通讯员 江安娜) “我们先找到并打开公交App
2025-10-16 08:38:00
10月15日晚,福州金融街商务区“亮灯”,迎接2025世界航海装备大会。
2025-10-16 08:59:00
近日,中石化石油工程设计有限公司自主研发的“管道环焊缝射线检测缺陷智能辅助评判系统”,顺利完成准确率测试。本次测试中,该系统总计检查了210张油气长输管道环焊缝射线检测底片
2025-10-16 09:03:00
当“遇到问题先到社交媒体上搜索”成为一代青少年的本能反应,当班级群、兴趣圈与直播平台深度嵌入他们的日常生活,社交网络正构成这代“数字原住民”成长的基本环境
2025-10-16 09:16:00
在人工智能技术飞速发展的今天,大模型以其强大的信息处理与泛化能力,正深刻改变医学领域的科研与临床实践。与此同时,以聚类分析
2025-10-16 09:57:00
人去世了朋友圈会消失吗?微信:对长时间不使用账号已不再回收
10月15日,“微信派”微信公众号发布最新一期播客,聊到了“真的很多人不发朋友圈了吗?”“人去世后,朋友圈会被回收吗?”等话题
2025-10-16 10:13:00
日日佳携手企知道,共同推动智能显示技术科技创新
近日,深圳日日佳显示技术有限公司(以下简称“日日佳”或“公司”)正式签约入驻企知道科创空间。作为专注于TFT-LCD模组制造的细分领域的国家高新技术企业和深圳市专精特新中小企业
2025-10-16 10:18:00
汽车测评 全球协同 | 解码C-NCAP——护航公众出行安全
当汽车从单纯的“交通工具”升级为承载多元需求的“出行载体”,是什么力量在守护这场变革的安全底线?2025世界NCAP大会即将在中国上海启幕
2025-10-16 10:50:00
花田玑密入选“2025山东省优秀兴农电商企业案例”
2025年10月16日,由山东省商务厅主办的“数商兴农庆丰收暨九九网购节”电商促消费活动在青岛莱西市人民广场隆重启动。花田玑密品牌创始人
2025-10-16 10:53:00
香港金管局公布生成式AI沙盒名单,蚂蚁数科入选技术合作伙伴
10月15日,香港金融管理局(HKMA)与香港数码港管理有限公司联合公布第二期生成式AI沙盒参与者名单。蚂蚁银行、中银香港
2025-10-16 11:24:00
卢伟冰官宣REDMI K90系列明天见!不排斥和小米直接竞争
10月16日,小米集团合伙人、总裁卢伟冰微博正式官宣,REDMI K90系列明天见。他发文透露,本次发布会是小米手机业务在旗舰新品发布季的第二篇章
2025-10-16 12:00:00
从2019年首届举办至今,VR/AR产业博览会已成为虚拟现实行业“不可或缺的重要盛事”,不仅是展示最新产品与技术的窗口
2025-10-16 12:07:00
在全球人工智能技术迅猛发展并向各领域深度渗透的背景下,高校思想政治教育作为培养时代新人的关键环节,正面临数字化转型的机遇与挑战
2025-10-16 13:40:00