• 我的订阅
  • 头条热搜
智谱上线glm-4-voice端到端情感语音模型
...月26日消息,据IT之家报道,智谱上线GLM-4-Voice端到端情感语音模型,用户可在“智谱清言”App上体验。该模型具备情感理解和表达能力,支持多语言和方言,且延时低、可随时打断。主要特点:情感表达与共鸣:支持高兴、悲伤...……更多
刚刚,我们感受了一波最「像人」的国产AI,模型还是开源的
今年 5 月,OpenAI 首次展示了 GPT-4o 的语音功能,无论是对话的响应速度还是与真人声音的相似度,都颇为惊艳。特别是它允许用户随时打断,充分感知到用户的情绪并给予回应。大家突然发现,原来 AI 语音通话还能这么玩?但...……更多
国家科学技术进步一等奖,为何给了这家AI国家队
...有限公司等高校及行业领军企业联合完成的“多语种智能语音关键技术及产业化”项目荣获2023年度国家科技进步奖一等奖。据悉,这是深度学习引发全球人工智能浪潮以来,过去十年人工智能领域的首个国家科学技术进步奖一...……更多
重磅!“国奖”放榜:十年来AI 领域首个国奖一等奖花落科大讯飞
...公司出现,而科大讯飞作为第一完成单位的“多语种智能语音关键技术及产业化”项目,更是斩获国家科学技术进步奖一等奖。这是深度学习引发全球人工智能浪潮以来,过去十年人工智能领域首个国家科学技术进步奖一等奖。...……更多
讯飞星火V4.0整体超越GPT-4 Turbo,8个国际权威测试集测评第一
...面领先。近期科大讯飞作为第一完成单位的《多语种智能语音关键技术及产业化》项目,获得国家科学技术进步奖一等奖。发布会现场,星火语音大模型迎来新突破。面向万物互联时代,本次星火语音大模型发布国际领先的多语...……更多
科大讯飞多语种技术,提供超1亿分钟公益服务
...卡片启动、听障模式文本对话等功能等,通过多语种智能语音技术,让更多听障人士“看见”声音,共享美好生活,实现自身价值。“听见AI的声音”累计提供超1亿分钟免费服务最近几年,律师谭婷一直走在为听障人士普法、为...……更多
中国版GPT-4o 来了,抢先OpenAI落地,8月底全民开放
...在8月底率先全民开放使用。这意味着国内首个对标GPT-4o语音功能的产品正式到来。8月19日,科大讯飞宣布星火语音大模型更新,正式推出星火极速超拟人交互,并将其能力落地在讯飞星火APP“小星畅聊”功能中。星火极速超拟...……更多
扣子OpenAPI突进智能语音战场!点满低延时、定制化、随时打断
...音是不是很有代入感?这其实是使用扣子正在内测的智能语音对话 OpenAPI 实现的。当然,无限游戏并非扣子智能语音对话 OpenAPI 所能实现的唯一功能。扣子智能体商店中那些智能体会的技能它都行,比如查询天气或新闻、口语练...……更多
首个可保留情感的音频LLM!Meta重磅开源7B-Spirit LM,一网打尽「音频+文本」多模态任务
...一个7B尺寸的Spirit LM的多模态语言模型,能够理解和生成语音及文本,可以非常自然地在两种模式间转换,不仅能处理基本的语音转文本和文本转语音任务,还能捕捉和再现语音中的情感和风格。在纯文本大模型取得进展的同时...……更多
...“转为普通话字幕”,新功能即可完成对视频内容的方言语音自动识别,并将视频里的方言内容转化成普通话字幕。目前,新功能第一期已经上线,支持粤语、闽语、吴语(上海)、西南官话(四川)、中原官话(陕西、河南)等,未来...……更多
一句话可触达200+车控动作!讯飞星火大模型已赋能红旗、奇瑞、广汽等车企
...模型V4.0发布会上,据科大讯飞董事长刘庆峰介绍:讯飞语音交互已广泛应用于国内外汽车市场,产品前装累计搭载超5700万套,市占率位于行业首位。并且,科大讯飞星火大模型已赋能红旗、奇瑞、广汽等多家车企,搭载该大模...……更多
OpenAI推迟上线语音功能,GPT-5或要等到明年,大模型技术速度正在放缓
...昌均大模型技术进展肉眼可见地放缓了,OpenAI此前说好的语音功能也鸽了。OpenAI针对此前展示的高级语音功能发布最新进展称,原计划在六月底开始向少部分ChatGPT Plus用户推出alpha版本,但需要再花一个月时间才能达到发布标准...……更多
“百模大战”,国产 GPT 大全
...统一表达,以图生音,以音生图,将开拓AI在视频配音、语音播报、标题摘要、海报创作等更多元场景的应用。现已开启内测APP。盘古华为盘古大模型可解决传统AI作坊式开发模式下不能解决的AI规模化、产业化难题,目前该模型...……更多
AI视频生成技术爆发 标贝科技虚拟数字人构建未来互动新体验
...营成本,使得规模化生产成为可能。其次,随着大模型、语音合成等智能交互技术的成熟,数字虚拟人对信息、知识的学习更充分,声音合成更加真实自然,提升了用户体验和交互感。再次,随着动捕技术和AI驱动的飞速发展,...……更多
讯飞版「Her」横空出世全民开放!百变人设逼真丝滑,情绪价值逆天
...了!只要下载讯飞星火APP,即可体验对标GPT-4o的超自然AI语音助手。目录中星火对话中实测惊艳要知道,传统的语音交互,一直面临着三大挑战:准确理解说话人意图;生成恰当响应;高效通过声音传达信息。以往的语音交互,...……更多
Meta推出“AI翻译官”!能翻译和转录近百种语言,已开源
...译和转录近百种语言。SeamlessM4T能实现近百种语言的自动语音识别、语音到文本翻译,以及近百种输入语言和35种输出语言的语音翻译、文本转语音翻译。构建通用语言翻译器有一定挑战性,因为现有的语音到语音、语音到文本...……更多
一文详解AIGC:忘记概念,只聊落地
...:根据用户的输入,自动生成声音,例如自然语言合成、语音合成等。声音识别:从音频中识别出语音内容,例如语音识别技术,可以将音频转换成文本,以便于人们浏览和管理。音频增强:对音频信号进行增强处理,例如去除...……更多
大模型重塑智能硬件!人手一个智能助手的时代来了?
...引入,尤其是对话用户界面(CUI)的崛起,用户可以通过语音、视觉、手势等多种方式与设备进行互动,带来了更加自然、直观的交互体验。“AI驱动的智能硬件不再单纯依赖固定的功能按钮或菜单,而是通过对用户意图的理解...……更多
抢先OpenAI!Hume AI发布第二代情感智能AI,支持自定义语音,在线可玩
...为全球首个具有情商的对话式AI。EVI能够通过分析用户的语音,如口音、语气、语调、拟声词、节奏和停顿等,来理解用户的情绪和心理状态,并做出实时响应。与EVI 1相比,新发布的EVI 2的响应延迟减少了40%,且成本降低了30%。...……更多
星火语音大模型由多语种语音合成
1月30日消息,星火语音大模型首次发布。据了解,星火语音大模型由多语种语音合成,在首批37个主流语种上已整体超越OpenAI公司推出的Whisper-large-v3,保持科大讯飞智能语音技术的国际领先水平。不仅如此,星火语音大模型在...……更多
外呼电销机器人:提升销售效率的未来之星
...动拨打电话并与潜在客户进行互动。外呼电销机器人具备语音识别、语音合成、对话逻辑和自动流程控制等功能,可以模拟人类语音和行为进行电话销售。外呼电销机器人的应用场景外呼电销机器人在多个行业和领域中有着广泛...……更多
2024外滩大会展示AI应用新成果:机器人能自动烹饪、提供情感陪伴、仿生手可以手随心动……
...款APP和一款硬件产品,采用了仿生行为系统,用户可通过语音视频、手势控制等方式与其进行互动,主要为儿童、老人等用户提供情感陪伴和生活方面的帮助。“阿奇”桌面机器人。 上游新闻记者 齐鑫 摄“它主要由4个方面的...……更多
大模型时代现象级“智慧涌现” 讯飞星火认知大模型如何燎原“星星之火”?
...文便就此诞生;点击说话就能1对1口语陪练告别哑巴英语;语音输入,便可自动整理输出工作会议记录;对准卷子拍照,就能轻松获得复杂数学题的解答过程……今年以来,国产大模型层出不穷,以讯飞星火为代表的生成式AI成为内容创作...……更多
别只盯着ChatGPT版Her,多模态AI拟人互动上,国内玩家也支棱起来了
...新势力。其中Semi 赛道第一名由社交平台 Soul App 摘得,其语音技术团队凭借可行性创新技术方案拔得头筹。 不过,在揭秘 Soul 团队技术方案之前,我们有必要先来了解 AI 在多种模态中的情感识别能力。人机交互下一步要让 AI ...……更多
YouTube会自动识别语言并生成多语种配音版本
...。YouTube的自动配音功能采用了谷歌的Gemini技术模拟人类语音。不过该公司提醒,技术仍在初期阶段,可能并不完美,某些翻译或配音效果可能存在问题。此外,YouTube还提醒创作者,另一个名为“表现性语音”的功能即将上线,...……更多
国内首个极速超拟人交互向全民开放 可在星火大模型中体验
...率先面向全民开放体验。据了解,这是国内首个对标GPT-4o语音的大模型产品,用户可在讯飞星火APP中直接体验使用。根据官方介绍,星火极速超拟人交互在响应和打断速度、情绪感知情感共鸣、语音可控表达、人设扮演四个方面...……更多
信也科技斩获2023世界人工智能大会算法金奖,展现硬核实力
...科技自主研发的《G-ASR:支持多语种的高性能离线流式一体语音识别系统》斩获赛道金奖《金融客服:生成式数字人坐席的大模型算法》获创业组TOP50G-ASR:支持多语种的高性能离线流式一体语音识别系统G-ASR(自动语音识别)系统,由语...……更多
OpenAI发布免费新品GPT-4o:可对音频、视觉和文本实时推理,与人自然对话,功能秒杀Siri
...些模式的模型,OpenAI仍在探索模型的功能及其局限性。新语音模式是一种语音聊天助手。据Business Insider(商业内幕)报道,它能够与用户进行自然的来回对话,能够带着情感说话,它可以假装兴奋、友好,甚至讽刺。这可以秒...……更多
科大讯飞入局大模型混战,刘庆峰:10月底将赶超ChatGPT
...的是,不同于其它大语言模型,讯飞星火大模型可以支持语音输入,并将语音识别成文字,同时生成的内容还可以用语音朗读出来,甚至可以合成虚拟人制作成视频输出,视频背景也可以随着文字而进行变动。“孙悟空和奥特曼...……更多
7个第一,11个首发,讯飞星火放大招,大模型规模化落地可期!
...能力。超拟人数字人首次亮相,多模态的交互从超拟人的语音变成超拟人的数字人,实现语音、视频、图文的全部联动的多模态交互。 硬件产品端,内嵌了星火多模AIUI能力的讯飞AI学习机阅读伙伴即将上线,孩子们“指哪读哪...……更多
更多关于科技的资讯:
宁波市消保委发布“大路灯”比较试验结果:“适璞”落地灯电气安全项目不符合要求
中国消费者报杭州讯(记者郑铁峰)“最接近日光的照明体验”“让孩子的用眼环境更加舒适”……近年来,作为新兴的护眼灯具产品
2025-02-18 11:13:00
昆仑万维开源中国首个面向AI短剧创作的视频生成模型SkyReels-V1,重塑AI短剧行业格局
2月18日,昆仑万维开源中国首个面向AI短剧创作的视频生成模型SkyReels-V1、中国首个SOTA级别基于视频基座模型的表情动作可控算法SkyReels-A1
2025-02-18 11:13:00
橘子冒烟小心肺部真菌感染:大量孢子形成烟雾
快科技2月18日消息,按压橘子冒烟是咋回事?据报道,这通常是因为霉菌繁殖产生的孢子扩散。霉菌成熟后会产生大量孢子,当微小的孢子在空气中扩散时
2025-02-18 11:25:00
路遇限宽墩司机不敢开:打开智驾寻求最强外援
快科技2月18日消息,日常生活中我们开车时可能会遇到限宽墩,每当这个时候,不少新手司机都觉得眼前一黑,不敢通过。而当前新能源汽车越发加宽
2025-02-18 11:25:00
“两新”政策赋能,太原电子产品市场“热”力全开
消费日报网讯(记者 刘自昌)2025年,作为 “十四五” 规划收官与 “十五五” 规划谋划的承上启下之年,意义非凡。在这一关键节点
2025-02-18 11:32:00
30家轻工企业入选工信部实数融合典型案例
本报讯 近日,工业和信息化部公布了2024年实数融合典型案例名单,235个案例上榜。轻工行业“成绩单”亮眼,共有30家企业榜上有名
2025-02-18 11:32:00
漫评丨这些机器人企业“代言”苏州新质生产力
□秦柳青在今年总台央视春晚上,人形机器人的“赛博秧歌”实力出圈了。在苏州,人形机器人不仅能“炒菜浇花”,还能“进厂打工”
2025-02-18 11:36:00
联通数科墨攻安全运营服务平台,护航亚冬安全,彰显卓越实力
2025年2月7-14日,第九届亚洲冬季运动会在哈尔滨隆重举办,这场冰雪盛会吸引了全球目光。作为本届亚冬会的官方通信及云服务合作伙伴
2025-02-18 11:45:00
小米青年公寓内部实拍首曝!减轻北漂毕业生租房贵压力
快科技2月18日消息,日前,小米市场部管培生赵长琳(抖音、小红书昵称“二赵上道”)全网首发分享了位于北京昌平的小米青年公寓内部实拍视频
2025-02-18 11:55:00
本田:若日产社长辞职 我们愿意重启合并谈判
快科技2月18日消息,据知情人士透露,如果日产汽车公司社长内田诚卸任,本田愿意重启收购谈判,以创建世界第四大汽车生产商
2025-02-18 11:55:00
深圳70名AI公务员上岗引热议 AI能取代公务员吗:DeepSeek是这么回答的
快科技2月28日消息,日前,#深圳70名AI公务员上岗# 的话题登上热搜,引发网友关注。据报道,近日,广东深圳福田区推出了基于DeepSeek开发的AI数智员工
2025-02-18 11:55:00
两女子骑电动车走机动车道并闯红灯:被撞翻还需负全责
快科技2月18日消息,行人闯红灯被车撞,该怎么判罚?也许这个案例可以全国推广。据“公安部交通管理局”最新披露的案例显示
2025-02-18 11:55:00
全社会都能共享数据!国家公共数据资源登记平台将于3月上线
快科技2月18日消息,据央视报道,今天,国家数据局举行新闻发布会,介绍公共数据开发利用最新情况。相关负责人介绍,国家公共数据资源登记平台将于3月1日上线试运行
2025-02-18 11:55:00
SSD直奔PB时代!闪迪已在路线图中列出
快科技2月18日消息,在近日的投资者日活动上,闪迪宣布了其开发容量高达PB级固态硬盘的计划,不过遗憾的是路线图中并未公布具体的时间
2025-02-18 11:55:00
学而思今天正式发布接入DeepSeek的全新“随时问”APP
学而思今天正式发布接入DeepSeek的全新“随时问”APP。该产品深度融合DeepSeek R1智能推理,依托学而思22年教研沉淀
2025-02-18 12:01:00