• 我的订阅
  • 头条热搜
让大模型能听会说,国内机构开源首个端到端语音对话模型Mini-Omni
...非与启元世界多模态负责人吴昌桥,研究兴趣为多模态大模型、LLM Agents 等。本论文上线几天内在 github 上斩获 1000+ 星标。随着多类型大模型的飞速发展,全球 AI 已经进入到了多模交互时代。2024 年 5 月,OpenAI 推出了全新的多模...……更多
字节跳动推出对话式ai实时交互解决方案
...日宣布推出对话式AI实时交互解决方案,搭载火山方舟大模型服务平台。该方案通过火山引擎RTC实现语音数据的采集、处理和传输,并深度整合豆包・语音识别模型和豆包・语音合成模型,简化语音到文本和文本到语音的转换过...……更多
标贝科技GPT语音助手测评:看语音大模型如何重塑语音交互体验
...步,语音助手已经融入了我们生活的方方面面。同时在大模型落地千行百业的大潮之下,语音助手也快速卷入AI革命的浪潮中。GPT大模型作为一种强大的语言生成模型,通过语言理解、生成能力和上下文记忆能力,不断地自我完...……更多
OpenAI推迟上线语音功能,GPT-5或要等到明年,大模型技术速度正在放缓
出品 | 搜狐科技作者 | 梁昌均大模型技术进展肉眼可见地放缓了,OpenAI此前说好的语音功能也鸽了。OpenAI针对此前展示的高级语音功能发布最新进展称,原计划在六月底开始向少部分ChatGPT Plus用户推出alpha版本,但需要再花一个...……更多
OpenAI发布免费新品GPT-4o:可对音频、视觉和文本实时推理,与人自然对话,功能秒杀Siri
...布新产品,不是AI搜索引擎,也不是GPT-5,而是GPT-4o旗舰模型。OpenAI在ChatGPT中引入GPT-4o并免费提供更多功能。GPT-4o的“o”代表“omni”,意为全能,与现有模型相比,它在视觉和音频理解方面尤其出色。GPT-4o可以在音频、视觉和...……更多
语音能力再突破!讯飞星火语音大模型即将发布
...人机交互将迎来新的发展阶段。1月30日,讯飞星火认知大模型V3.5升级发布会即将举行,会上将同步发布讯飞星火语音大模型, 此外还将发布开源大模型等。2023年5月6日,科大讯飞正式发布了讯飞星火认知大模型,可以基于自然...……更多
讯飞星火首发智能体平台,敏捷触达大模型应用企业落地最后一公里
4月26日,讯飞星火大模型V3.5(以下简称“讯飞星火”)春季上新。面向用户高效准确知识获取的痛点,科大讯飞发布业界首个长文本、长图文、长语音大模型,不仅能够把各种信息来源的海量文本、图文资料、会议录音等进行...……更多
科大讯飞入局大模型混战,刘庆峰:10月底将赶超ChatGPT
出品 | 搜狐科技作者 | 梁昌均国内大模型混战之下,科大讯飞成为最新的入局者。自去年12月15日,科大讯飞启动1+N的大模型专项攻关后,历时近半年终于发布了最新技术成果。5月6日,科大讯飞正式对外发布讯飞星火认知大模...……更多
全面透视豆包:功能、版本、价格、优势、应用
...率与竞争力。一、豆包介绍豆包是字节跳动公司基于云雀模型开发的 AI 工具,提供聊天机器人、写作助手以及英语学习助手等功能,它可以回答各种问题并进行对话,帮助人们获取信息,支持网页、客户端、APP、插件等形式。...……更多
别只盯着ChatGPT版Her,多模态AI拟人互动上,国内玩家也支棱起来了
...利用少量有标签和大量无标签数据视频数据来训练自己的模型,并对模型在无标签数据集上的表现和泛化能力进行评估。该赛道获胜的关键在于通过改进半监督学习技术来提高模型情感识别性能,比如预测情绪类别的准确率。自...……更多
《崩坏:星穹铁道》1.4版本内容介绍
...器及特效、角色「开拓者(存护•火)」的武器、NPC信使模型中,钻石材质有误的问题。 ● 修复了角色「素裳(巡猎•物理)」在转身时胸前流苏显示异常的问题。● 修复了特定战斗场景中,角色「三月七(存护•冰)」施...……更多
讯飞版「Her」横空出世全民开放!百变人设逼真丝滑,情绪价值逆天
...么接不上来,要么就开始「已读乱回」。但这次的小星,模型响应的快速和流畅度让人眼前一亮。即使随时打断、插话,小星依旧能做到秒回,这个快速反应能力,让我们的观感仿佛真人一般。比如,我们拿前段时间的全球大热...……更多
2022生成模型进展有多快,新论文盘点9类生成模型代表作
ChatGPT的出现,彻底将生成AI推向爆发。但别忘了,AI生成模型可不止ChatGPT一个,光是基于文本输入的就有7种——图像、视频、代码、3D模型、音频、文本、科学知识……尤其2022年,效果好的AI生成模型层出不穷,又以OpenAI、Meta...……更多
科大讯飞刘庆峰:讯飞星火大模型10月底整体赶超ChatGPT
星星之火,可以燎原。5月6日,讯飞星火认知大模型成果发布会在安徽合肥如期举行。科大讯飞董事长刘庆峰、研究院院长刘聪发布讯飞星火认知大模型,现场实测大模型七大核心能力,并发布教育、办公、汽车、数字员工四大...……更多
详解京东产业版GPT:千亿级大模型拟今年发布,已明确有垂直客户需求
利用Bing Image Creator AI 技术生成的“言犀大模型”图片(来源:钛媒体App编辑/New Bing搜索)“最近,生成式模型进展突飞猛进,甚至很多领域超过了人类职业的生成效果。”京东集团副总裁、京东科技智能服务与产品部负责人何...……更多
汉王语音王 App 发布:支持 AI 语音记录、对话翻译、同声传译
...息如下:据介绍,汉王语音王基于汉王自研多模态天地大模型研发,集成 AI 语音记录、智能翻译与同声传译等技术,支持 AI 精准转写、拍录同步(自动裁边)、话稿整理、智能总结及不间断实时翻译等功能。 AI 语音记录AI 语...……更多
云知声推出山海多模态大模型:实时生成文本、音频和图像
...家 8 月 26 日消息,云知声于 23 日宣布推出山海多模态大模型。通过整合跨模态信息,山海多模态大模型能够接收文本、音频、图像等多种形式作为输入,并实时生成文本、音频和图像的任意组合输出。▲云知声山海助手微信小...……更多
抢先OpenAI!Hume AI发布第二代情感智能AI,支持自定义语音,在线可玩
...提升,还支持自定义语音EVI 2集成了一个先进的语音生成模型和情感大型语言模型(eLLM),能够处理和生成文本及音频。这种多模态方法使得EVI 2生成的语音听起来更自然,语调更恰当,表现力更高,输出更连续。此外,在同一...……更多
CybotStar——大模型一站式应用开发平台
大模型在垂直产业正朝着不同的方向奋力进发。据研究机构调研指出:有四分之三的受访CEO认为,部署先进的生成式人工智能将为企业带来竞争优势。但一直以来,大模型落地产业似乎总是有些“水土不服”。直面大模型产业...……更多
喜马拉雅珠峰语音生成技术实现5秒极速克隆,亮相云栖大会
...新的自研语音技术成果,包括喜马拉雅珠峰语音生成式大模型和第二代智能语音交互系统,为参会者展示AIGC与文娱音频产业深度融合的最新成果。据了解,喜马拉雅珠峰语音生成式大模型是喜马拉雅的一项创新性技术,具备快...……更多
科大讯飞多语种技术,提供超1亿分钟公益服务
...冠军及7个语种非受限赛道冠军;2024年,讯飞星火语音大模型的首批37个主流语种的语音识别效果超过OpenAI最新语音大模型Whisper V3。 星火语音大模型首批覆盖语种中,24个主要语种识别率达到了90%(已超过实用门槛);13个重点...……更多
“寡姐”斯嘉丽·约翰逊怒怼OpenAI山寨其声音:连我的朋友都分辨不出来
...,强调所有配音均来自专业演员。此前,OpenAI推出新旗舰模型GPT-4o,该模型在保留了之前的五种语音模式的基础上,大大提升了图像和音频理解方面的能力,能够进行实时语音通信,可以识别音调、说话的人和背景噪音,甚至可...……更多
能“听懂”用户情绪的对话机器人,已成为营销获客新的“技术红利”
...活实验室在春节前做的一次暖心实验,依托京东云言犀大模型和言犀智能外呼产品,帮助那些害怕回家的人拨开云雾,看到那些心结背后的真实答案。教机器说话像真人,言犀用了什么“魔法”智能外呼拨出的电话,不仅能听懂...……更多
讯飞星火v4.0将于6月27日发布
6月11日消息,科大讯飞今年3月推出了讯飞星火大模型V3.5,而讯飞星火V4.0将于今年6月27日正式发布。科大讯飞董事长刘庆峰在公司成立25周年司庆活动上透露,讯飞星火V4.0发布时将展示最新的端到端智能语音落地成果,同时公...……更多
AI大模型时代,如何用RAG技术重塑传统智能客服问答机器人?
...险行业智能客服的调研,因为当时的AI还无法像现在的大模型一样理解大家的意图(文本+图片),所以原本智能对话机器人的实现不仅费时费力,且还没有一个很好的效果,导致“在智能对话机器人的部分,在晚上10:50我还测...……更多
ChatGPT该给语音助手们补补“智商”了
...,同时在此基础上还将打造针对智能设备场景的人工智能模型「小度灵机」并应用到小度全系产品。而据小度官方数据,搭载小度的智能设备已经进入了4000万户家庭。当然,按照百度此前的规划,文心一言要在本月才上线测试...……更多
趣丸科技副总裁兼CTO谢睿:多模态智能激发应用新场景 | 新质生产力·AI Partner大会
...沿技术研究和提供企业级解决方案。我们目前围绕四个大模型(生成式3D大模型、生成式音频大模型、生成式动作大模型、对话大模型)在开展技术自研,后续将推动规模化落地应用。前段时间GPT-4o的问世,相信大家都看到很多...……更多
openai免费开放chatgptvoice功能
...年9月推出了基于ChatGPT的文本转语音功能,使用神经网络模型从文本生成类似人类的语音。该功能此前仅面向ChatGPTPlus订阅用户提供,现在向所有免费用户推出。该系统通过采样配音演员录制的几秒钟音频,能够创建具有不同口...……更多
免费!免费!免费!GPT-4o是什么?是你想要的一切
...内,用户将会陆续自动更新到GPT-4o。GPT-4o作为新一代旗舰模型,把AI工具的使用门槛降到了更低的程度,不仅比上一代速度快两倍,能实现无延迟实时对话,而且用户不用注册,功能全部免费。此外,ChatGPT现在有桌面版本了,轻...……更多
亚马逊开发史上最大文本转语音模型
...能研究团队宣布开发了一个据称是史上最大的文本转语音模型,该模型拥有最多的参数,并使用了最大的训练数据集。研究人员已经在arXiv预印本服务器上发表了一篇论文,详细描述了模型的开发和训练过程。近年来,像ChatGPT这...……更多
更多关于科技的资讯:
扎克伯格最新发声:智能眼镜未来会像手机一样普及,苹果将成Meta主要对手
在本周的一次采访中,Meta首席执行官马克·扎克伯格谈到了让Meta在多次技术浪潮中保持前位的策略方法,并指出了苹果的战略不足
2024-09-21 18:17:00
“月满峨眉·金顶探月” 蜀山登月-无人机带你领略超级月亮之美
在中秋佳节的团圆之夜,峨眉山以壮丽的自然风光和科技创新为媒,呈现了一场惊艳的超级月亮直播盛宴。9月17日,中秋满月达到“近地点满月”的罕见天象
2024-09-21 18:17:00
武汉大学首个人形机器人“天问”亮相:身长 1.7m、体重 65kg
IT之家 9 月 20 日消息,武汉大学首个人形机器人“天问”亮相。据武汉大学工业科学研究院副教授李淼介绍,“天问”一名的取名灵感来源于《楚辞》中屈原的千古名篇《天问》
2024-09-21 18:17:00
高通被曝洽谈收购英特尔 后者8月刚宣布裁员
【CNMO科技消息】9月21日,有国外媒体报道,相关知情人士表示芯片巨头高通正在洽谈收购英特尔。如果这笔交易成功,将成为半导体行业最大的并购案之一
2024-09-21 18:19:00
秒光!天猫服饰5折会场太火爆,品牌连夜补货,网友直呼:真香!
9月20日晚8点,天猫突发“大额降温补贴”,一线大牌秋冬新品全部5折。8点刚过,数百万消费者冲进天猫,5折补贴券瞬间秒光
2024-09-21 13:08:00
家电以旧换新正当时,新国品海信中央空调携重磅权益礼遇
“金九银十”装修季,选购空调正当时,更优惠、省心地买到高品质的空调产品是消费者的朴素愿望。在此方面,国家今年以来大力推广的消费品以旧换新政策东风
2024-09-21 13:48:00
国网天津城南供电公司:中压发电车“上岗” 检修施工“零”停电 扫码阅读手机版
9月19日7时,津南区北闸口镇天北里市场一如既往热闹了起来,市场内熙熙攘攘、早点铺子人头攒动。在市场不远处的天北里小区内
2024-09-21 13:54:00
近年数字潮玩运动馆火爆全网
2024年,为什么越来越多的人关注数字潮玩运动馆?首先,数字潮玩运动馆是通过数字智能科技、IT信息、互联网技术和体育,娱乐
2024-09-21 14:15:00
据英国《金融时报》网站9月12日报道,英国内政部警务和犯罪预防国务大臣戴安娜·约翰逊的手提包10日在高级警务官员年度会议上被偷
2024-09-21 14:16:00
FCB-EW9500H摄像头,2160P/60视频输出标准
FCB-EW9500H医疗术野摄像头以其卓越的2160P超高清分辨率和60帧流畅视频输出,不仅重新定义了清晰与流畅的界限
2024-09-21 14:20:00
游戏代理真的好做吗?怎么挑选一家靠谱的手游代理平台
游戏代理真的好做吗?实际上无论是自主创业或是挑选别的领域去工作中,大家都难以避免会问自己这种问题,例如这个项目怎么样?我能做好他吗
2024-09-21 14:20:00
凯茉锐|ILX-LR1相机在《黑神话:悟空》中的细节创新
在《黑神话:悟空》这款备受瞩目的游戏开发过程中,全画幅可扩展系统遥控相机ILX-LR1以其卓越的性能和独特的设计,为游戏的三维重建和场景细节捕捉带来了前所未有的创新
2024-09-21 14:21:00
世界制造业大会|合肥:推动车规级“芯屏”导入整车厂
大皖新闻讯 随着新能源汽车与智能网联汽车的快速发展,屏幕、芯片在汽车上的应用越来越广泛和紧密。作为“芯屏汽合”产业发展集聚地
2024-09-21 14:21:00
索尼FCB模组FCB-EV9520L低延时远程监控解决方案
在远程监控领域,对实时性的追求从未停歇。索尼凭借其创新技术,推出了FCB-EV9520L模组,这一产品以其卓越的低延时性能
2024-09-21 14:24:00
微弱光线下的清晰视界 —— FCB-EV9500L医疗摄像头
FCB-EV9500L医疗术野摄像头,以其超凡的低光敏感度和卓越的图像处理能力,为我们在微弱光线下打开了全新的视界。下面凯茉锐小编为您详细介绍
2024-09-21 14:25:00