• 我的订阅
  • 头条热搜
让大模型能听会说,国内机构开源首个端到端语音对话模型Mini-Omni
...非与启元世界多模态负责人吴昌桥,研究兴趣为多模态大模型、LLM Agents 等。本论文上线几天内在 github 上斩获 1000+ 星标。随着多类型大模型的飞速发展,全球 AI 已经进入到了多模交互时代。2024 年 5 月,OpenAI 推出了全新的多模...……更多
刚刚,重磅发布!阿里、腾讯、科大讯飞在列
...首批公开的算法备案清单。值得注意的是,此次名单中大模型算法并不多,除了百度PLATO大模型算法和讯飞星火认知大模型算法之外,阿里的多模态算法达摩院交互式多能型合成算法也在列。受到这一消息刺激,AI概念股午后突...……更多
Meta发布 AI 模型SeamlessM4T,可转录和翻译近100种语言|钛快讯
...在加紧追赶,以及重新组合其关于语言、对话等领域与大模型相关的研究。去年底之后,Meta陆续发布No Language Left Behind(不留语言)文本到文本的机器翻译模型,支持200种语言,以及开发多语言数据集SpeechMatrix、生成文本到声音...……更多
字节跳动推出对话式ai实时交互解决方案
...日宣布推出对话式AI实时交互解决方案,搭载火山方舟大模型服务平台。该方案通过火山引擎RTC实现语音数据的采集、处理和传输,并深度整合豆包・语音识别模型和豆包・语音合成模型,简化语音到文本和文本到语音的转换过...……更多
标贝科技GPT语音助手测评:看语音大模型如何重塑语音交互体验
...步,语音助手已经融入了我们生活的方方面面。同时在大模型落地千行百业的大潮之下,语音助手也快速卷入AI革命的浪潮中。GPT大模型作为一种强大的语言生成模型,通过语言理解、生成能力和上下文记忆能力,不断地自我完...……更多
openai语音翻译又出新功能了!
...喜欢的声音。 这项新的语音功能由一个新的文本到语音模型支持,能够在短时间内从纯文本生成与人类相似的音频。团队与专业配音演员合作,为每种声音创设独特的音调。同时,他们使用了自己的开源语音识别系统Whisper,将...……更多
刚刚,我们感受了一波最「像人」的国产AI,模型还是开源的
...EglhJA与此同时,智谱还重磅宣布,该功能背后的情感语音模型 GLM-4-Voice 同步正式开源。不久后,相关能力还将上线视频通话,为所有用户提供一个既能「看」又能「说」的 AI 语音助理。开源地址:https://github.com/THUDM/GLM-4-Voice自...……更多
OpenAI推迟上线语音功能,GPT-5或要等到明年,大模型技术速度正在放缓
出品 | 搜狐科技作者 | 梁昌均大模型技术进展肉眼可见地放缓了,OpenAI此前说好的语音功能也鸽了。OpenAI针对此前展示的高级语音功能发布最新进展称,原计划在六月底开始向少部分ChatGPT Plus用户推出alpha版本,但需要再花一个...……更多
一文详解AIGC:忘记概念,只聊落地
... Face Transformers:面向自然语言处理任务的一系列数据集、模型和工具箱,包括对话生成、摘要、自动问答、翻译等。IBM Watson Assistant:用于构建虚拟助手和聊天机器人的工具,支持多种语言和平台。Google Cloud Natural Language:针对...……更多
OpenAI发布免费新品GPT-4o:可对音频、视觉和文本实时推理,与人自然对话,功能秒杀Siri
...布新产品,不是AI搜索引擎,也不是GPT-5,而是GPT-4o旗舰模型。OpenAI在ChatGPT中引入GPT-4o并免费提供更多功能。GPT-4o的“o”代表“omni”,意为全能,与现有模型相比,它在视觉和音频理解方面尤其出色。GPT-4o可以在音频、视觉和...……更多
语音能力再突破!讯飞星火语音大模型即将发布
...人机交互将迎来新的发展阶段。1月30日,讯飞星火认知大模型V3.5升级发布会即将举行,会上将同步发布讯飞星火语音大模型, 此外还将发布开源大模型等。2023年5月6日,科大讯飞正式发布了讯飞星火认知大模型,可以基于自然...……更多
讯飞星火首发智能体平台,敏捷触达大模型应用企业落地最后一公里
4月26日,讯飞星火大模型V3.5(以下简称“讯飞星火”)春季上新。面向用户高效准确知识获取的痛点,科大讯飞发布业界首个长文本、长图文、长语音大模型,不仅能够把各种信息来源的海量文本、图文资料、会议录音等进行...……更多
首个VR端3D角色扮演AI发布!南洋理工公开SOLAMI技术报告,端到端VLA模型驱动,唱跳都能陪你玩
...进行沉浸式互动。该系统利用先进的社交视觉-语言-行为模型,结合合成的数据集,提供更自然的交流体验,超越了传统的文本和语音交互。世界上第一个VR端 3D版的角色扮演AI就在刚刚诞生了!AI角色扮演类游戏(如C.AI、Talkie)...……更多
仅用4块GPU、不到3天训练出开源版GPT-4o,这是国内团队最新研究
...4o 的平均音频响应延迟 320ms。以 ChatGPT 为代表的大型语言模型(LLM)已成为强大的通用任务解决器,但大多数 LLM 仅支持基于文本的交互,这限制了它们在不适合文本输入输出的场景中的应用。GPT-4o 的出现使得通过语音与 LLM 进...……更多
科大讯飞入局大模型混战,刘庆峰:10月底将赶超ChatGPT
出品 | 搜狐科技作者 | 梁昌均国内大模型混战之下,科大讯飞成为最新的入局者。自去年12月15日,科大讯飞启动1+N的大模型专项攻关后,历时近半年终于发布了最新技术成果。5月6日,科大讯飞正式对外发布讯飞星火认知大模...……更多
别只盯着ChatGPT版Her,多模态AI拟人互动上,国内玩家也支棱起来了
...利用少量有标签和大量无标签数据视频数据来训练自己的模型,并对模型在无标签数据集上的表现和泛化能力进行评估。该赛道获胜的关键在于通过改进半监督学习技术来提高模型情感识别性能,比如预测情绪类别的准确率。自...……更多
全面透视豆包:功能、版本、价格、优势、应用
...率与竞争力。一、豆包介绍豆包是字节跳动公司基于云雀模型开发的 AI 工具,提供聊天机器人、写作助手以及英语学习助手等功能,它可以回答各种问题并进行对话,帮助人们获取信息,支持网页、客户端、APP、插件等形式。...……更多
《崩坏:星穹铁道》1.4版本内容介绍
...器及特效、角色「开拓者(存护•火)」的武器、NPC信使模型中,钻石材质有误的问题。 ● 修复了角色「素裳(巡猎•物理)」在转身时胸前流苏显示异常的问题。● 修复了特定战斗场景中,角色「三月七(存护•冰)」施...……更多
讯飞版「Her」横空出世全民开放!百变人设逼真丝滑,情绪价值逆天
...么接不上来,要么就开始「已读乱回」。但这次的小星,模型响应的快速和流畅度让人眼前一亮。即使随时打断、插话,小星依旧能做到秒回,这个快速反应能力,让我们的观感仿佛真人一般。比如,我们拿前段时间的全球大热...……更多
科大讯飞刘庆峰:讯飞星火大模型10月底整体赶超ChatGPT
星星之火,可以燎原。5月6日,讯飞星火认知大模型成果发布会在安徽合肥如期举行。科大讯飞董事长刘庆峰、研究院院长刘聪发布讯飞星火认知大模型,现场实测大模型七大核心能力,并发布教育、办公、汽车、数字员工四大...……更多
2022生成模型进展有多快,新论文盘点9类生成模型代表作
ChatGPT的出现,彻底将生成AI推向爆发。但别忘了,AI生成模型可不止ChatGPT一个,光是基于文本输入的就有7种——图像、视频、代码、3D模型、音频、文本、科学知识……尤其2022年,效果好的AI生成模型层出不穷,又以OpenAI、Meta...……更多
扣子OpenAPI突进智能语音战场!点满低延时、定制化、随时打断
...无限游戏。有意思的是,就算你大开脑洞,胡乱游戏,大模型 AI 也能帮你把故事圆起来,让这个游戏无限地继续下去。你甚至可以召唤郭德纲来战斗视频链接:https://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2650943856&i……更多
详解京东产业版GPT:千亿级大模型拟今年发布,已明确有垂直客户需求
利用Bing Image Creator AI 技术生成的“言犀大模型”图片(来源:钛媒体App编辑/New Bing搜索)“最近,生成式模型进展突飞猛进,甚至很多领域超过了人类职业的生成效果。”京东集团副总裁、京东科技智能服务与产品部负责人何...……更多
谷歌AI播客刚火,Meta就开源了平替,效果一言难尽
随着谷歌和 Meta 相继推出基于大语言模型的 AI 播客功能,将极大地丰富人类用户与 AI 智能体互动的体验。上个月,谷歌宣布对旗下 AI 笔记应用 NotebookLM 进行一系列更新,允许用户生成 YouTube 视频和音频文件的摘要,甚至可以...……更多
英伟达:AI扮演的NPC难辨真假
...23-05-30 05:12:10 作者:老王有很多方法可以让你与大型语言模型进行文字聊天,从ChatGPT到Google Bard或MLC LLM,一个可以在你的手机上运行的本地聊天机器人。人工智能的下一个前沿是将LLM的力量带给游戏中的NPC(非玩家角色),在...……更多
汉王语音王 App 发布:支持 AI 语音记录、对话翻译、同声传译
...息如下:据介绍,汉王语音王基于汉王自研多模态天地大模型研发,集成 AI 语音记录、智能翻译与同声传译等技术,支持 AI 精准转写、拍录同步(自动裁边)、话稿整理、智能总结及不间断实时翻译等功能。 AI 语音记录AI 语...……更多
云知声推出山海多模态大模型:实时生成文本、音频和图像
...家 8 月 26 日消息,云知声于 23 日宣布推出山海多模态大模型。通过整合跨模态信息,山海多模态大模型能够接收文本、音频、图像等多种形式作为输入,并实时生成文本、音频和图像的任意组合输出。▲云知声山海助手微信小...……更多
抢先OpenAI!Hume AI发布第二代情感智能AI,支持自定义语音,在线可玩
...提升,还支持自定义语音EVI 2集成了一个先进的语音生成模型和情感大型语言模型(eLLM),能够处理和生成文本及音频。这种多模态方法使得EVI 2生成的语音听起来更自然,语调更恰当,表现力更高,输出更连续。此外,在同一...……更多
...。深度合成服务提供者和技术支持者提供具有以下功能的模型、模板等工具的,应当依法自行或者委托专业机构开展安全评估:一、生成或者编辑人脸、人声等生物识别信息的;二、生成或者编辑可能涉及国家安全、国家形象、...……更多
CybotStar——大模型一站式应用开发平台
大模型在垂直产业正朝着不同的方向奋力进发。据研究机构调研指出:有四分之三的受访CEO认为,部署先进的生成式人工智能将为企业带来竞争优势。但一直以来,大模型落地产业似乎总是有些“水土不服”。直面大模型产业...……更多
更多关于科技的资讯:
日亏700万 日产汽车叫停本田合并
确定了,日产和本田一拍两散。从确认合体,到官宣“闪离”,只过去短短52天。这场合并,原本就被不少业内人士不看好,现实却也如他们预料那般
2025-02-16 14:53:00
直降4.3万!别克GL8陆上公务舱限时优惠:18.99万元起
快科技2月16日消息,上汽通用别克品牌宣布,别克GL8陆上公务舱限时优惠价为18.99万元起,相比官方指导价全系降低4
2025-02-16 14:53:00
节后多地机票节后低至一两折 上海飞三亚仅需199元
快科技2月16日消息,春节假期之后,多地机票价格明显回落,尤其是一些旅游城市机票回调幅度更大,适合错峰旅游。据报道,2月7日起至3月底
2025-02-16 14:53:00
中国电影的海外困境 藏在百亿《哪吒2》中
2023年,光线传媒董事长王长田预测《哪吒2》票房可能超70亿被群嘲时,谁也没有想到,他还是太保守了。2月13日晚,《哪吒2》票房冲破100亿元
2025-02-16 15:23:00
画面离谱!韩国多名空姐打开应急舱门还站机翼穿制服自拍 航司官方回应
快科技2月16日消息,据韩国JTBC电视台独家报道,近日,韩国廉价航空易斯达航空(Eastar Jet)多名空姐在清州机场站在机翼上身穿制服拍照
2025-02-16 15:23:00
男子利用15分钟内免停车费钻漏洞:逃费71次 少掏2500元停车费
快科技2月16日消息,不少停车场都有免费停车15分钟的政策,但有些司机却动起了歪心思,利用15分钟免费的规则钻停车场漏洞
2025-02-16 15:23:00
单张不到1毛钱!维达金盏花湿厕纸大促:35元到手6包
维达金盏花湿厕纸60片*6包(360片)日常售价52.9元,今日天猫百亿补贴直降至34.9元好价。单包折合5.82元、单张仅需0
2025-02-16 15:23:00
果粉再等等!新版AI Siri可能要到iOS 18.5了
快科技2月16日消息,据媒体报道,由于遇到“工程问题和软件错误”,苹果的新版AI Siri上线时间可能会推迟。此前有消息称
2025-02-16 15:53:00
旗舰机性能对决!三星S25 Ultra罕见碾压iPhone 16 Pro Max
快科技2月16日消息,在手机性能上,苹果iPhone凭借其A系列芯片一直占据优势地位,不过这一局面似乎正在发生变化,据YouTube频道PhoneBuff的最新测试结果显示
2025-02-16 15:53:00
零跑公布智驾计划:一季度实现城快/高架NAP全国覆盖
快科技2月16日消息,日前,零跑汽车公布了其智驾计划,宣布将在2025年一季度实现城快及高架NAP功能的全国覆盖。此外
2025-02-16 15:53:00
比芝麻还小!广州发现全球新物种“海珠微瓢虫”
快科技2月16日消息,据报道,广州海珠国家湿地公园举行的广东省“世界湿地日”暨红树林保护宣传活动上,正式发布了全球新物种——“海珠微瓢虫”
2025-02-16 15:53:00
北美首日票房超2200万 《哪吒2》距全球票房前10仅差不到3亿!即将超越《狮子王》
快科技2月16日消息,据灯塔专业版全球影史票房榜实时数据,《哪吒之魔童闹海》总票房(含点映、预售及海外票房)已超117
2025-02-16 15:53:00
HKC推出新款24.5寸电竞显示器:2K 300Hz屏首发1799元
快科技2月16日消息,HKC推出了一款2K 300Hz电竞显示器:ANT253PQ,首发1799元。新款主显示器的屏幕为一块24
2025-02-16 16:23:00
特斯拉Model Y发布OTA升级:激活车内毫米波雷达
快科技2月16日消息,特斯拉在北美地区发布了2025.2.6软件更新。此次更新主要针对2022年款及后续的Model Y车型
2025-02-16 16:23:00
日产业绩承压:计划削减中国50万辆产能
快科技2月16日消息,日产汽车为恢复业绩,公布了详细的结构改革计划,该计划包括在全球范围内削减产能。其中中国市场产能将减少50万辆
2025-02-16 16:53:00