• 我的订阅
  • 头条热搜
别只盯着ChatGPT版Her,多模态AI拟人互动上,国内玩家也支棱起来了
... AI 发起挑战的高规格赛事落下了帷幕!这就是第二届多模态情感识别挑战赛(MER24),它由清华大学陶建华教授、中国科学院自动化研究所连政、帝国理工学院 Björn W.Schuller、奥卢大学赵国英以及南洋理工大学 Erik Cambra 联合在 A...……更多
国内首个极速超拟人交互向全民开放 可在星火大模型中体验
...模型算法持续演进,国外以GPT-4o、特斯拉FSD等为代表的多模态端到端方案,已被证实可进一步提升技术效果和用户体验。而讯飞星火极速超拟人交互将此前级联方案升级为统一神经网络,实现语音到语音的“端到端”建模,大幅...……更多
李未可科技正式推出WAKE-AI多模态AI大模型
...科技正式发布为眼镜等未来终端定向优化等自研WAKE-AI多模态大模型,具备文本生成、语言理解、图像识别及视频生成等多模态交互能力。 该大模型围绕GPS轨迹+视觉+语音打造新一代LLM-Based的自然交互,同时多模态问答技术的加...……更多
百模大战又添新势力!李未可科技将发布自研AI大模型
近期,36kr研究院发布了《2024年AIGC行业研究:多模态大模型与商业应用》,文中基于AIGC产业生态现状和技术发展路径,深入分析AIGC商业化应用的方向与产业发展趋势。其中在36kr研究院梳理的产业图谱中,发现杭州李未可科技...……更多
李未可科技创始人茹忆:WAKE-AI,多模态大模型带来的智慧
...论坛中,李未可科技创始人兼CEO茹忆发表了《WAKE-AI:多模态大模型带来的智慧文旅变革》的主题演讲,分享了自己关于人工智能和AI硬件的看法。茹忆指出,随着大模型的不断发展,基于人工智能的交互方式正从单一的语音和视...……更多
中国版GPT-4o 来了,抢先OpenAI落地,8月底全民开放
...框架创新基础上,星火极速超拟人交互目前主要开放语音模态,未来会持续在交互上创新突破,不仅会带来更多更实用、丰富的功能,也会拓展到更多模态。在2023年科大讯飞全球1024开发者节上,华为科技有限公司副董事长、轮...……更多
科大讯飞大模型新升级:20秒制作PPT,拟人语音能力超越ChatGPT|最前线
...在逻辑推理、语言理解、文本生成、数学答题、代码、多模态等七大能力上均有提升。升级之后,讯飞星火的文本生成能力和数理运算能力都有提升,可以轻松回答初三的数学物理题。现场演示中,对“前进20米、右转60 、反复...……更多
Soul App联手中国美术学院再次发起数字艺术展,以AI创造互动新体验
...语音技术等方面拥有了前沿能力积累。目前,Soul具备多模态情感识别能力的语言大模型 Soul X、语音大模型(包括语音生成大模型、语音识别大模型、语音对话大模型、音乐生成大模型等)均已上线。 值得注意的是,近期,Soul...……更多
商汤又“夺金”!SuperCLUE-V多模态大模型基准发布10月榜单
...这个金秋,“日日新·商量”又拿了金牌!今日,中文多模态大模型测评基准SuperCLUE-V发布10月榜单:商汤日日新·商量多模态大模型(SenseChat-Vision5.5)凭借多个任务上的出色表现,总得分位列国内大模型第一梯队,智夺金牌。商...……更多
吉利星睿AI大模型正式发布 引领中国汽车进入全场景AI时代
...用的智能生态闭环。 星睿AI大模型包括语言大模型、多模态大模型、数字孪生大模型3大基础模型,并由此衍生出NLP语言大模型、NPDS研发大模型、多模态感知大模型、多模态生成大模型、AI DRIVE大模型、数字生命大模型6大能力模...……更多
7个第一,11个首发,讯飞星火放大招,大模型规模化落地可期!
...有的远场高噪、全双工、多语种多方言能力上,升级了多模态能力,新增了超拟人和个性化能力。超拟人数字人首次亮相,多模态的交互从超拟人的语音变成超拟人的数字人,实现语音、视频、图文的全部联动的多模态交互。 ...……更多
永劫手游搭载首个游戏Copilot!能“听懂人话”的AI队友诞生了
...植入一个游戏特化的百度百科没什么太大区别。但随着多模态、AI大模型技术的不断进步,游戏AI也正朝着更加智能、更加人性化的方向发展。6月19日,永劫手游的“定胜终测”,带着它的全球首个游戏Copilot AI,出现在了玩家们...……更多
vivo发布自研大模型,为用户和开发者带来诸多惊喜
...随着大模型技术日益成熟,vivo在语言、图像、语音、多模态等全模态的AI技术上逐步升级为大模型能力,正从传统的AI技术时代迈向大模型AI技术时代。vivoAI算法技术总监李方圆全新蓝心大模型带来4项核心升级:1、语言大模型升...……更多
Cyan 青心意创“全面拟人”机器人 Orca Ⅰ 发布
...器人视觉观测和自身状态向量输出运动轨迹,将端到端多模态模型置于模仿学习框架下,并结合数据回收系统,让机器人具备拟人的双臂操作能力。Cyan 青心意创表示,OrcaⅠ 从操作模型、多模态处理能力、数据及传感器等方方...……更多
...晨,美国科技公司OpenAI在春季发布会上发布了最新GPT-4o多模态大模型。据OpenAI公司首席技术官米拉·穆拉蒂(Mira Murati)介绍,GPT-4o可以接收文本、音频和图像的任意组合作为输入,并实时生成文本、音频和图像的任意组合进行...……更多
蔚来nomigpt端云多模态大模型上线,回答各种奇妙问题
...12日消息,今日,蔚来宣布为NOMI量身打造的NOMIGPT端云多模态大模型正式上线,新版本将陆续推送给搭载Banyan・榕智能系统的车型。得益于大模型支持,用户可以实现一句话设定AI场景,回答各种奇妙问题,与用户进行有情感的趣...……更多
Soul上线自研大模型“SoulX”,AIGC+社交布局提速
...据训练,具备prompt驱动、条件可控生成、上下文理解、多模态理解等能力。在保证对话流畅、自然、具备情感温度的同时,SoulX覆盖百种细粒度风险类别,通过训练数据安全筛选、安全SFT数据构造、RLHF安全对齐、推理拦截等策略...……更多
讯飞星火首发智能体平台,敏捷触达大模型应用企业落地最后一公里
...精准,也让智能化辅学更有针对性更高效;也结合本次多模态能力升级了百科问答功能,星火大模型理解并融合了大量图书知识,对于孩子的奇思妙问等复杂问题,“爱因斯坦”和他的大咖虚拟人朋友都能回答,让孩子们在趣味...……更多
刚刚,我们感受了一波最「像人」的国产AI,模型还是开源的
...择了两条路线分别开拓:一条是 GPT-4o 所代表的端到端多模态大模型的探索,一条是 o1 所代表的关于推理 Scaling Law 的探索。具体到 GPT-4o 上,OpenAI 跨文本、视觉和音频端到端地训练了一个新模型,所有输入和输出都由同一神经...……更多
讯飞星火V3.5春季上新,有能力更有“温度”
...均已经超过 GPT-4 Turbo,代码能力达到 GPT-4 Turbo 的 96%,多模态理解达到 GPT-4V 的 91%,处在国际领先水平。 但除了模型能力的提升之外,想要收获 C 端用户的欢迎还要具备好用、易用等特点。讯飞星火发布之初,针对用户不知道...……更多
讯飞版「Her」横空出世全民开放!百变人设逼真丝滑,情绪价值逆天
...然后通过适配器,将其与文本的语义表征对齐。再通过多模态大模型,去预测生成表征,最后通过音频解码器得到语音。相较于传统语音交互系统,端到端统一模型以知识对齐表征方式,让信息在各个模块之间传递。这意味着,...……更多
只有谷歌受伤的世界达成了,但“全能模型”到底该不该跟?
...对二,谷歌就跟四个王。那么,这一次较量的核心——多模态大模型,国内AI行业是否要跟进呢?如果要跟进,又该提前考量到哪些问题呢?每一次新产品问世,如果只跟着新闻“震惊”是很难进步的。不妨和我们一起,认真给G...……更多
大模型的未来,快手在自己身上找答案
...有 GPT-4o 不具备的表情和肢体动作,是一个真正意义的多模态输入输出的实时互动智能体。快手展位「AI 关小芳」数字人 | 图片来源:视觉中国而另一片场地上,快手视频生成大模型明星「可灵」发布了一系列重磅升级和 AIGC 短...……更多
Soul App出席联发科技天玑开发者大会,加速布局安全、个性化AIGC新生态
...与图像处理于一体的集成化SDK,提供AR视频技术、基于多模态感知与驱动的交互技术和基于重建的虚拟形象技术),持续以AI辅助、重塑社交环节,提升社交的效率和质量。2020年,Soul系统启动AIGC的技术研发工作,并在智能对话...……更多
国内首个端到端语音大模型将上线,人工智能也要有“情商”
...大模型,则相当于一位“心理咨询师”,利用超100TB的多模态心理行为数据深度训练,同时与心理学专业博士、专业心理咨询师进行三维度交叉学科研究,围绕多方面心理疗法持续学习,确保其在心理咨询服务中的专业性。这款...……更多
“百模大战”,国产 GPT 大全
...om/紫东太初紫东太初是中国科学院自动化研究所研发的跨模态通用人工智能平台。实现了图、文、音三种模态的统一表达,以图生音,以音生图,将开拓AI在视频配音、语音播报、标题摘要、海报创作等更多元场景的应用。现已...……更多
AI也会「刷抖音」!清华领衔发布短视频全模态理解新模型 | ICML 2024
...失函数和混合未配对音视频数据训练。该模型不仅在单一模态任务上表现优异,更在视听联合任务中展现了卓越的性能,证明了其全面性和准确性。想要看懂短视频,除了视觉内容外,语音和音频等听觉信息,如视频音乐、音效...……更多
科大讯飞入局大模型混战,刘庆峰:10月底将赶超ChatGPT
...理解、知识问答、逻辑推理、数学能力、代码能力以及多模态能力。“这将对整个人类的生产和生活方式带来巨大的颠覆,产生全新的机会。”“认知大模型成为通用人工智能的曙光,科大讯飞有信心实现智能涌现。”刘庆峰表...……更多
讯飞星火V4.0整体超越GPT-4 Turbo,8个国际权威测试集测评第一
...但具备了多语种多方言的“自由交互”,还具备多情感多模态的超拟人交互,让人车交互更有温度。当前,讯飞语音交互产品国内市占率稳居第一,同时广泛出口到世界各地。星火大模型为一汽、奇瑞、广汽、江淮、长城等车企...……更多
讯飞星火首发AI合同助手,大模型时代的“超级知识助手”来了
...均已经超过 GPT-4 Turbo,代码能力达到 GPT-4 Turbo 的 96%,多模态理解达到 GPT-4V 的 91%,处在国际领先水平。 但除了模型能力的提升之外,想要收获 C 端用户的欢迎还要具备好用、易用等特点。讯飞星火发布之初,针对用户不知道...……更多
更多关于科技的资讯:
幻觉不一定有害,新框架用AI的「幻觉」优化图像分割技术
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室
2024-11-05 09:49:00
配备自我监控\
尽管货运无人机被大肆炒作成未来派,但它们仍然受到老派限制的束缚:必须定期降落进行安全检查。 不过,南安普顿大学的研究人员可能已经找到了一种解决方案
2024-11-05 09:50:00
苹果iOS 18.2将于12月第一周推送:Siri接入ChatGPT
快科技11月4日消息,Mark Gurman爆料,苹果iOS 18.2将在12月的第一周推送,也就是12月2日所在的那一周
2024-11-05 09:50:00
欧盟将审查苹果 iPadOS,评估其是否符合《数字市场法案》规则
IT之家 11 月 4 日消息,据路透社报道,欧盟委员会周一发布声明称,欧盟反垄断监管机构将对苹果 iPadOS 进行审查
2024-11-05 09:50:00
NVIDIA开始从超微计算机转移订单 潜在退市和司法部调查迫在眉睫
超微计算机公司(SMCI)是高性能服务器和液冷人工智能机架的零售商,也是英伟达的第三大客户。 此外,SMCI 最大的客户是英伟达
2024-11-05 09:51:00
手机圈百花齐放,可用户却傻眼了新机那么多,我来盘点一下到底应该怎么选?
手机圈百花齐放,可用户却傻眼了新机那么多,我来盘点一下到底应该怎么选?听我一句劝,普通人考虑买手机,就得优中择优,品牌倒在其次关键是价格和配置
2024-11-05 09:51:00
新研究揭示眼睛如何\
我们的视觉能力始于眼睛中对光敏感的感光细胞。 视网膜上的一个特定区域被称为"中央凹",负责产生敏锐的视觉。 在这里,对颜色敏感的视锥光感受器使我们能够检测到最微小的细节
2024-11-05 09:51:00
三星W25/W25 Flip新品发布会官宣:11月6日19:00见
【CNMO科技消息】11月4日晚,CNMO注意到,天翼终端官宣,心系天下三星W25/W25 Flip新品发布会官宣将于11月6日举行
2024-11-05 09:51:00
三星巨型户外显示屏落户首尔:相当于三个篮球场大小
IT之家 11 月 4 日消息,三星电子在韩国首尔新世界百货旗舰店安装了全球最大的户外 LED 显示屏(XHB 系列 P8)
2024-11-05 09:51:00
巨型麦哲伦望远镜启动突破性反射镜测试
巨型麦哲伦望远镜(Giant Magellan Telescope)已将其第一面主镜集成到一个复杂的支持系统中,并开始测试以验证其性能
2024-11-05 09:51:00
英特尔被曝将出售 Altera 部分股权,银湖、贝恩等资本竞相角逐
IT之家 11 月 5 日消息,路透社报道称,银湖资本和贝恩资本等潜在收购方正准备收购英特尔可编程解决方案事业部阿尔特拉(Altera)少数股权
2024-11-05 09:51:00
麻省理工学院量子计算机首次模拟复杂电磁场
通过在超导量子计算机上模拟磁场,研究人员可以探索材料的复杂特性。量子计算机具有模拟复杂材料的潜力,使研究人员能够更深入地了解原子和电子之间的相互作用所产生的物理特性
2024-11-05 09:51:00
3599亏本价!骁龙8至尊性价比屠夫新机发布:外观配置杀疯了!
在上个月29日,小米15系列率先发布,这也是全球首款搭载高通新一代旗舰处理器骁龙8至尊版的次世代新机。但仅独占1天的首发时间后
2024-11-05 09:52:00
苹果计划2025年推出M4 Ultra芯片:至高拥有32核CPU、80核GPU
快科技11月4日消息,目前,苹果正式推出了三款M4芯片组,然而,备受期待的M4 Ultra芯片却并未亮相。不过,知名爆料人马克·古尔曼近日透露
2024-11-05 09:52:00
华为Mate 70定档!相较配置而言,原生鸿蒙才是超级王牌?
10月,OPPO、小米、vivo、荣耀都丢出了自家的王炸,这也不禁让大家更加期待华为的最新旗舰产品。11月4日一大早,华为常务董事
2024-11-05 09:52:00