• 我的订阅
  • 头条热搜
别只盯着ChatGPT版Her,多模态AI拟人互动上,国内玩家也支棱起来了
... AI 发起挑战的高规格赛事落下了帷幕!这就是第二届多模态情感识别挑战赛(MER24),它由清华大学陶建华教授、中国科学院自动化研究所连政、帝国理工学院 Björn W.Schuller、奥卢大学赵国英以及南洋理工大学 Erik Cambra 联合在 A...……更多
国内首个极速超拟人交互向全民开放 可在星火大模型中体验
...模型算法持续演进,国外以GPT-4o、特斯拉FSD等为代表的多模态端到端方案,已被证实可进一步提升技术效果和用户体验。而讯飞星火极速超拟人交互将此前级联方案升级为统一神经网络,实现语音到语音的“端到端”建模,大幅...……更多
李未可科技正式推出WAKE-AI多模态AI大模型
...科技正式发布为眼镜等未来终端定向优化等自研WAKE-AI多模态大模型,具备文本生成、语言理解、图像识别及视频生成等多模态交互能力。 该大模型围绕GPS轨迹+视觉+语音打造新一代LLM-Based的自然交互,同时多模态问答技术的加...……更多
百模大战又添新势力!李未可科技将发布自研AI大模型
近期,36kr研究院发布了《2024年AIGC行业研究:多模态大模型与商业应用》,文中基于AIGC产业生态现状和技术发展路径,深入分析AIGC商业化应用的方向与产业发展趋势。其中在36kr研究院梳理的产业图谱中,发现杭州李未可科技...……更多
李未可科技创始人茹忆:WAKE-AI,多模态大模型带来的智慧
...论坛中,李未可科技创始人兼CEO茹忆发表了《WAKE-AI:多模态大模型带来的智慧文旅变革》的主题演讲,分享了自己关于人工智能和AI硬件的看法。茹忆指出,随着大模型的不断发展,基于人工智能的交互方式正从单一的语音和视...……更多
中国版GPT-4o 来了,抢先OpenAI落地,8月底全民开放
...框架创新基础上,星火极速超拟人交互目前主要开放语音模态,未来会持续在交互上创新突破,不仅会带来更多更实用、丰富的功能,也会拓展到更多模态。在2023年科大讯飞全球1024开发者节上,华为科技有限公司副董事长、轮...……更多
科大讯飞大模型新升级:20秒制作PPT,拟人语音能力超越ChatGPT|最前线
...在逻辑推理、语言理解、文本生成、数学答题、代码、多模态等七大能力上均有提升。升级之后,讯飞星火的文本生成能力和数理运算能力都有提升,可以轻松回答初三的数学物理题。现场演示中,对“前进20米、右转60 、反复...……更多
Soul App联手中国美术学院再次发起数字艺术展,以AI创造互动新体验
...语音技术等方面拥有了前沿能力积累。目前,Soul具备多模态情感识别能力的语言大模型 Soul X、语音大模型(包括语音生成大模型、语音识别大模型、语音对话大模型、音乐生成大模型等)均已上线。 值得注意的是,近期,Soul...……更多
商汤又“夺金”!SuperCLUE-V多模态大模型基准发布10月榜单
...这个金秋,“日日新·商量”又拿了金牌!今日,中文多模态大模型测评基准SuperCLUE-V发布10月榜单:商汤日日新·商量多模态大模型(SenseChat-Vision5.5)凭借多个任务上的出色表现,总得分位列国内大模型第一梯队,智夺金牌。商...……更多
吉利星睿AI大模型正式发布 引领中国汽车进入全场景AI时代
...用的智能生态闭环。 星睿AI大模型包括语言大模型、多模态大模型、数字孪生大模型3大基础模型,并由此衍生出NLP语言大模型、NPDS研发大模型、多模态感知大模型、多模态生成大模型、AI DRIVE大模型、数字生命大模型6大能力模...……更多
7个第一,11个首发,讯飞星火放大招,大模型规模化落地可期!
...有的远场高噪、全双工、多语种多方言能力上,升级了多模态能力,新增了超拟人和个性化能力。超拟人数字人首次亮相,多模态的交互从超拟人的语音变成超拟人的数字人,实现语音、视频、图文的全部联动的多模态交互。 ...……更多
永劫手游搭载首个游戏Copilot!能“听懂人话”的AI队友诞生了
...植入一个游戏特化的百度百科没什么太大区别。但随着多模态、AI大模型技术的不断进步,游戏AI也正朝着更加智能、更加人性化的方向发展。6月19日,永劫手游的“定胜终测”,带着它的全球首个游戏Copilot AI,出现在了玩家们...……更多
vivo发布自研大模型,为用户和开发者带来诸多惊喜
...随着大模型技术日益成熟,vivo在语言、图像、语音、多模态等全模态的AI技术上逐步升级为大模型能力,正从传统的AI技术时代迈向大模型AI技术时代。vivoAI算法技术总监李方圆全新蓝心大模型带来4项核心升级:1、语言大模型升...……更多
Cyan 青心意创“全面拟人”机器人 Orca Ⅰ 发布
...器人视觉观测和自身状态向量输出运动轨迹,将端到端多模态模型置于模仿学习框架下,并结合数据回收系统,让机器人具备拟人的双臂操作能力。Cyan 青心意创表示,OrcaⅠ 从操作模型、多模态处理能力、数据及传感器等方方...……更多
首个可保留情感的音频LLM!Meta重磅开源7B-Spirit LM,一网打尽「音频+文本」多模态任务
【新智元导读】Meta最近开源了一个7B尺寸的Spirit LM的多模态语言模型,能够理解和生成语音及文本,可以非常自然地在两种模式间转换,不仅能处理基本的语音转文本和文本转语音任务,还能捕捉和再现语音中的情感和风格。...……更多
...晨,美国科技公司OpenAI在春季发布会上发布了最新GPT-4o多模态大模型。据OpenAI公司首席技术官米拉·穆拉蒂(Mira Murati)介绍,GPT-4o可以接收文本、音频和图像的任意组合作为输入,并实时生成文本、音频和图像的任意组合进行...……更多
蔚来nomigpt端云多模态大模型上线,回答各种奇妙问题
...12日消息,今日,蔚来宣布为NOMI量身打造的NOMIGPT端云多模态大模型正式上线,新版本将陆续推送给搭载Banyan・榕智能系统的车型。得益于大模型支持,用户可以实现一句话设定AI场景,回答各种奇妙问题,与用户进行有情感的趣...……更多
Soul上线自研大模型“SoulX”,AIGC+社交布局提速
...据训练,具备prompt驱动、条件可控生成、上下文理解、多模态理解等能力。在保证对话流畅、自然、具备情感温度的同时,SoulX覆盖百种细粒度风险类别,通过训练数据安全筛选、安全SFT数据构造、RLHF安全对齐、推理拦截等策略...……更多
讯飞星火首发智能体平台,敏捷触达大模型应用企业落地最后一公里
...精准,也让智能化辅学更有针对性更高效;也结合本次多模态能力升级了百科问答功能,星火大模型理解并融合了大量图书知识,对于孩子的奇思妙问等复杂问题,“爱因斯坦”和他的大咖虚拟人朋友都能回答,让孩子们在趣味...……更多
讯飞星火V3.5春季上新,有能力更有“温度”
...均已经超过 GPT-4 Turbo,代码能力达到 GPT-4 Turbo 的 96%,多模态理解达到 GPT-4V 的 91%,处在国际领先水平。 但除了模型能力的提升之外,想要收获 C 端用户的欢迎还要具备好用、易用等特点。讯飞星火发布之初,针对用户不知道...……更多
刚刚,我们感受了一波最「像人」的国产AI,模型还是开源的
...择了两条路线分别开拓:一条是 GPT-4o 所代表的端到端多模态大模型的探索,一条是 o1 所代表的关于推理 Scaling Law 的探索。具体到 GPT-4o 上,OpenAI 跨文本、视觉和音频端到端地训练了一个新模型,所有输入和输出都由同一神经...……更多
讯飞版「Her」横空出世全民开放!百变人设逼真丝滑,情绪价值逆天
...然后通过适配器,将其与文本的语义表征对齐。再通过多模态大模型,去预测生成表征,最后通过音频解码器得到语音。相较于传统语音交互系统,端到端统一模型以知识对齐表征方式,让信息在各个模块之间传递。这意味着,...……更多
只有谷歌受伤的世界达成了,但“全能模型”到底该不该跟?
...对二,谷歌就跟四个王。那么,这一次较量的核心——多模态大模型,国内AI行业是否要跟进呢?如果要跟进,又该提前考量到哪些问题呢?每一次新产品问世,如果只跟着新闻“震惊”是很难进步的。不妨和我们一起,认真给G...……更多
大模型的未来,快手在自己身上找答案
...有 GPT-4o 不具备的表情和肢体动作,是一个真正意义的多模态输入输出的实时互动智能体。快手展位「AI 关小芳」数字人 | 图片来源:视觉中国而另一片场地上,快手视频生成大模型明星「可灵」发布了一系列重磅升级和 AIGC 短...……更多
Soul App出席联发科技天玑开发者大会,加速布局安全、个性化AIGC新生态
...与图像处理于一体的集成化SDK,提供AR视频技术、基于多模态感知与驱动的交互技术和基于重建的虚拟形象技术),持续以AI辅助、重塑社交环节,提升社交的效率和质量。2020年,Soul系统启动AIGC的技术研发工作,并在智能对话...……更多
国内首个端到端语音大模型将上线,人工智能也要有“情商”
...大模型,则相当于一位“心理咨询师”,利用超100TB的多模态心理行为数据深度训练,同时与心理学专业博士、专业心理咨询师进行三维度交叉学科研究,围绕多方面心理疗法持续学习,确保其在心理咨询服务中的专业性。这款...……更多
大模型重构生命科学!最大基础模型面世,解锁DNA超长序列
...规模高达2100亿,覆盖蛋白质、DNA、RNA、细胞等七大主流模态。背后玩家正是来自李彦宏孵化创办的百图生科。与应用于其他行业的基础模型有所不同,他们解码的是生命语言,而非自然语言,意味着不仅能处理复杂的生物序列...……更多
AI也会「刷抖音」!清华领衔发布短视频全模态理解新模型 | ICML 2024
...失函数和混合未配对音视频数据训练。该模型不仅在单一模态任务上表现优异,更在视听联合任务中展现了卓越的性能,证明了其全面性和准确性。想要看懂短视频,除了视觉内容外,语音和音频等听觉信息,如视频音乐、音效...……更多
讯飞星火V4.0整体超越GPT-4 Turbo,8个国际权威测试集测评第一
...但具备了多语种多方言的“自由交互”,还具备多情感多模态的超拟人交互,让人车交互更有温度。当前,讯飞语音交互产品国内市占率稳居第一,同时广泛出口到世界各地。星火大模型为一汽、奇瑞、广汽、江淮、长城等车企...……更多
讯飞星火首发AI合同助手,大模型时代的“超级知识助手”来了
...均已经超过 GPT-4 Turbo,代码能力达到 GPT-4 Turbo 的 96%,多模态理解达到 GPT-4V 的 91%,处在国际领先水平。 但除了模型能力的提升之外,想要收获 C 端用户的欢迎还要具备好用、易用等特点。讯飞星火发布之初,针对用户不知道...……更多
更多关于科技的资讯:
英伟达再次出手收购以色列公司,已通过欧盟委员会反垄断审核
前脚 AMD 苏姿丰刚刚完成针对 AI 初创企业 Liquid AI 的投资,后脚英伟达黄仁勋针对 AI 初创企业 Run:ai 的收购亦通过了欧盟委员会的审核
2024-12-23 09:16:00
高德地图联合蔚来行政旗舰ET9首发全域车道级导航 路网数据天级更新,以AI构建全场景导航体验
12月21日,一年一度的蔚来NIODAY上,高德地图全域车道级导航携手国产新能源明星车型蔚来智能电动行政旗舰ET9合作亮相
2024-12-23 09:16:00
创造能量分辨率新纪录,科学家为磁性超导体存在提供直接实验证据
近年来,超导因无损耗传输电能的特性而备受关注,其在磁悬浮列车、医学成像(例如核磁共振成像)、量子计算等领域具有广阔的应用前景
2024-12-23 09:17:00
苦等大半年,苹果 iOS 19 可算有了好消息
从 6 月 11 日在苹果 WWDC24 中登场,到 7 月 16 日首个公测版上线,再到 9 月 17 日正式版发布
2024-12-23 09:18:00
汤姆猫推出 AI 童伴机器人:支持主动聊天、情绪识别,1499 元起
IT之家 12 月 22 日消息,汤姆猫昨日在京东等平台推出 AI 童伴机器人,共有经典款、豪华款、尊享款三个版本,售价分别为 1499 元
2024-12-23 09:19:00
因需求过高,ASML 取消非员工订购的 High-NA EUV 光刻机乐高模型
IT之家 12 月 23 日消息,X(原推特)用户 @jonmasters 发现,光刻机制造商阿斯麦(ASML)正在取消非员工订购的限量版 Twinscan EXE:5000 乐高模型订单
2024-12-23 09:19:00
腾讯 QQ 更新 Windows 9.9.17、macOS 6.9.63、Linux 3.2.15
IT之家 12 月 23 日消息,腾讯 QQ 于 12 月 20 日更新 Windows 9.9.17、macOS 6
2024-12-23 09:19:00
OPPO 首款高分子玻纤背板由 A5 Pro 手机首发
IT之家 12 月 22 日消息,OPPO A5 Pro 手机将于 12 月 24 日 14:30 发布,新机采用居中大圆相机模组设计
2024-12-23 09:21:00
一加 Ace 5 Pro 手机支持「超远距灵动蓝牙」
IT之家 12 月 22 日消息,一加 Ace 5 系列手机发布会已官宣定档 12 月 26 日 14:30,届时还将带来一加平板
2024-12-23 09:22:00
iCar:大量水军对iCar V23高频恶意攻击、网暴车主,已收集证据
IT之家 12 月 22 日消息,今日奇瑞旗下 iCar 汽车官方在微博发布公告称,近期大量水军账号利用虚假信息,通过单一账号重复发布
2024-12-23 09:22:00
荣耀 Magic7 RSR 保时捷设计手机上线官网,最高 24GB+1TB
IT之家 12 月 22 日消息,荣耀 Magic7RSR 保时捷设计及影像技术发布会定档 12 月 23 日 14:00
2024-12-23 09:22:00
Meta 首席技术官:无线计算单元并非独立 VR 头显的“灵丹妙药”
IT之家 12 月 22 日消息,本周 Meta 首席技术官兼 Reality Labs XR 团队负责人安德鲁・博斯沃思在其 Instagram 问答环节中
2024-12-23 09:22:00
红魔游戏手机官宣:“至尊超大杯”12月23日见
IT之家 12 月 22 日消息,红魔游戏手机官方今日宣布,“红魔至尊超大杯即将来袭”,明天见。红魔游戏手机称:“谁说性能
2024-12-23 09:23:00
填补国内空白,首颗自研 AVS3 视觉智算芯片 SPARK RE3200 发布
IT之家 12 月 22 日消息,博雅睿视宣布,在 AVS 工作组第 91 次会议期间,发布了自主研发的首颗支持 AVS3 / SVAC 编码的端侧视觉智算 SoC 芯片 SPARK RE3200
2024-12-23 09:23:00
华硕电脑惊现“圣诞花环”,用户误以为感染病毒
IT之家 12 月 22 日消息,近日部分华硕电脑用户在 Windows 11 系统下遭遇了一次令人不安的经历:屏幕底部突然出现一个占据屏幕约三分之一的圣诞花环横幅
2024-12-23 09:24:00