• 我的订阅
  • 头条热搜
别只盯着ChatGPT版Her,多模态AI拟人互动上,国内玩家也支棱起来了
... AI 发起挑战的高规格赛事落下了帷幕!这就是第二届多模态情感识别挑战赛(MER24),它由清华大学陶建华教授、中国科学院自动化研究所连政、帝国理工学院 Björn W.Schuller、奥卢大学赵国英以及南洋理工大学 Erik Cambra 联合在 A...……更多
趣丸科技副总裁兼CTO谢睿:多模态智能激发应用新场景 | 新质生产力·AI Partner大会
...能够受邀参加36氪AI Partner大会。今天我的演讲主题是《多模态智能激发应用新场景》,借这个场合与各位新老朋友分享趣丸科技在人工智能方面的最新探索成果,以及赋能智能音频和数字安全方面的一些思考。首先,请允许我简...……更多
...源研究院创始人、创始理事长张宏江表示,今天大热的多模态大模型未来发展方向一定不光是做视频生成、视频剪辑、拍电影或是生成电视剧。从技术角度观察,可以用它来做机器的大脑、识别外围的世界、武装未来的自动驾驶...……更多
新扩散模型OmniGen一统图像生成,架构还高度简化、易用
...的扩散模型架构 OmniGen,一种新的用于统一图像生成的多模态模型。OmniGen 具有以下特点:统一性:OmniGen 天然地支持各种图像生成任务,例如文生图、图像编辑、主题驱动生成和视觉条件生成等。此外,OmniGen 可以处理经典的计...……更多
给机器人装上大模型大脑,「若愚科技」获超5000万天使轮融资|36氪首发
文|武静静编辑|邓咏仪36氪获悉,多模态大模型公司「若愚科技」完成超5000万天使轮融资,本轮融资由东方精工领投,昆仲跟投,源合资本担任独家融资顾问。公司称,资金将主要用于产品研发,业务拓展以及团队搭建等方...……更多
GPT-4劲敌,谷歌进入高能+高产模式
...与微软争相拼臂力秀肌肉。Gemini 1.5 Pro的横空出世,将多模态大模型的标准提到了一个新高度。一、极致性能背后的模型架构当地时间2月15日,Alphabet与Google公司首席执行官Sundar Pichai携首席科学家Jeff Dean等众高管在X平台发布了多...……更多
撞墙还是新起点?自回归模型在图像领域展现出Scaling潜力
...刚刚显现,未来还存在巨大的探索空间。第二个是关于多模态理解和生成的统一。在当前「scaling law 撞墙」的相关讨论中,多模态其实是一个被寄予厚望的方向。但是,这个领域目前面临一个严峻的挑战,即多模态的理解和生成...……更多
云知声推出山海多模态大模型:实时生成文本、音频和图像
IT之家 8 月 26 日消息,云知声于 23 日宣布推出山海多模态大模型。通过整合跨模态信息,山海多模态大模型能够接收文本、音频、图像等多种形式作为输入,并实时生成文本、音频和图像的任意组合输出。▲云知声山海助手微...……更多
让大模型能听会说,国内机构开源首个端到端语音对话模型Mini-Omni
...zhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com本文出自启元世界多模态算法组,共同一作是来自清华大学的一年级硕士生谢之非与启元世界多模态负责人吴昌桥,研究兴趣为多模态大模型、LLM Agents 等。本论文上线几天内在 github 上斩获 1...……更多
杨幂+小兰会是什么样?中山大学新AI成果,实现人脸个性化SOTA
...山大学、联想的研究团队推出了ConsistentID,可在细粒度多模态面部提示下,仅利用单张参考图像生成多样的肖像,且保持五官的一致性。 最终在人脸个性化任务处理上,相比腾讯的photomaker和小红书的instantID,在五官一致性保持...……更多
OPPO AI 中心产品总监张峻:多模态和个性化是将要深耕的方向
...的主要方向,表示 OPPO 会在 AI 方面带来更多的惊喜。多模态和个性化是将要深耕的方向,同时端云协同将是重点架构。“我们相信,在这些领域持续投入后,一定能为用户带来更加与众不同的体验。”张峻进一步说明,未来会...……更多
拓斯达新一代X5机器人控制平台如何突破具身智能的“小脑”瓶颈?
...策,并向控制模块发出指令。该环节以中央计算单元与多模态决策算法为核心。【小脑】负责运动控制、感知外界状态,在大脑的策略下实现机器人动作的执行和反馈。控制:将决策指令转化为实际操作,实现与物理世界的互动...……更多
阿里CEO吴泳铭:生成式AI让世界有了一个统一的语言——Token
...为了AI发展的最大障碍。当前的数字化世界,信息以多种模态存在——自然语言、程序代码、图像、视频、音频、3D模型、数学符号……这些信息形式各自独立,彼此之间的“对话”几乎不存在。AI虽然能够在单一模态下表现出色...……更多
手机上能跑的「GPT-4V」来啦!多图、视频理解首次上端!面壁小钢炮开源史上最强端侧多模态
...导读】面壁小钢炮MiniCPM-V 2.6重磅出击,再次刷新端侧多模态天花板!凭借8B参数,已经取得单图、多图、视频理解三项SOTA ,性能全面对标GPT-4V。再次刷新端侧多模态天花板,面壁「小钢炮」 MiniCPM-V 2.6 模型重磅上新!仅8B参数...……更多
首个免费多模态大模型API:GLM-4V-Flash上线智谱开放平台
...技术普惠的理念,在今天上线备受期待的第一款免费的多模态模型——GLM-4V-Flash。GLM-4V-Flash 不仅基于 4V 系列模型的各项优秀能力,更在图像处理上实现了精确度的提升。这一多模态免费模型将进一步降低开发者在各个领域深入...……更多
...原生HTAP数据库,支持包括向量数据、时序数据在内的多模态数据管理和检索能。MatrixOne不仅实现了向量类型、向量搜索和向量索引功能,还通过其MatrixGenesis产品提供大模型托管和多模态检索服务,为企业搭建一站式生成式AI应...……更多
全自动组装家具! 斯坦福发布IKEA Video Manuals数据集:首次实现「组装指令」真实场景4D对齐
...主组装IKEA家具,或者通过AI驱动的AR眼镜。」突破性的多模态对齐组装一件IKEA家具需要理解多种形式的指令:说明书提供了任务的整体分解和关键步骤;视频展示了详细的组装过程;而3D模型则定义了部件之间的精确空间关系。I...……更多
Mistral放大招!124B多模态巨无霸登场,免费版ChatGPT震撼突袭
...大招了!一连发布两大更新——Pixtral Large:前沿级124B多模态模型,用于驱动新Le Chat。全新Le Chat:具备网页搜索、Canvas、图像生成、图像理解等功能——而且所有功能免费提供!Mistral的CEO兼联创Arthur Mensch宣布道:「此次发布是...……更多
清华全球最大双臂机器人扩散大模型RDT,懂调酒能遛狗,登顶热榜
...进行统一的处理。在本文中,研究者通过提出创新型的多模态模型架构,以及统一的物理可解释动作空间,来解决这些挑战。设计 RDT:双臂机器人操作的新架构「模仿学习」是当前开发通用机器人模型的主流方法。即机器人通...……更多
世优波塔AI数字人多模态交互系统,赋能智慧医疗服务升级
近日,世优科技“波塔发布会”在京举行,AI数字人多模态交互系统——波塔重磅发布。世优波塔是以世优科技多年积累的全栈数字人技术为基础,致力于打造人工智能时代有温度的多模态人机交互界面。 医疗水平提升、市场...……更多
迎战GPT-4V!谷歌PaLI-3视觉语言模型问世,更小、更快、更强
...像与语音识别能力。本月初,微软更是公布了 166 页的多模态版 GPT-4V 的相关文档,详细探讨了 GPT-4V 的功能和使用情况,这一举动引起了业界的广泛关注。然而,在视觉语言模型的角逐中,谷歌也不甘示弱。 近日,Google Research...……更多
林达华谈大模型发展之路:未来会有更高效的模型结构出现
...一年,人工智能领域风起云涌,模型架构、训练数据、多模态、超长上下文、智能体发展突飞猛进。大模型的技术演进路在何方?3月24日,在2024全球开发者先锋大会的大模型前沿论坛上,上海人工智能实验室领军科学家林达华...……更多
空间智能版ImageNet来了!李飞飞吴佳俊团队出品
...来自斯坦福李飞飞吴佳俊团队!HourVideo,一个用于评估多模态模型对长达一小时视频理解能力的基准数据集,包含多种任务。通过与现有模型对比,揭示当前模型在长视频理解上与人类水平的差距。2009年,李飞飞团队在CVPR上首...……更多
vivo自研大模型全家桶炸场,亮出PhoneGPT智能体,蓝心小V一键搞定衣食住行
...幕的力度、圈搜文字或图片、还是拖拽一段地址信息,多模态大模型都可以深度解读你的意图,进而给你需要的反馈和服务。依托文本大模型,结合自监督学习语音编解码、多语音任务学习和模态对齐等技术,蓝心小V在文本能...……更多
苹果发布新型开源人工智能模型:可根据自然语言指令编辑图像
...Midjourney合作制作MGIE的全称是MLLM-GuidedImageEditing,利用多模态大型语言模型(MLLM)解释用户指令并执行像素级操作。MGIE可以理解用户下达的自然语言命令,进行Photoshop风格的修改、全局照片优化和局部编辑等操作。苹果公司和加...……更多
空间智能新进展:教机器人组装家具,实现操作步骤与真实视频对齐
...的视频教程!具体来说,团队提出了用于机器人的大型多模态数据集IKEA Video Manuals,已入选NeurIPS。数据集涵盖了6大类IKEA家具,每种家具都包含完整的3D模型、组装说明书和实际组装视频。而且划分精细,拆解出的安装子步骤多...……更多
大模型重构生命科学!最大基础模型面世,解锁DNA超长序列
...规模高达2100亿,覆盖蛋白质、DNA、RNA、细胞等七大主流模态。背后玩家正是来自李彦宏孵化创办的百图生科。与应用于其他行业的基础模型有所不同,他们解码的是生命语言,而非自然语言,意味着不仅能处理复杂的生物序列...……更多
2024WAIC热议大模型助力产业新趋势,可信应用成焦点
...变小,成为具身智能的「大脑」。解法:垂域大模型、多模态技术与 AI 智能体论坛中,关于可信大模型如何在应用具体落地,呈现出了多种解法,大家不约而同地开展了对垂域大模型、多模态技术与 AI 智能体的探索。在专业领...……更多
小红书技术副总裁王晓博:大模型让AI越来越像人,更懂小红书的内容与用户
...力的建设。目前,小红书技术团队同时针对语言模型和多模态能力进行了综合研发,结合小红书自身的业务场景和需求,更早做了视觉理解大模型方向的技术攻关:在多模模型架构、多模态alignment和整个数据体系和视觉感知能力...……更多
vivo自研蓝河操作系统发布:支持大模型、多模态交互
...号称一款面向未来的自研智慧操作系统,支持大模型、多模态交互,还号称是全球首款用Rust语言来编写系统框架的操作系统。近年来,Rust重构的热潮席卷整个开发圈,Rust在安全性、高效性和可维护性等方面都有一定优势,包括...……更多
更多关于科技的资讯:
中新经纬12月22日电 (张宁)“随着通用人工智能时代的到来,公共关系正迎来一场由‘大模型’驱动的范式革命,而‘人类想象力+大模型’将成为新质生产力的核心公式
2025-12-22 19:51:00
济宁能源融汇数易:为客户提供一站式数字服务
鲁网12月22日讯(记者 徐景春 周正杰)近日,记者来到济宁能源融汇数易采访,在融汇数易供应链综合服务平台监控中心,大屏幕上实时跳动着物流订单
2025-12-22 11:45:00
章剑华散文集《人生简史》新书出版分享会在南京召开
近日,由江苏散文学会主办的章剑华散文集《人生简史》新书出版分享会在南京召开,作家出版社有限公司董事长、社长鲍坚,江苏省作家协会原一级巡视员
2025-12-22 11:59:00
让AI有“情商” 具身情感智能平台在合肥发布
大皖新闻讯 随着人工智能技术的发展,“人机共生”已成必然。但是,当前绝大多数AI都严重缺乏“情商”,成为“人机共生”核心瓶颈之一
2025-12-22 12:04:00
从南京先锋书店的牛皮纸袋,到直播间里一句“想要治愈系书单”的即时回应,再到书店老板用盲盒一夜清空库存——图书盲盒作为将“纸质书”与“盲盒经济”糅合的产物
2025-12-22 12:14:00
友成基金会“香橙妈妈守艺计划”非遗创变营圆满落幕
2025年12月10日,友成基金会“香橙妈妈守艺计划”非遗焕新创变营在成都红仓·萌想星球107文创产业园开营。来自全国12个省市18区县的18位非遗受益人齐聚
2025-12-22 12:20:00
密切警企协作,米连科技以技术风控守护用户安全
在网络诈骗手段花样翻新、线上安全成为社会普遍关切的当下,营造清朗的网络空间需要社会各方的协同努力。作为在线情感社交领域的参与者
2025-12-22 13:20:00
景秀游戏《偃武》联动昆明市博物馆 让古滇文明触手可及
近日,景秀游戏旗下三国题材策略游戏《偃武》与昆明市博物馆正式启动“古滇文明数字复兴”计划,作为深耕数字娱乐领域的企业,景秀游戏始终希望以游戏为载体
2025-12-22 13:20:00
[摘要]随着人工智能技术的迅猛发展,高等教育正在经历深刻变革。这就要求高校在研究生培养模式上深化改革,大胆创新,积极推动人工智能(AI)技术在研究生培养中的融合路径与实践
2025-12-22 11:10:00
据媒体报道,今年以来,杭州知名“网红大楼”丽晶国际大厦——这座巅峰时期汇聚了近两万名主播与从业者、“一栋楼的GDP堪比一个县”的楼宇
2025-12-22 08:18:00
味蕾实验TASTELAB首次亮相引领零食行业科学化升级新征程
2025年12月20日,全新零食品牌味蕾实验TASTELAB在上海正式举办品牌发布会。本次活动以“让味觉被看见”为核心主题
2025-12-22 08:49:00
乌江榨菜全民创意共创:深度对话Z世代的品牌焕新
当传统品牌纷纷叩响年轻化的大门,仅靠历史底蕴已不足以触动Z世代的心。作为榨菜行业的领军者,乌江榨菜早已展开前瞻布局:从早年携手B站打破次元壁
2025-12-22 08:49:00
在保险行业向专业化、精细化、集约化发展的背景下,富德生命人寿以科技引领创新,积极布局集约化运营模式,构建起以总部为核心的全国理赔集中运营格局
2025-12-22 10:32:00
彰显实力!大咖素质训练营荣获“2025年度影响力教育品牌”奖项
近日,由新浪教育与微博教育联合主办的“新浪&微博 2025 教育盛典”于北京圆满落幕。大咖素质训练营凭借在素质教育领域的深耕积淀
2025-12-22 10:49:00
不用提前抢,西湖消费券带火实体商户:3天,星巴克黄龙广场店增收50%
作为促消费的首创实践,杭州西湖区“疯狂碰友日・西湖首发季”交出亮眼成绩单:首期三天,21 万市民参与“即碰即用”消费券活动
2025-12-22 10:49:00