• 我的订阅
  • 头条热搜
云计算一哥终于搞多模态了:一口气6个大模型,还有个3nm芯片!
...—亚马逊CEO Andy Jassy亲自站台re:Invent24,发布自家新款AI多模态系列大模型,名曰Amazon Nova。而且是一口气涵盖文本对话、图片生成、视频生成,甚至直接吐露一个小目标:将来我们不仅要Speech to Speech,更要Any-to-Any!整体而言,Am...……更多
观薇智能“玄黄大模型”发布,展示AI+健康领域创新实力
...志力等嘉宾,共同开启中医中药+精准营养为垂直应用多模态大模型——“玄黄大模型”。玄黄大模型基于庞大语料词元预训练而成,学习了中国中医科学院中医药信息研究所整理的中医药知识图谱、文献医案,并结合了观薇智...……更多
AI相关板块集体延续回调,人工智能AIETF跌2.61%
...布盘古大模型5.0版本,标志着人工智能技术在全系列、多模态、强思维三个方面的全新升级。盘古模型赋予机器人前所未有的适应性和灵活性,无论是面对工业环境还是家庭生活场景,都能游刃有余。国信证券认为,2024年人工...……更多
OriginOS 5来了!2024 vivo开发者大会定档10月10日:还有自研操作系统
...以及性能优化上呈现新面貌,并搭载蓝心大模型,提供多模态交互体验,包括语音、视觉及文字等领域的智能解决方案。蓝心大模型于去年11月初举行的2023 vivo开发者大会上首次对外公布,包含十亿、百亿、千亿三个参数量级共5...……更多
全球首篇!调研近400篇文献,鹏城实验室&中大深度解析具身智能
...数字空间和物理世界的交互来完成复杂任务。近年来,多模态大模型和机器人技术得到了长足发展,具身智能成为全球科技和产业竞争的新焦点。然而,目前缺少一篇能够全面解析具身智能发展现状的综述。因此,鹏城实验室多...……更多
...据交易所(以下简称“深数所”)发布了500个垂直行业多模态算料集,按照大模型应用的不同阶段(训练、推理、调优),有的放矢地提供数据源,让国产大模型厂商“寻数有路”。此次深数所发布的首批500个人工智能大模型高...……更多
...“爱尔名医陪伴数字人”,可支持视频、文本和语音等多模态交互,也即将投入应用。“爱科(Eyecho)”的名字既体现爱尔“创新驱动,科技爱尔”的发展战略,也起英文Echo“回音”之意,蕴含爱尔运用最新的人工智能技术,...……更多
浪潮受邀参加第六届智能财务高峰论坛
...规则和标准化的重要性。目前大模型正从语言智能走向多模态智能,多模态大模型训练时,数据融合交互,需要按标准实现多模态对齐。而基于海量数据训练支持多业务场景的通用大模型,更加需要高质量数据,业务规则、数据...……更多
MMMU华人团队更新Pro版!多模态基准升至史诗级难度:过滤纯文本问题、引入纯视觉问答
...候选选项、引入纯视觉输入设置)更严格地评估模型的多模态理解能力;模型在新基准上的性能下降明显,表明MMMU-Pro能有效避免模型依赖捷径和猜测策略的情况。多模态大型语言模型(MLLMs)在各个排行榜上展现的性能不断提...……更多
感官协同配合的精细操纵,人大胡迪团队探索机器人模态时变性挑战
...冯若轩为中国人民大学二年级硕士生,主要研究方向为多模态具身智能,师从胡迪教授。引言:在机器人操纵物体的过程中,不同传感器数据携带的噪声会对预测控制造成怎样的影响?中国人民大学高瓴人工智能学院 GeWu 实验室...……更多
2023内容科技应用典型案例:传播大脑科技(浙江)股份有限公司打造传播大模型
...媒体相关任务下进行微调训练,以提高模型的可用性。多模态向量检索技术:利用向量库将多模态信息转成向量,通过向量检索技术,建立了一个高效的资源检索框架,用户可通过多种方式快速找到所需的媒体资料和信息。知识...……更多
vivo自研大模型全家桶炸场,亮出PhoneGPT智能体,蓝心小V一键搞定衣食住行
...幕的力度、圈搜文字或图片、还是拖拽一段地址信息,多模态大模型都可以深度解读你的意图,进而给你需要的反馈和服务。依托文本大模型,结合自监督学习语音编解码、多语音任务学习和模态对齐等技术,蓝心小V在文本能...……更多
“大模型”时代 路凯智行如何Rock AI
...型,随着近几个月SORA的横空出世,融合语言与视觉的多模态模型也已初露峥嵘,但目前市面上的通用大模型并非“万金油”,面向垂直领域内的各类生成式AI应用还需要结合场景需求积累数据和构建定制化的模型。矿山无人驾驶...……更多
百万鲁棒数据训练,3D场景大语言模型新SOTA!IIT等发布Robin3D
...高模型在3D场景理解中的鲁棒性和泛化能力,在多个3D多模态学习基准测试中取得了优异的性能,超越了以往的方法,且无需针对特定任务的微调。多模态大语言模型(Multi-modal Large Language Models, MLLMs)以文本模态为基础,将其它...……更多
又一生成式AI助手将“登机”!谷歌发布多模态Bard助理,交互式AI时代近了?
...文本、语音或图像与Bard助理互动——换言之,其具备多模态功能。例如,当用户询问“本周我错过了哪些重要邮件”时,Bard助理会列出各项要点及具体内容,并附上具体对应邮件的链接,还可以帮助用户提取活动地址并在谷歌...……更多
Pika、阿里同日炫技!国产视频大模型奋起直追
...频,表情、五官、姿势都会产生非常自然的变化。在AI多模态领域,科技巨头、明星初创企业似乎把火力集中到了同一个方向——AI视频生成,Sora的火热更是一石激起千层浪,同类产品发布你追我赶,战况之焦灼可见一斑。在该...……更多
GPT-4V暴露致命缺陷?JHU等发布首个多模态ToM 测试集
...来自 JHU, NYU, MIT, Harvard 等机构的研究团队开创了第一个多模态的 ToM 测试基准,发现现有的多模态模型和 LLM 都表现存在系统性缺陷,同时他们提出了一种有效的新方法。在刚结束的 ACL 2024 会议中,这篇论文获得杰出论文奖。论...……更多
阿里达摩院发布业内首个遥感ai大模型,支持多模态交互
...业应用。IT之家归纳总结该遥感大模型特点如下:支持多模态交互,如输入“提取影像中的耕地农田”,会自动识别所选目标▲图源达摩院DAMO官方公众号支持任意地表目标识别,并建立多级语义标签体系▲图源达摩院DAMO官方公...……更多
Sora炸圈后哑火,国产视频大模型接棒降门槛
...经过前一年的疯狂,逐渐冷静,视频大模型被视为迈向多模态大模型或AGI的必经之路。以快手、字节旗下抖音为代表的短视频公司,以阿里、腾讯为代表的互联网大厂,以生数科技、智谱AI、爱诗科技等为代表的创业公司,均先...……更多
7个第一,11个首发,讯飞星火放大招,大模型规模化落地可期!
...有的远场高噪、全双工、多语种多方言能力上,升级了多模态能力,新增了超拟人和个性化能力。超拟人数字人首次亮相,多模态的交互从超拟人的语音变成超拟人的数字人,实现语音、视频、图文的全部联动的多模态交互。 ...……更多
联想戴炜:如何跨越多模态大模型产业应用的最后一公里
...面临消失。同时ChatGPT带来的对算力巨大需求也为未来多模态大模型的应用带来了巨大的挑战。11月9日,在世界互联网大会“算力网络协同创新论坛”上,联想集团副总裁、中国区方案服务业务群总经理戴炜从算力网络的未来演...……更多
...参数的4款大语言模型,以及视觉理解、音频理解两款多模态大模型,实现“全尺寸、全模态”开源。用户可在魔搭社区直接体验Qwen系列模型效果,也可通过阿里云灵积平台调用模型API,或基于阿里云百炼平台定制大模型应用。...……更多
世优科技携手人民中科打造AI数字人智能体助力智慧校园
...体,接入人民中科研发的“白泽”大模型,使用先进的跨模态智能理解技术,对文本、图像、视频等多种模态信息进行统一理解、统一表达、统一度量,从而实现跨模态生成、跨模态搜索、跨模态对话等功能。 AI数字人智能体...……更多
科大讯飞携手EX机器人,重塑人机交互新未来
...,面向物理世界、虚拟世界和元宇宙,以AI能力星云、多模态交互、大模型、模型训练、资产生成和软硬件接入为核心的机器人开发平台,帮助开发者快速搭建多场景适配、具有深厚知识底蕴以及擅长自我进化的实体机器人和虚...……更多
不要小看「实而不华」的腾讯 AI
...未来的战略思路。01模型侧:基础模型能力升级,构建多模态能力首先是基础模型方面,5 月 17 日的峰会上,腾讯混元介绍了其多尺寸的 LLM 模型矩阵。其中,最大模型已拓展至万亿级参数规模,并在 1B、3B、7B、13B 等不同参数量...……更多
全面叫板OpenAI!谷歌发布多模态大模型全家桶:从AI助手到文生视频模型
...先一天后,科技巨头谷歌不甘示弱,推出了自己的最新多模态AI(人工智能)产品。当地时间5月14日,在谷歌I/O开发者大会上的主题演讲中,谷歌展示了由升级后Gemini模型驱动的AI助手项目Project Astra、对标Sora的文生视频模型Veo,...……更多
空间智能版ImageNet来了!李飞飞吴佳俊团队出品
...来自斯坦福李飞飞吴佳俊团队!HourVideo,一个用于评估多模态模型对长达一小时视频理解能力的基准数据集,包含多种任务。通过与现有模型对比,揭示当前模型在长视频理解上与人类水平的差距。2009年,李飞飞团队在CVPR上首...……更多
...制,结合行业专业知识,经过不断训练和优化构建出的多模态自研行业大模型,具备在船舶设计、性能预测、航运气象服务等特定领域任务处理能力,可以助力船舶与海洋工程行业提高工作效率。船舶与海洋工程行业作为典型的...……更多
智能化应用将出现爆发式增长(AI前沿观察)
...的热点目标,企业也需要持续建设自己的人才队伍。■多模态大模型塑造“多边形战士”应用——多模态大模型是当前大模型训练和开发的重要方向,能够提升智能化应用中的信息丰富度和全面性。多模态大模型在行业实践中显...……更多
首个可保留情感的音频LLM!Meta重磅开源7B-Spirit LM,一网打尽「音频+文本」多模态任务
【新智元导读】Meta最近开源了一个7B尺寸的Spirit LM的多模态语言模型,能够理解和生成语音及文本,可以非常自然地在两种模式间转换,不仅能处理基本的语音转文本和文本转语音任务,还能捕捉和再现语音中的情感和风格。...……更多
更多关于科技的资讯:
潮聚湾区 创玩未来——《广州潮玩产业招商研究报告》发布会暨行业主题研讨会在荔湾成功举办
为精准把握潮玩产业蓬勃发展的时代脉搏,助力广州建设具有全球影响力的潮玩产业高地,12月11日,由广州市投资发展委员会办公室主办
2025-12-13 16:43:00
12日晚,第十届中国设计智造大奖(DIA)颁奖盛典在中国美术学院良渚校区举行。第十届中国设计智造大奖征集自2024年12月12日启动
2025-12-13 07:36:00
全球首个甲骨文智能体“殷契行止” 上线 最懂甲骨文的AI来了
小程序“了不起的甲骨文”,展示甲骨文“其”的不同字形。(本组图/小程序截图)甲骨拓本甲骨文“门”字 甲骨文摹本甲骨文“马”字扫码看视频 厦门网讯 (厦门日报教育工作室首席专家 佘峥 通讯员 王志鹏)你只需往电脑上传一张甲骨图片
2025-12-12 08:28:00
厦门网讯(厦门日报记者 曾嫣艳 通讯员 曾焕滨)昨日,厦门临空经济片区场景创新平台推广暨供需对接与企业路演活动在翔安创新实验室举办
2025-12-12 08:28:00
从流程到质量:制片人为短剧工业化提供的“52集样本”
在短剧行业从 “流量争夺” 转向 “品质与流程双竞争” 的关键阶段,如何在有限周期内平衡效率、成本与成片质量,成为所有制作机构必须破解的难题
2025-12-12 08:29:00
剧想天开,造梦未来|一场关于“儿童剧人物造型”的想象力实验
儿童戏剧,是投射在少年儿童心灵舞台上的第一束光。人物造型,作为这束光中最具象、最绚烂的色彩,不仅定义角色的灵魂,更深刻影响着儿童认知世界的方式与审美情感的塑造
2025-12-12 08:29:00
聚焦“中文+职业”融合:星禾星穗在世界中文大会展示校企合作新范式
在近期举办的2025世界中文大会上,教育企业星禾星穗多维度参与,展现了其在“中文+专业/职业”领域的系统思考与实践成果
2025-12-12 08:30:00
会打拳的机器人带你触摸未来 走进国家“芯火”双创基地象屿园区孵化加速器
元启创新的人形机器人正在打拳。(元启创新 供图)厦门网讯 (厦门日报记者 吴晓菁) “灵犀,灵犀,表演一段佛山醒狮。”昨日
2025-12-12 08:59:00
“数字丝路”赋能文化出海,中国数字文化扬帆全球新蓝海
2025年12月9日下午,一场聚焦数字文化出海与青年文化交流的“共建数字丝绸之路”研讨会在上海举行。中国传媒大学经济与管理学院教授方英
2025-12-12 09:00:00
AI 眼镜似乎成了AI具身智能行业中最“靓”的仔,无论是苹果、谷歌这些大厂,还是国内的科技巨头,纷纷下场。本周二,谷歌在The Android Show活动上宣布
2025-12-12 09:10:00
近日,中国人民银行苏州市分行反洗钱科公布2025年苏州市反洗钱征文比赛评审结果,苏州人保财险撰写的《破局与重构:保险公司在反洗钱履职的实践困境与创新路径研究》一文凭借深刻的问题剖析
2025-12-12 10:46:00
为提升员工职场软实力,优化内部沟通效能,12月7日,常熟人保财险琴川学府组织开展了“赋能职场进阶,高情商沟通与协作”专题培训
2025-12-12 10:56:00
长白时评评论员 刘颂寒声称“下载App必得大额红包”,旁边又用小字解释“仅限新人或以实际情况为准”;宣称“全场5折”,又在大大的“5折”后面跟个极小的“起”字……在日常的消费中
2025-12-12 10:56:00
在当前行业竞争加剧与市场环境多变的背景下,虎丘支公司持续推动降本增效工作,这既是应对挑战的必要举措,也是实现长期稳健经营的重要保障
2025-12-12 10:58:00
劳利近日“水银体温计明年起禁产”的话题引发热议。根据国家药监局此前发布的通知,自2026年1月1日起全面禁止生产含汞体温计产品
2025-12-12 11:01:00