• 我的订阅
  • 头条热搜
Gemini 开启大模型路线之争,新战场将“数流成河”
...一种可能性:具有原生数据优势的互联网巨头,可能在多模态大模型竞争中占据优势。这意味着,谷歌、马斯克、Meta以及中国的腾讯、抖音、阿里、百度等公司都有可能在Gemini 开创的路线上加速迭代大模型。大模型战局,进入...……更多
王一刚:深耕技术产品,助力媒体融合
...中科闻歌雅意大模型在媒体领域的应用研究主要集中在多模态内容理解、关键信息提取、事件脉络分析、多模态内容生成和内容审校等方面,展现了在媒体领域的广阔应用前景。从业务视角来看,大模型可以在选题决策、辅助创...……更多
感官协同配合的精细操纵,人大胡迪团队探索机器人模态时变性挑战
...冯若轩为中国人民大学二年级硕士生,主要研究方向为多模态具身智能,师从胡迪教授。引言:在机器人操纵物体的过程中,不同传感器数据携带的噪声会对预测控制造成怎样的影响?中国人民大学高瓴人工智能学院 GeWu 实验室...……更多
智能化应用将出现爆发式增长(AI前沿观察)
...的热点目标,企业也需要持续建设自己的人才队伍。■多模态大模型塑造“多边形战士”应用——多模态大模型是当前大模型训练和开发的重要方向,能够提升智能化应用中的信息丰富度和全面性。多模态大模型在行业实践中显...……更多
支持1024帧、准确率近100%,英伟达「LongVILA」开始发力长视频
...统、模型训练与数据集开发于一体。现阶段,将模型的多模态理解与长上下文能力相结合是非常重要的,支持更多模态的基础模型可以接受更灵活的输入信号,以便人们可以以更多样化的方式与模型交互。而更长的上下文使模型...……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...数据泄露,从而反映模型的真实性能。研究团队测试了多模态大模型(LMMs)和纯文本大模型(LLMs)。对于LLMs的测试,输入时不提供任何与图像相关的信息给模型,仅提供文本。所有评估均采用零样本(zero-shot)思维链(Chain of ...……更多
金域医学域见医言大模型正式发布,提速智慧医检4.0时代
...“六边形战士”,能够做到多模型整合、多场景赋能、多模态与多组学数据处理、多元知识充分融合、基于全病程信息多轮互动,不仅仅具备知识问答、智能化检测结果整合的功能,还具备医学领域的专业分析、推理能力。 金...……更多
大模型、物联网平台国际先进!浪潮智能生产两项成果通过科技评价
近日,浪潮智能生产自主研发的多模态智产大模型服务平台和工业智能物联网平台顺利通过山东省科技成果评价,达到国际先进水平。通过山东省科技成果评价多模态智产大模型:落地应用于多个行业多模态智产大模型服务平...……更多
多模态模型免微调接入互联网,即插即用新框架,效果超闭源方案
...合提出即插即用的SearchLVLMs框架,可以无缝整合任意的多模态大模型。该框架在推理阶段对大模型进行互联网检索增强,使得大模型无需微调即可对实时信息进行准确的反馈。研究团队提出首个辅助多模态大模型对实时信息进行...……更多
提质降价,国产大模型加速奔跑
...主任工程师程莹认为,国产大模型技术在语言、视觉、多模态等领域持续突破,在文本、音频、视觉、3D等数据方面实现多模态统一,持续突破人工智能感知、理解和推理世界的能力边界。这些,拓展着大模型与各行各业融合的...……更多
首个VR端3D角色扮演AI发布!南洋理工公开SOLAMI技术报告,端到端VLA模型驱动,唱跳都能陪你玩
...或者语音的交互。这促使我们思考:如何构建具有更丰富模态的3D自主角色呢?要实现这个目标,主要面临两个挑战:1. 3D角色需要准确观察和理解用户行为信息,并基于上下文和角色设定通过语音、肢体动作和表情做出合适的回应...……更多
...,同参数级性能达到业界领先水平。在此基础上演进出多模态模型,支持声图文3种模态,具备面向多种行业场景的快速定制能力。在大模型底座方面,中国联通借鉴人类职业技能形成规律,打造选模型—改模型—用模型工具链...……更多
阿里Q3财报:核心业务收获稳健增长,“AI驱动”潜力初现
...疗等领域,持续放大技术普惠。通用大模型“全尺寸、全模态”开源,“通义舞王”爆火本季度,阿里云发布开源大模型通义千问Qwen-72B,该模型10个权威基准测评创下开源模型最优成绩,成为业界最强开源大模型,也标志着阿...……更多
背水一战狙击GPT-4,谷歌最强大模型Gemini终发布,听说读写全能选手 | 焦点分析
...布,“大杀器”Gemini 1.0,正式上线。Gemini是一个原生多模态大模型,谷歌在今年5月的I/O大会宣布开始研发后,Gemini的传说不断:将谷歌大脑和DeepMind部门合并,数百人攻坚,几乎耗尽谷歌内部计算资源……如此种种,只为和OpenA...……更多
美国东北大学提出视频数据增强方法,能让视频模型学到更好的表征
...张一天等人重新审视了色调变换这一操作在视频数据这一模态下的作用,并观察到了完全相反的现象,即这种操作能让视频理解模型的性能和泛化性得到提升。通过进一步地分析其在不同模态数据下(图像/视频)表现差异的原...……更多
刚刚!字节跳动豆包上线图片理解,大模型走向多模态|钛媒体AGI
(图片来源:林志佳拍摄)国内活跃度最高的AI大模型应用正走向“多元化”。12月3日消息,钛媒体AGI获悉,字节跳动豆包日前上线了一项实用功能——图片理解。目前,豆包APP及豆包PC新增照片及相机按钮,上传图片后可识别...……更多
早报特朗普政府将封禁DeepSeek?外交部回应;广东发文!事关人工智能与机器人
...增长79.7%。6、为进一步加速智能体赋能产业应用,推动多模态智能体高质量发展,中国信通院正式启动多模态智能体技术规范编制工作。为充分完善技术规范内容,增进产业交流,中国信通院人工智能研究所将于3月13日召开多模...……更多
...的前沿技术研究,打造和提升高质量、国际领先水平的多模态交通大模型技术能力,高标准打造人工智能应用场景,全面开展人工智能产品应用创新生态建设,致力于将人工智能前沿技术成果广泛应用于智慧交通、车路协同、自...……更多
BAT等互联网大厂,如何入局人形机器人?
...智能公司,其研制的文心产业级知识增强大模型,具备跨模态、跨语言的深度语义理解与生成能力,百度认为,大模型等人工智能工具,核心在于提高效率,因此在上一次机器人发展浪潮中,百度就尝试通过飞桨深度学习平台和...……更多
商汤科技:创新驱动,赋能多行业发展新活力
...与成果有目共睹。今年4月,其重磅推出全新升级的原生多模态通用大模型日日新SenseNova V6。该模型通过多模态长思维链训练、全局记忆、强化学习等技术突破,形成了领先的多模态推理能力,并且成功突破成本边界,为大规模应用奠...……更多
猎豹CEO傅盛2024年预言:千亿大模型过半凋零,人形机器人必定不能量产【附AIGC市场现状分析】
...景划分,AI大模型主要包括语言大模型、视觉大模型和多模态大模型等。业界典型的自然语言大模型有GPT-3、源、悟道和文心等。视觉大模型也已广泛应用于自动驾驶、智能安防、医学影像等领域。基于多模态大模型的以文生图...……更多
西云算力举办AIGC沙龙,CTO梁峰分享“全系列全场景智算基础设施”
...从技术视角、落地实践、未来展望三个方面,就“领域多模态大模型的实践与创新”的话题展开分享。他介绍了“原生”多模态大模型(LLM)的典型架构和典型多模态Agent的具体案例。同时以营销场景为例分享了白海科技多模态...……更多
实现意念操控鼠标,脑机接口新突破!马斯克的宏伟抱负不远了
...实现了自主脑控喝水。国泰君安指出,脑机接口助推AI多模态领域发展,有望驱动新一轮行情。当前,脑电大模型的开发往往面临脑电数据收集和处理的困难。随着脑机接口的发展,脑机接口成为人机交互的一种新方式后,脑电...……更多
实体“贾维斯” vivo发布PhoneGPT:可自动打电话定餐厅
...能力,并带来vivo自研的语音大模型、图像大模型以及多模态大模型。蓝心图像大模型强化了中国特色与东方美学的融合生成能力,是国内最懂中文语境的图像模型之一,甚至还支持国风水墨,支持在图片生成过程中,增加汉字...……更多
林达华谈大模型发展之路:未来会有更高效的模型结构出现
...一年,人工智能领域风起云涌,模型架构、训练数据、多模态、超长上下文、智能体发展突飞猛进。大模型的技术演进路在何方?3月24日,在2024全球开发者先锋大会的大模型前沿论坛上,上海人工智能实验室领军科学家林达华...……更多
阶跃星辰CEO姜大昕:强化学习不是AI的尽头,下一步是自主学习,Agent将成超级应用
...训练模型的主要范式是模仿学习,学习的主要目标是各种模态的表征,下一步是培养模型能够解决复杂问题的能力。人脑对复杂问题的解决是启动系统2的模式,通过问题拆解不断探索。“如何让模型也能够学会这种探索的过程...……更多
千行百业加速拥抱大模型(AI前沿观察)
...语料数据联盟成员单位共同开源发布“书生·万卷”1.0多模态预训练语料。本次开源的数据总量超过2TB,包含超5亿个文本、2200万个图文交错文档、1000个影像视频。在11月举行的2023人工智能计算大会上,智源研究院联合阿里云、...……更多
又一生成式AI助手将“登机”!谷歌发布多模态Bard助理,交互式AI时代近了?
...文本、语音或图像与Bard助理互动——换言之,其具备多模态功能。例如,当用户询问“本周我错过了哪些重要邮件”时,Bard助理会列出各项要点及具体内容,并附上具体对应邮件的链接,还可以帮助用户提取活动地址并在谷歌...……更多
...为,从Pika、Gemini1.0到Sora和Gemini1.5,支持AI视频生成的AI多模态模型不断突破,特别是Sora能够理解和模拟现实世界的模型基础,有望成为实现AGI(通用人工智能)的重要突破节点。AI视频生成等多模态模型有望在影视、动画、游戏...……更多
...新车就有一台采用了该公司的技术。该公司还提到了其多模态交互技术,复杂场景识别效果可达92.8%,覆盖71种语言识别能力的多语种技术,助力长安、上汽、长城、奇瑞等众多中国车企走向海外市场。科大讯飞还表示,今年年...……更多
更多关于科技的资讯:
家委必藏!毕业照别乱找!忆学堂封神级拍摄,给娃留一辈子的青春纪念
在毕业季影像服务赛道,“专业”与“可靠”是始终不变的核心诉求。忆学堂从一间工作室成长为全国连锁品牌,凭借实打实的硬实力
2025-12-22 14:13:00
喜茶携手泡泡玛特星星人,首次全球同步联名活动正式上线
鲁网12月22日讯12月22日,喜茶与泡泡玛特(POP MART)旗下人气IP星星人的联名活动正式登陆喜茶全球门店,不少喜茶门店开业后就迅速进入制茶繁忙状态
2025-12-22 14:14:00
正雅于法国巴黎迪士尼成功举办早期矫治学术峰会
2025年12月13日,正雅齿科在法国巴黎迪士尼乐园酒店成功举办了"儿童早期矫治学术研讨会"。本次会议吸引了来自法国、瑞士
2025-12-22 14:20:00
2025游戏公益+研究报告在沪发布:公益是游戏体验的“加分项”
有多少游戏企业在游戏产品里做公益?他们做的公益活动被多少玩家接触过?在游戏里做公益是否会影响玩家游戏体验?在12月19日举办的2025中国游戏产业年会游戏公益+论坛上
2025-12-22 14:21:00
青岛城市传媒广场发布2026业态升级战略,携手多元品牌共筑“潮趣换新,自在未来”
12月20日,“潮趣换新,自在未来——青岛城市传媒广场新起点暨2026业态升级发布会”在青岛西海岸隆重举行。活动标志着这座扎根区域八年的文化商业地标正式开启全面焕新阶段
2025-12-22 14:49:00
年底前一项大利好政策来了!刚刚,央行发布《关于实施一次性信用修复政策有关安排的通知》,这意味着个人信用救济的重磅政策落地
2025-12-22 14:57:00
【宅男财经|专家面对面】据看看新闻报道,12月21日,俞敏洪在讲话中谈及董宇辉离职,仍亲切地喊他“孩子”,表示对目前结果感到满意
2025-12-22 15:00:00
安踏儿童携手广州亲子跑,足弓PRO跑鞋「萌芽」配色首发亮相
近日,2025广州亲子跑在广州天河体育中心活力开跑,约600组家庭、近2000名大小跑者携手出发。现场安踏儿童将“足弓成长计划”与广州亲子跑深度融合
2025-12-22 15:21:00
大力神杯“打卡”青岛!海信RGB-Mini LED电视提前解锁2026年世界杯极致观赛
鲁网12月22日讯12月21日,象征足坛最高荣耀的大力神杯“空降”青岛,2026世界杯定制电视海信RGB-Mini LED电视同步亮相
2025-12-22 15:26:00
近日,动力锂电池专列从四川宜宾港鸣笛启程,一路驰骋奔赴上海,这一历史性时刻,如同一束强光,照亮了动力锂电池运输领域全新的发展方向
2025-12-22 15:36:00
中国消费者报报道(记者王小月)随着智能手机、笔记本电脑等消费电子产品迭代速度不断加快,大量旧设备涌入回收与再流通渠道。然而
2025-12-22 15:42:00
为期两天的2025年平谷国际宠物博览会已圆满收官,本次博览会汇聚400余家优质展商,集中展示名猫、名犬、宠物食品、用品等特色产品
2025-12-22 15:51:00
青岛打卡大力神杯!海信携世界杯定制冰箱揭秘“冠军级保鲜”密码
鲁网12月22日讯12月21日,象征世界足球最高荣誉的大力神杯在青岛首次面向公众展出,引发了广泛关注。活动现场,海信冰箱携三款2026世界杯定制冰箱同步亮相
2025-12-22 16:00:00
大力神杯青岛焕彩,容声以“鲜”世技术赴冠军之约
鲁网12月22日讯“技术好的很多,但冠军才能捧杯!”12月21日,青岛迎来足球界至高荣耀——象征全球足球巅峰荣誉的大力神杯在此开启24小时公开展出
2025-12-22 16:03:00
海信冰箱磁吸光幕门板荣获2025国际CMF设计奖
鲁网12月22日讯日前,全球设计领域权威奖项——2025国际CMF设计奖正式揭晓,海信冰箱全球首创的磁吸光幕门板凭借在材质
2025-12-22 16:04:00