• 我的订阅
  • 头条热搜
手机上能跑的「GPT-4V」来啦!多图、视频理解首次上端!面壁小钢炮开源史上最强端侧多模态
...再次刷新端侧多模态天花板,面壁「小钢炮」 MiniCPM-V 2.6 模型重磅上新!仅8B参数,取得 20B 以下单图、多图、视频理解 3 SOTA 成绩,一举将端侧AI多模态能力拉升至全面对标超越 GPT-4V 水平。更有多项功能首次上「端」:小钢炮...……更多
中信证券:谷歌Gemini模型发布 AI进入多模态时代 【中信证券:谷歌Gemini模型发布 AI进入多模态时代】财联社12月7日电,中信证券研报指出,近日,谷歌宣布发布新一代大模型Gemini,再次引发市场对人工智能产业的持续关注。Gemi...……更多
英伟达开源NVLM 1.0屠榜多模态!纯文本性能不降反升
【新智元导读】NVLM 1.0系列多模态大型语言模型在视觉语言任务上达到了与GPT-4o和其他开源模型相媲美的水平,其在纯文本性能甚至超过了LLM骨干模型,特别是在文本数学和编码基准测试中,平均准确率提高了4.3个百分点。文本...……更多
浪潮受邀参加第六届智能财务高峰论坛
...能财务迈入新阶段》主题报告。本届论坛以“人工智能大模型助推智能财务新发展”为主题,围绕人工智能大模型、智能财务最佳实践、智能财务基础理论以及智能财务生态发展等议题进行分享,邀请政府领导、专家学者、行业...……更多
京港洽谈会海淀专场圆满落幕,智谱积极响应共绘两地合作蓝图
...谱的技术成果。智谱深耕人工智能多年,不仅在千亿基座模型、对话模型、代码模型、多模态模型等关键领域完成了全面布局,更在推动技术成果转化、服务产业升级方面展现了强大实力。智谱以全自研基座大模型为基础,研发...……更多
联通元景大模型亮相2024年中国品牌日 打造产业智能化新范式
...参与中国品牌日活动,并在联通展馆精彩亮相联通元景大模型,充分展示大模型的核心能力及对各行业的颠覆性影响。能说、擅听、会看的联通元景大模型联通展台前热闹非凡,参观者络绎不绝。联通一位工作人员以实操+讲解的方...……更多
“大装置+大模型”战略:助力商汤迅速获取生成式AI商业化果实
...范本。“商汤生成式AI业务的增长,得益于各行各业对大模型的训练和推理的广泛需求。”在商汤科技董事长兼CEO官徐立看来,中国硬科技投资的新周期正式开启,而商汤能踏准这一关键的机遇点,则是基于其前瞻性的基础设施...……更多
360 奇元大模型宣布通过备案,自研两大模型均实现获批
11月5日消息,360大模型“奇元大模型”已于 11月4日通过备案落地。IT之家查询发现,“360智脑大模型”于今年9月5日面向公众开放,360公司也因此而成为国内首家两个大模型均通过备案的科技企业。据介绍,360智脑大模型集成了...……更多
AI大模型赋能交通:化身“数字运维专家”,融入车管电子书
...大型研究,协同探索人工智能发展创新。本次推出“有AI模型”系列报道,南都研究员与南方都市报“AI治理与创新智联体”专家一同走访广东人工智能大模型研发企业,看AI大模型如何赋能千行百业。第一期,走进广东省首批战...……更多
对标GPT-4o!商汤发布两大国内首个大模型 入局价格战
...主力产品,国内首个真C端可用、可控的人物视频生成大模型。而更有颠覆性的是国内首个所见即所得的模型——商汤“日日新5o”,实时多模态流式交互对标GPT-4o,开启了全新的AI交互模式。此外,商汤也加入了大模型价格战,...……更多
对比学习滥用隐私数据!中科院等发布「多步误差最小化」方法 | ACM MM2024
...模态不可学习样本,以保护个人数据不被多模态对比学习模型滥用。通过优化图像噪声和文本触发器,MEM方法有效地误导模型,降低其对隐私数据的学习能力,并在不同模型间展现出强大的可迁移性。多模态对比学习(如CLIP)...……更多
五连板苏州科达:公司的KD-GPT大模型相对于谷歌Gemini的通用多模态大模型在服务对象上存在明显区别 【五连板苏州科达:公司的KD-GPT大模型相对于谷歌Gemini的通用多模态大模型在服务对象上存在明显区别】财联社12月13日电,苏...……更多
OriginOS 5来了!2024 vivo开发者大会定档10月10日:还有自研操作系统
...设置一个主会场和八大分会场。主会场将带来自研蓝心大模型的升级、OriginOS 5和自研蓝河操作系统 2等内容。分会场将涉及应用服务与商业合作、游戏生态、人工智能、蓝河操作系统、IoT开放生态、安全与隐私、信息无障碍、互...……更多
2024年投资展望丨AI、MR、短剧等概念爆发,传媒板块去年逆市涨近17%
...线和游戏板块实现营收和净利润同增。二、市场情况:大模型接连问世,应用遍地开花作为引领板块行情的重要主线,AI时代正随着新技术革命而加速展开。招商证券指出,2023年是大模型的“C端奇点时刻”,生成式AI市场前景广...……更多
MMMU华人团队更新Pro版!多模态基准升至史诗级难度:过滤纯文本问题、引入纯视觉问答
...题、增加候选选项、引入纯视觉输入设置)更严格地评估模型的多模态理解能力;模型在新基准上的性能下降明显,表明MMMU-Pro能有效避免模型依赖捷径和猜测策略的情况。多模态大型语言模型(MLLMs)在各个排行榜上展现的性...……更多
生成式AI在金融行业的应用及思考
...逊云科技出海日2024,生成式Ai金融应用,企业内部知识库,大模型微调训练,数据集成治理,人工智能落地工程]本文字数:2400,阅读完需:12分钟导读张呈刚先生在2024年亚马逊云科技出海日上做了题为”生成式AI在金融行业的应用及思考”...……更多
...、开普云、万兴科技等跟涨。中信证券研报表示,海外大模型技术保持高速推进,以视觉能力为核心的大模型多模态能力不断展现,模型视觉理解和生成能力快速发展,有望带来广阔市场机遇,推动AI商业化进程加速和市场天花...……更多
多模态模型评测框架lmms-eval发布!全面覆盖,低成本,零污染
...稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com随着大模型研究的深入,如何将其推广到更多的模态上已经成为了学术界和产业界的热点。最近发布的闭源大模型如 GPT-4o、Claude 3.5 等都已经具备了超强的图像理解能力,LLaVA-……更多
中信证券:OpenAI推出视频生成模型Sora AI产业围绕多模态不断加码 【中信证券:OpenAI推出视频生成模型Sora AI产业围绕多模态不断加码】财联社2月19日电,中信证券研报指出,近一周内,OpenAI和谷歌分别推出了他们的最新AI模型,...……更多
科学家开发多模态音乐理解和生成大模型,兼具理解和创作音乐能力
“同行们认为我们用大模型把音乐理解和生成结合在一起的想法比较新颖,论文也是多模态大模型领域的先期工作之一。并且,除了大模型本身,我们提出的针对模型训练的数据集制作流程和整理的数据集,对学术界也具有较...……更多
必然的命运:AI大模型冲向“免费轮盘赌”
导语:向C端免费意味着国内大模型走向了类似移动互联网产品一样,先培养用户深度习惯,提高用户黏性后再开启收费的烧钱路径。金沙江创投的朱啸虎曾说:美国打第一次海湾战争才花了120亿美金,现在互联网企业的融资可...……更多
...近日,北京智源人工智能研究院正式发布原生多模态世界模型Emu3。该模型实现了视频、图像、文本三种模态的统一理解与生成,成功验证了基于下一个token(词元)预测的多模态技术范式,释放其在大规模训练和推理上的潜力。...……更多
大模型重塑智能硬件!人手一个智能助手的时代来了?
...聊烦恼、疑惑和心事……可以预见,更智能化的多模态大模型赋予了智能硬件新的生命。就在上周六,RTE 2024第十届实时互联网大会IoT分论坛圆满结束。多位AI智能硬件赛道的资深人士齐聚一堂,共同探讨如何让“智能硬件产品...……更多
“解锁”AI云盘新体验!中国移动云盘通过3项AI算法备案
...深度合成服务算法备案信息公告中,中国移动云盘3项大模型算法成功通过备案,涵盖多模态大模型、文本生成算法等。去年9月,中国移动云盘启动AI智能工具内测,本次算法备案成功标志着中国移动云盘可正式对外提供深度合...……更多
北大等发布多模态版o1!首个慢思考VLM将开源,视觉推理超闭源
北大等出品,首个多模态版o1开源模型来了——代号LLaVA-o1,基于Llama-3.2-Vision模型打造,超越传统思维链提示,实现自主“慢思考”推理。在多模态推理基准测试中,LLaVA-o1超越其基础模型8.9%,并在性能上超越了一众开闭源模型...……更多
英诺天使基金:“明年或是AI应用元年”,AI创新将在C端爆发
ChatGPT的出现和国内外对大模型的竞逐战让2023年成为了技术变革里程碑式的一年。面对将被技术重塑的未来,生成式AI爆发会带来颠覆式创新还是渐进式迭代?AI带来的新能力又会给不同的产业、产品怎样的可能性?12月14日,在...……更多
苹果公司公布“mm1”多模态大模型
...dalLLMPre-training》的论文,其中介绍了一款“MM1”多模态大模型,该模型提供30亿、70亿、300亿三种参数规模,拥有图像识别和自然语言推理能力。IT之家注意到,苹果研究团队相关论文主要是利用MM1模型做实验,通过控制各种变量...……更多
首个多模态连续学习综述,港中文、清华、UIC联合发布
...态连续学习的最新进展连续学习(CL)旨在增强机器学习模型的能力,使其能够不断从新数据中学习,而无需进行所有旧数据的重新训练。连续学习的主要挑战是灾难性遗忘:当任务按顺序训练时,新的任务训练会严重干扰之前...……更多
每日与世界30亿次交互!这家AI独角兽企业发布视频、音乐生成模型
...示词,等待1—2分钟,可生成6秒的视频;没有伴奏,音乐模型也可以是实力歌手。8月31日,AI独角兽企业上海稀宇科技有限公司(以下简称MiniMax)“Link 伙伴日”在西岸漩心拉开帷幕。当日,MiniMax正式发布视频模型video-01以及音...……更多
AI大模型驱动周期演进加速,3D视觉感知打开机会空间
...目前需要谨慎。据介绍,2022年3月光鉴科技开始与国内新势力车企共研车舱3D视觉方案,并在此前交付了软件类视觉感知系统。“2023年我们已经拿到TS16949(质量体系要求)资质,2024年开始可以提供软硬件一体化方案。”他指出。(...……更多
更多关于科技的资讯:
山东移动成功入选2025年度山东省中小企业服务支撑机构
近日,山东省轻工联社发布《关于公布2025年度山东省中小企业服务支撑机构名单的通知》,山东移动成功入选。作为推动中小企业数字化转型的主力军
2025-09-27 08:11:00
南报网讯(记者卫凌云通讯员建萱)9月26日,2025南京河西中央科创区生态建设推进会举行,“大厂+大学+大所”创新平台揭牌
2025-09-27 09:53:00
山东移动淄博公司织就高速信息网络,筑牢“数字淄博”智慧生命线
在数字化浪潮席卷而来的今天,信息传输网络如同城市的“神经网络”,是智慧城市运转的核心支撑。作为这一无形“生命线”的守护者
2025-09-27 12:34:00
迭代焕新“吾悦经营五步法”,新城控股再启商业新篇
9月24日-25日,新城控股“2025第八届商业年会暨吾悦商管第一届悦链计划合伙人大会”在上海西岸美高梅酒店举行,新城控股集团董事长王晓松及公司高管
2025-09-27 12:37:00
25日上午,以“上山下山·食在晋安”为主题的晋安区“一县一桌菜”云上发布会举行,12道“云端”盛宴引爆味蕾。
2025-09-27 13:53:00
产业链协同驱动 新奥加速冲刺氢硼聚变
河北新闻网讯(张新)2025年,是我国“十四五”规划收官之年,也是“双碳”目标提出五周年。在此背景下,央视《东方时空》栏目近日推出“可控核聚变专题”
2025-09-27 14:45:00
9月25日,国网山西省电力公司发布消息,该公司成功完成配电网无人机电力北斗定位服务的全面应用,标志着该公司依托电力北斗高精度定位服务
2025-09-27 19:56:00
谢志强:从金融菁英到人才“伯乐”,以产学研融合破局就业困境
谢志强,现任中科汇理信息技术研究院党支部书记、秘书长、中科产学研合作一体化人才培育开发平台项目主任。历任中国银行总行风险管理部业务经理
2025-09-27 20:20:00
聚焦数贸会 | 工匠行:机器狗能听会说还会自主巡逻
在第四届全球数字博览会上,贵州工匠行科技有限公司展出的SomaSeek具身智能平台,让机器人彻底告别了遥控器,也能听会说
2025-09-27 22:17:00
企业新市场何处寻?潍坊这场产业国际精准对接会送来“及时雨”
齐鲁晚报·齐鲁壹点 胡晓雪 李国栋9月26日,2025潍坊纺织服装产业国际精准对接活动在奎文区成功举办,本次活动以“我帮企业组主场·我为企业找订单”为主题
2025-09-27 22:22:00
生产周期缩短1/3,宇捷轴承凭核心技术领跑细分市场
齐鲁晚报·齐鲁壹点 陶春燕 山东省宇捷轴承制造有限公司是国家级专精特新重点“小巨人”企业、国内最大的调心滚子轴承生产企业
2025-09-27 20:05:00
电动车照亮小区应急通道?淄博供电验证居民V2G桩集群放电场景
当小区突发故障停电,地下车库里业主们的电动汽车,瞬间变身为一个巨大“充电宝”,为消防、通风和应急照明系统供电,守护社区安全
2025-09-27 12:35:00
数字游民在南京:我推着房间找邻居
随时“云端”办公,自由“安放”工位,数字游民社区兴起数字游民在南京:我推着房间找邻居南京首个乡村数字游民社区坐落于浦口草圣书乡景区
2025-09-26 08:14:00
三迭纪项目入选国家药监局智慧监管典型案例年产3亿片!3D打印药片,片片皆可溯源南报网讯(通讯员唐斐记者张希)近日,国家药品监督管理局信息中心正式公布“2025年药品智慧监管典型案例”
2025-09-26 08:14:00
二〇二五年中国香料香精化妆品精品博览会启幕十七个香妆产业创新转化项目签约南报网讯(记者夏思宇)9月25日上午,2025年中国香料香精化妆品精品博览会在南京扬子江国际会议中心开幕
2025-09-26 08:15:00