模态,推理,北大,视觉,模型,推理头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...两个的版本，名为Scout和Maverick。Meta表示，Llama 4是一个多模态大模型，它能够处理和整合各种类型的数据，包括文本、视频、图像和音频，并且可以在这些格式之间转换内容。Llama 4系列首次采用了混合专家(MoE)架构的模型，这种...……更多

2025-04-07 06:44:00架构,混合,模型,专家,模型,人工智能

突发！谷歌发布史上最强大模型Gemini，打爆GPT-4

...萨比斯在谷歌官网联名发文，宣布推出这一万众瞩目的多模态大模型。标题明晃晃写着“最大”、“最强”，主打的就是一个干爆GPT-4。具体来说，此次谷歌一共带来了Gemini的三个版本：Gemini Ultra：谷歌最大、最强模型，适用于...……更多

2023-12-07 09:35:00突发,模型,模态,模型,基准,数据

景顺长城基金张雪薇：AI仍是比较确定的长期主线

...机、PC等，张雪薇看好相关产业链机遇。大模型正在向多模态发展，由之前的文本、语音到现在的图片，包括未来视频，不同的媒介会诞生出新的应用，会把模型通用化能力提升，未来比如广告推荐、用户画像都会像大模型靠拢...……更多

2024-05-22 16:23:00张雪,长城,主线,基金,模型,张雪

阿里通义实验室黄斐：开源进入千问时代，即将发布的推理模型会更

...包括了更快的响应和更低的成本。全能模型则是指能将多模态混合的模型，在输入输出方面更加自由。黄斐认为，在模型之外，AI Agent（智能体）也是一个需要重点关注的领域：“未来的一段时间内，AI Agent一定也是一个比较火...……更多

2025-02-21 23:22:00通义,阿里,推理,实验室,模型,实验

中国也有Sora同款训练架构公司，清华班底，智谱也投了 |

...也出现了大模型独角兽智谱AI的身影。36氪获悉，近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融资由启明创投领投，达泰资本、鸿福厚德、智谱AI、老股东BV百度风投和卓源亚洲跟投。据介绍，融资主要用于多模...……更多

2024-03-14 15:12:00清华,班底,中国,架构,训练,公司

从空间智能到具身智能，跨维践行Sim2Real AI最高效路

...使用双眼感知世界一样，具身智能要求机器人能够通过多模态传感器进行感知、交互和决策，形成综合的空间认知和操作能力。问：空间智能与具身智能的异同点是什么？贾奎：就像前面提到的，空间智能赋予 AI 感知并理解现...……更多

2024-07-23 09:40:00智能,路径,空间,智能,机器人,机器

马斯克官宣Grok-2测试版！xAI将继续拥抱开源路线吗？

...来，于今年3、4月陆续推出了Grok-1.5大语言模型和首个多模态模型Grok-1.5 Vision，整体迭代速度已足够惊人。但要超越当前所有AI大模型，Grok-2要面对的问题或许远没想象中简单。所有指标超越当前AI大模型，真的假的？2023年11月，x...……更多

2024-08-13 09:50:00马斯,马斯克,测试版,路线,测试,模型

清华提出CharacterGLM；DeepMind联创发全新

...大模型版“5年高考3年模拟”来了！6141道数学题，还是多模态的那种｜微软&UCLA&UW联合出品》MathVista是一个多模态数学推理基准数据集，由微软、UCLA和UW联合开发，包含6141个数学问题，涵盖丰富的任务类型、推理能力和图...……更多

2023-12-06 09:22:00联创,模型,清华,早报,一代,零售

具身智能如何再进化？庞江淼：“虚实贯通”将成推动机器人自主演

...VL（视觉语言）能力下降”的问题。“它（VLA）并不像多模态大模型已经到了一个可用的状态，想驱动一个机器人泛化到一个场景去作业，还有较遥远的距离。”庞江淼说。当下，庞江淼认为最关键的仍是数据怎么来。他在论坛...……更多

2025-02-26 14:49:00虚实,机器人,进化,路径,机器,智能

大模型新趋势之MoE：现状、挑战及研究方向

...模和处理，提升模型的准确性和专业能力，更好地适应多模态数据及复杂/特定任务计算。二是根据任务的需求灵活选择并组合适宜的专家模型，使得模型能够动态地适应不同的输入样本和任务场景，提高模型的灵活性、可解释...……更多

2024-11-04 16:00:00研究方向,模型,现状,方向,趋势,研究

arxiv研究人员：多模态ai模型存在安全隐患

...论文指出，包括GPT-4V、GPT-4o和Gemini1.5在内的大部分主流多模态AI模型，处理用户的多模态输入（例如一起输入图片和文本内容）之后，输出结果并不安全。这项研究标题为《跨模态安全调整》（Cross-ModalitySafetyAlignment），提出了...……更多

2024-06-26 03:07:00模态,研究人员,隐患,模型,人员,安全

字节猛踩油门

...需求。首先，云厂商需要有更好的模型、更低的成本，多模态也是更好模型的一种体现，但这还不够。AI应用从聊天、信息处理到Agent的发展过程中，需要更多的解决方案。比如今天发布的OS Agent，需要Agent去操作电脑、手机，这...……更多

2025-04-18 22:26:00油门,字节,模型,火山,引擎,豆包

ChatGPT o1满血版上线！实测中它竟然败给了国产AI？

...文件上传，而此前是只能进行文字输入，也就是新增了多模态理解，不过网页搜索功能仍未上线，这点倒是让人感到遗憾。对于o1满血版的提升，OpenAI的CEO奥特曼用一个简单的柱状图给出了对比：可以看到o1在数学推理和编程领...……更多

2024-12-11 20:12:00实测,国产,模型,推理,文心,答案

反击OpenAI，谷歌放出最强悍大模型Gemini

... CEO戴密斯·哈萨比斯在谷歌官网联名发文，官宣了最新多模态大模型Gemini 1.0（双子星）版本正式上线。这个上线时间早于外界猜测的明年1月，保密程度很高，仅有少数媒体提前猜出。Gemini 1.0是谷歌筹备了一年之久的GPT4真正竞...……更多

2023-12-07 10:31:00强悍,模型,模态,模型,训练,能力

苹果公司公布“mm1”多模态大模型

...omMultimodalLLMPre-training》的论文，其中介绍了一款“MM1”多模态大模型，该模型提供30亿、70亿、300亿三种参数规模，拥有图像识别和自然语言推理能力。IT之家注意到，苹果研究团队相关论文主要是利用MM1模型做实验，通过控制各...……更多

2024-03-16 18:48:00苹果公司,模态,模型,苹果,公司,模型

语言≠思维，大模型学不了推理：一篇Nature让AI社区炸锅

...两个非常重要的特性：首先，语言区域表现出输入和输出模态的独立性，这是表征抽象性的关键特征。主要表现为在理解过程中，这些大脑区域对跨模态（口头、书面或手语）的语言输入做出反应。同样，在语言生成过程中，无...……更多

2024-06-25 09:45:00推理,模型,思维,语言,社区,语言

连续两日逼近“20CM”涨停，南沙独角兽企业云从科技如何成为

...化以及推理部署验证，包括语言大模型、视觉大模型和多模态大模型。让大模型通过知识学习和技能学习，快速应用于用户的业务场景中。民生证券最新研报指出，昇腾AI一体机是国内AI软硬件技术的黄金交点。乐观预计，2027年G...……更多

2023-11-15 10:18:00南沙,华为,独角兽,概念股,概念,科技

GPT刚刚公开「草莓」项目：推理能力翻倍，定价200美元？

...题。此外还有一个更加实际问题是，与现有的 GPT-4 等多模态模型相比，据称「草莓」仍然缺乏多模态处理能力，这也意味着它在处理图像、视频等复杂数据时可能面临局限性。还有价格。首先要说明的是，在官方还未发布甚至...……更多

2024-09-12 09:49:00推理,草莓,定价,能力,项目,草莓

2024北京国际车展｜加速智能汽车驶入AGI时代商汤绝影系

...ified Autonomous Driving）的道路测试表现，同时还带来了以多模态场景大脑为核心的AI大模型座舱产品矩阵以及全新座舱3D交互演示，全景展示通用人工智能（AGI）技术驱动的灵活自适应、深度个性化、安全可信赖、有人文关怀的未...……更多

2024-04-28 21:29:00商汤,原生态,北京,车展,模型,智能

豆包再降价，字节“饱和式”进攻仍在继续

...AGI更进一步，大家都在加速。实际上，字节对视觉化、多模态模型的重视度肉眼可见的提升。12月11日，据智能涌现报道，字节提升了即梦的产品优先级，尝试用新的路径打造AI时代的“抖音”。字节计划后续把更多资源向更多模...……更多

2024-12-20 09:25:00豆包,饱和,字节,进攻,豆包,模型

多模态模型免微调接入互联网，即插即用新框架，效果超闭源方案

...合提出即插即用的SearchLVLMs框架，可以无缝整合任意的多模态大模型。该框架在推理阶段对大模型进行互联网检索增强，使得大模型无需微调即可对实时信息进行准确的反馈。研究团队提出首个辅助多模态大模型对实时信息进行...……更多

2024-11-11 13:34:00模态,接入,框架,模型,效果,互联网

推动前沿大模型技术应用这只浙股去年营收净利双增

...注全球前沿AI技术的突破与应用，围绕金融数据覆盖、多模态、模型训练、AI算力优化和智能安全等关键领域，持续优化升级问财HithinkGPT 大模型，不断提升其整体性能。同花顺在公告中称，公司建立了高效的训练体系，涵盖数据...……更多

2025-02-26 09:09:00净利,技术应用,模型,应用,技术,模型

深数所发布500个行业多模态算料集

...据交易所（以下简称“深数所”）发布了500个垂直行业多模态算料集，按照大模型应用的不同阶段（训练、推理、调优），有的放矢地提供数据源，让国产大模型厂商“寻数有路”。此次深数所发布的首批500个人工智能大模型高...……更多

2024-04-13 01:58:00模态,行业,数据,模型,模态,人工智能

Sam Altman或筹数十亿美元自造AI芯片，DeepMi

...期版本，并接近最新版本的表现。此外，GLM-4还增强了多模态能力，其CogView3模型在多项评测维度上达到了DALL·E3的90%以上水平。智谱AI还发布了GLMs和GLM Store，为用户提供定制化的个人GLM大模型和模型应用商店。GLMs降低了大模型...……更多

2024-01-29 09:20:00首席,科学家,芯片,创业,科学,模型

构建数字经济新引擎：枫清科技高雪峰解读AI技术的未来趋势

...）创新性地推出了“一体两翼”产品矩阵，包括自研的多模态知识引擎与行业通用智能体平台，致力于构建未来通用人工智能（AGI）时代的核心数据基础设施，为企业提供大模型与知识引擎双轮驱动的解决方案。枫清·天枢多模...……更多

2024-09-13 18:28:00雪峰,趋势,数字,引擎,经济,技术

开源社区参数量最大的文生视频模型来了，腾讯版Sora免费使用

...展现每一个动作的流畅过程。语义遵从：业界首个以多模态大语言模型为文本编码器的视频生成模型，天然具备超高语义理解能力，在处理多主体及属性绑定等生成领域的难点挑战时表现出色。原生镜头转换：多视角镜头切...……更多

2024-12-04 09:48:00文生,腾讯,模型,参数,社区,视频

商汤科技发布日日新5.0大模型

...提供坚实基础。本次“日日新5.0”另一大核心指标就是多模态能力，与此同时，在应用产品层面也实现了更卓越的多模态能力，支持高清长图的解析和理解以及文生图交互式生成，还可以实现复杂的跨文档知识抽取及总结问答展...……更多

2024-04-29 04:36:00商汤,模型,科技,商汤,能力,模型

本周硅谷发生了什么？｜苹果Vision Pro正式开售；Ne

...布Baichuan 3大模型，更好理解中文阿里巴巴开发的自主多模态AI代理MobileAgent上线苹果Vision Pro正式在美开售，库克称将很快登陆中国脑机接口公司Neuralink完成首例人脑植入手术 Hugging Face推出可定制AI个人助手苹果发布2024年Q1财报...……更多

2024-02-05 11:37:00硅谷,字节,接口,人类,苹果,模型