模态,领衔,基准,推理,视觉,能力头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

... S-Lab 的博士生 Bo Li, 字节跳动研究员 Wei Li, Zejun Ma.视频多模态大模型（LMMs）的发展受限于从网络获取大量高质量视频数据。为解决这一问题，我们提出了一种替代方法，创建一个专为视频指令跟随任务设计的高质量合成数据集...……更多

2024-10-22 09:54:00模态,大功,瓶颈,模型,突破,项目

Claude 3.5深夜觉醒，学会模仿人类用电脑！编程干翻o

...，检测是否发生危害。研究过程Anthropic在工具使用和多模态的工作，为AI识别和解释图像奠定了基础。在此基础上，Claude还需要推理如何以及何时根据屏幕内容执行操作。为此，研究者训练Claude准确计算像素，从而完成命令，...……更多

2024-10-23 09:55:00人类,编程,模型,能力,开发,任务

llava-1.6与gpt-4vmp面硬刚的性能，一起来看看

...Qwen-VL-Plus，与GPT-4V正面硬刚，这个有着SOTA级别性能的多模态大模型真正做到了“人无我有，人有我优”。继2023年4月的初级版本、2023年10月的LLaVA-1.5之后，2024年1月31日，微软研究院又联合威斯康星大学麦迪逊分校和哥伦比亚大...……更多

2024-02-10 21:04:00性能,模型,模态,训练,数据,卷上

OpenAI新功能 “深度研究” 登场，人类终极考试的表现超

...度和背景信息。与深度研究相比，GPT-4o更适合实时、多模态的对话。对于需要深入探索和详细分析的多方面、特定领域的复杂问题，深度研究能够进行广泛的调研并为每个观点提供引用，这与简单的快速总结不同，它能够提供...……更多

2025-02-04 04:25:00新功能,终极,深度,人类,考试,研究

字节跳动为企业提供极具性价比的多模态大模型能力

...正式发布豆包视觉理解模型，为企业提供极具性价比的多模态大模型能力。豆包视觉理解模型千tokens输入价格仅为3厘，一元钱就可处理284张720P的图片，比行业价格便宜85％，以更低成本推动AI技术普惠和应用发展。火山引擎总裁...……更多

2024-12-18 17:35:00模态,字节,性价比,模型,能力,企业

Meta首款多模态Llama 3.2开源！1B羊驼宝宝，跑在

【新智元导读】Meta首个理解图文的多模态Llama 3.2来了！这次，除了11B和90B两个基础版本，Meta还推出了仅有1B和3B轻量级版本，适配了Arm处理器，手机、AR眼镜边缘设备皆可用。Llama 3.1超大杯405B刚过去两个月，全新升级后的Llama 3....……更多

2024-09-27 13:39:00模态,宝宝,模型,图像,训练,文本

Sora再度颠覆AI视频行业，A股哪些公司有相关布局？

...实现AGI（通用人工智能）的重要里程碑。券商建议关注多模态技术Sora视频一出，立刻震惊业界。360集团创始人、董事长周鸿祎2月16日在微博发文表示，这意味着AGI实现将从10年缩短到1年。其实，Sora出现之前，也有其他类似的AI...……更多

2024-02-19 08:10:00颠覆,布局,行业,视频,公司,模型

阶跃星辰CEO姜大昕：强化学习不是AI的尽头，下一步是自主学

...训练模型的主要范式是模仿学习，学习的主要目标是各种模态的表征，下一步是培养模型能够解决复杂问题的能力。人脑对复杂问题的解决是启动系统2的模式，通过问题拆解不断探索。“如何让模型也能够学会这种探索的过程...……更多

2025-02-21 16:10:00大昕,学习,星辰,应用,大昕,模型

紫东.太初再进化，揭秘全模态大模型的想象力

...在演讲中介绍了基于昇腾AI与昇思MindSpore AI框架打造的全模态大模型紫东.太初2.0，并首次提出全模态多任务统一生成式学习框架。借用Hugging Face联合创始人Thomas Wolf的说法：“在过去的几年里，好的多模态模型一直是许多大型技...……更多

2023-05-12 06:00:00太初,模态,想象力,进化,模型,模态

斯坦福AI团队抄袭国产大模型？连识别“清华简”都抄了！清华系

...，引起舆论哗然。起因是这个团队在5月29日发布了一个多模态大模型Llama3-V，声称只花500美元训练，就能实现在多个基准测试中比肩GPT-4的性能。但很快有人发现，该模型跟清华系大模型创企面壁智能5月发布的MiniCPM-Llama3-V 2.5模...……更多

2024-06-04 14:35:00清华,斯坦,斯坦福,团队,模型,抄袭

首届空天信息技术大会开幕，发布全球首个百亿级遥感解译基础模型

...式的变革提供了可能。“空天·灵眸”是我国首个面向多模态遥感数据生成式基础模型，也是首个专为遥感领域打造的专业基础模型。自2022年首次推出后，空天院研究团队在“基础模型+下游任务”计算范式积累上持续探索。于...……更多

2024-09-23 11:53:00空天,遥感,首届,模型,大会,基础

GPT-4不仅性能更强也更贵了：单次输出7.5万单词需6美元

...？”转为“我要失业了！”3月15日凌晨，OpenAI正式发布多模态大模型GPT-4，它可以接受图像和文本输入。虽然在许多现实世界场景中的能力不如人类，但在各种专业和学术基准上表现出人类水平，比如在法律考试中可以打败90%的...……更多

2023-03-15 21:00:00单词,输出,性能,模型,文本,语言

谷歌 VS OpenAI：当搜索霸主和屠龙少年迈入同一条河流

...、代码等方面的表现也都高过GPT-4。而作为首个「原生多模态」模型，在一系列多模态基准测试中，对标GPT-4V，Gemini Ultra 也展现出了先进的性能。图源：谷歌新闻稿在chatGPT发布一周年之际，谷歌通过 Gemini 赶了个晚集，想要再度...……更多

2023-12-08 11:02:00霸主,河流,少年,搜索,模型,模态

刚刚，我们感受了一波最「像人」的国产AI，模型还是开源的

...择了两条路线分别开拓：一条是 GPT-4o 所代表的端到端多模态大模型的探索，一条是 o1 所代表的关于推理 Scaling Law 的探索。具体到 GPT-4o 上，OpenAI 跨文本、视觉和音频端到端地训练了一个新模型，所有输入和输出都由同一神经...……更多

2024-10-26 09:49:00一波,模型,国产,还是,语音,模型

首个多模态连续学习综述，港中文、清华、UIC联合发布

...址：https://github.com/LucyDYu/Awesome-Multimodal-Continual-Learning多模态连续学习的最新进展连续学习（CL）旨在增强机器学习模型的能力，使其能够不断从新数据中学习，而无需进行所有旧数据的重新训练。连续学习的主要挑战是灾难性遗...……更多

2024-11-14 09:46:00模态,清华,中文,联合,学习,模态

全球首个多模态地理科学大模型发布

...藏高原研究所、中国科学院自动化研究所等单位研发的多模态地理科学大模型“坤元”(Sigma Geography)正式发布。据介绍，该大模型是专注于地理科学的专业语言大模型，具备处理地理科学相关问题的专业能力，研发团队完成了地...……更多

2024-09-19 15:08:00模态,模型,地理,科学,全球,地理