突发,模型,模态,模型,基准,数据头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

GPT-4o的识图能力有多牛？四大维度深度体验

...硅谷新贵如MistralAI、Anthropic在那之后都争相发布了竞品大模型，但似乎至今还未有第二款大模型达到与GPT-4一般横扫科技圈的力量——直到GPT-4o的诞生。当地时间5月13日，OpenAI在万众期待中推出了名为GPT-4o的新一代旗舰AI模型。...……更多

2024-05-19 14:21:00维度,深度,能力,体验,模型,训练

阿里国际发布最新开源多模态模型Ovis，多模态能力再升级

...力再次升级！今天，阿里国际AI团队发布了一款多模态大模型Ovis，在图像理解任务上不断突破极限，多种具体的子类任务中均达到了SOTA（最新技术）水平。多模态大模型能够处理和理解多种不同类型的数据输入，例如文本、图...……更多

2024-09-20 13:35:00模态,阿里,模型,能力,升级,国际

GPT-4o：“更像人”的人工智能模型

...基准测试，GPT-4o的性能对比GPT-4 Turbo处于优势，对比其他模型更是大幅领先。GPT-4o可通过呼吸来辨别情绪，它甚至可以指导使用者怎么深吸慢呼平复心情，在分析用户喘气声后进行呼吸指导。 GPT-4o响应时间越来越短。它可以在...……更多

2024-05-20 02:59:00人工智能,人工,模型,智能,人工智能,情绪

腾讯开源最大MoE大语言模型！3D大模型同时支持文/图生成，

智东西11月5日报道，今日，腾讯宣布开源MoE大语言模型混元Large、腾讯混元3D生成模型Hunyuan3D-1.0正式开源，并全面披露腾讯混元的全系列多尺寸模型、C端应用、B端应用版图。腾讯称混元Large是业界参数规模最大、效果最好的开...……更多

2024-11-06 09:41:00模型,腾讯,全家,生成,同时,语言

Sam Altman或筹数十亿美元自造AI芯片，DeepMi

...G42和软银集团。2.能力达到奥数金牌级，DeepMind几何推理模型登上Nature，这个叫AlphaGeometry的模型在国际数学奥林匹克（IMO）的30道几何题中做出了25道，这一成就标志着AI在数学领域推理能力的史诗级升级。3.DeepMind首席科学家Lauren...……更多

2024-01-29 09:20:00首席,科学家,芯片,创业,科学,模型

谷歌史上最强大模型！Gemini 2.0正式发布

...今天凌晨，谷歌正式发布了为新智能体时代构建的下一代模型——Gemini 2.0。这是谷歌迄今为止功能最强的AI模型，带来了更强的性能、更多的多模态表现（如原生图像和音频输出）和新的原生工具应用。Gemini 2.0关键基准测试中...……更多

2024-12-12 07:15:00模型,音频,模态,自然语言,文生,多语

国产模型指令跟随全球第一！来自LeCun亲推的最难作弊LLM

What？？？一直低调行事的国内初创公司，旗下模型悄悄地跃升成国内第一、世界第五（仅排在o1系列和Claude 3.5之后）！而且是前十名中的唯一一家国产公司。（该榜上国产第二名是阿里开源的qwen2.5-72b-instruct，总榜第13）。而且...……更多

2024-11-22 09:54:00指令,模型,国产,全球,模型,模态

科学家打造多模态模型，7B和1.3B小模型均开源，可部署手机

在最近一项研究中，DeepSeek-AI 团队针对多模态大模型展开了深入探索。选择这一研究方向，背后有着多重考量。最初，该团队围绕是否聚焦于多模态生成、多模态理解、或是两者的统一框架进行了广泛讨论。基于对通用人工智...……更多

2024-04-10 10:25:00模型,模态,终端,科学家,科学,手机

零成本突破多模态大模型瓶颈！多所美国顶尖高校华人团队，联合推

新智元报道编辑：LRST【新智元导读】现有多模态大模型在对齐不同模态时面临幻觉和细粒度感知不足等问题，传统偏好学习方法依赖可能不适配的外源数据，存在成本和质量问题。Calibrated Self-Rewarding（CSR）框架通过自我增强学...……更多

2024-06-21 09:21:00模态,美国,瓶颈,顶尖,模型,团队

对比学习滥用隐私数据！中科院等发布「多步误差最小化」方法 |

...模态不可学习样本，以保护个人数据不被多模态对比学习模型滥用。通过优化图像噪声和文本触发器，MEM方法有效地误导模型，降低其对隐私数据的学习能力，并在不同模型间展现出强大的可迁移性。多模态对比学习（如CLIP）...……更多

2024-08-02 09:55:00误差,中科院,隐私,方法,数据,学习

“杜甫很忙”梗图变视频！智谱AI生成视频模型上线

7月26日，智谱AI CEO张鹏在智谱Open Day上宣布，AI生成视频模型清影（Ying）正式上线智谱清言。南都记者关注到，应用清影生成6秒视频只需要30秒的时间，该功能不仅支持文生视频、图生视频，也支持视频生成视频（以下是利用网...……更多

2024-07-27 14:18:00视频,杜甫,生成,模型,模型,模态

AI界新晋王者被曝抄袭、作弊、做假，脸都丢光了

...超越作者 | 南风窗记者朱秋雨编辑 | 向由排版 | 菲菲AI大模型大战在2023年爆发后，AI创业者不免感到有些心灰意冷——不管自己的团队如何加班加点，好让产品迭代面世，全世界大部分的注意力似乎都停留在一家公司，OpenAI。后...……更多

2023-12-20 00:10:00王者,抄袭,模型,万物,公司,数据

2B多模态新SOTA！华科、华南理工发布Mini-Monke

...【新智元导读】Mini-Monkey 是一个轻量级的多模态大型语言模型，通过采用多尺度自适应切分策略（MSAC）和尺度压缩机制（SCM），有效缓解了传统图像切分策略带来的锯齿效应，提升了模型在高分辨率图像处理和文档理解任务的...……更多

2024-08-13 09:42:00模态,华南,专治,后遗症,理工,分辨率

击败Gemini-1.5-Pro、GPT-4V，从容大模型多

机器之心报道机器之心编辑部近日，云从科技从容大模型在综合评测权威平台 OpenCompass 的多模态评测领域中取得重大进展。最新评测结果显示，云从科技的从容大模型在该体系中的平均得分为 65.5，这一成绩使得从容大模型跻...……更多

2024-06-29 09:36:00模态,从容,模型,能力,全球,模态

全球AI大事记·疯狂三月盘点：9万亿AIGC时代即将到来｜钛

刚刚过去的2024年3月，OpenAI最强人工智能（AI）大模型GPT-4发布了一周年，对于生成式 AI 的热度只增不减。过去一个月内，OpenAI、谷歌、微软、英伟达、阿里等多家国内外大科技公司均发布多个关于 AI 的重要消息，动作不断，全...……更多

2024-04-03 15:00:00大事记,盘点,大事,疯狂,媒体,时代

小模型正在成为AI界的新宠

大模型的发展已经进入了万亿级参数时代。DeepMind 联合创始人穆斯塔法・苏莱曼（Mustafa Suleyman）预测，仅在未来三年内，大模型规模以惊人的速度继续扩张，将增长 1000 倍。一方面，模型的参数量与其能够处理和学习的复杂性...……更多

2024-06-24 09:42:00新宠,模型,正在,模型,参数,训练

深数所发布500个行业多模态算料集

...“深数所”）发布了500个垂直行业多模态算料集，按照大模型应用的不同阶段（训练、推理、调优），有的放矢地提供数据源，让国产大模型厂商“寻数有路”。此次深数所发布的首批500个人工智能大模型高质量训练数据集，由...……更多

2024-04-13 01:58:00模态,行业,数据,模型,模态,人工智能

马斯克的AI大模型登场

...下社交媒体平台X的AI团队发布公告，正式推出Grok大语言模型。一直以来，马斯克把AI描述为“历史上最具颠覆性的力量”。他是这项技术的狂热粉丝，但又充满警惕。他称，这样的结果就是，“终有一天，人们将不再需要工作”...……更多

2023-11-06 09:22:00马斯,马斯克,模型,人工智能,人工,智能

别只盯着ChatGPT版Her,多模态AI拟人互动上,国内玩

...利用少量有标签和大量无标签数据视频数据来训练自己的模型，并对模型在无标签数据集上的表现和泛化能力进行评估。该赛道获胜的关键在于通过改进半监督学习技术来提高模型情感识别性能，比如预测情绪类别的准确率。自...……更多

2024-08-01 09:34:00模态,拟人,玩家,模态,情感,模型

大模型「标王」硬气：不做Sora ，要帮更多企业做出Sora

...u 文生视频一句话，召唤出 3D 世界。哇嘶嗒（VAST）文生3D模型一个创意、一键生成，短短五分钟，一段品牌宣传片便能完美呈现。手机，也能来个「即圈即搜」。贵阳市民早高峰拥堵时长缩短了半小时，大模型功不可没。在百...……更多

2024-12-11 09:52:00标王,模型,更多,企业,模态,模型

中国也有Sora同款训练架构公司，清华班底，智谱也投了 |

...雨编辑 | 邓咏仪全球首家发布Sora同款底层架构的清华系模型公司，近期完成了新一轮融资。投资名单中，也出现了大模型独角兽智谱AI的身影。36氪获悉，近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融资由启明...……更多

2024-03-14 15:12:00清华,班底,中国,架构,训练,公司

“具身智能小镇”来了！机器人逛超市买菜满街跑，来自上海AI

...，餐厅、超市、办公室、家庭等89个不同场景类别。由大模型驱动的NPC，可以在这个世界里和机器人对话交互。这样一来，各种机器人能在虚拟小镇里完成各种行为模拟，也就是最近流行的Sim2Real路线，能大幅降低具身智能现实...……更多

2024-07-23 09:33:00满街,上海,机器人,小镇,机器,超市

拓宽行业应用场景多模态大模型加速通用AI进程

...性等方面具备惊人效果……近日，OpenAI发布的文生视频大模型Sora迅速引发人们关注。业内分析认为，该项新产品或将促使大模型厂商加大对多模态大模型的研发投入，并进一步推动AGI（通用人工智能）进程。一直以来，视频领...……更多

2024-02-26 08:58:00模态,行业应用,模型,进程,场景,应用

大模型新趋势之MoE：现状、挑战及研究方向

2024年，全球主流企业加快推出MoE大模型，1-5月发布千亿以上大模型均采用MoE优化架构，且数量超过近三年总和。MoE大模型架构凭借平衡大模型训推成本和计算效率等优势，更适合处理大规模数据和复杂任务，已成谷歌、OpenAI、...……更多

2024-11-04 16:00:00研究方向,模型,现状,方向,趋势,研究

微软开源 OmniParser 纯视觉 GUI 智能体：让

...络环境中的适用性。而包括 GPT-4V 在内的现有的视觉语言模型（VLMs），并不擅长解读复杂 GUI 元素，导致动作定位不准确。项目简介微软为了克服这些障碍，推出了 OmniParser，是一种纯视觉基础的工具，旨在填补当前屏幕解析技...……更多

2024-10-30 09:47:00微软,截图,屏幕,视觉,智能,模型

银河通用王鹤：用三维视觉小模型+基础大模型实现具身智能

...但很可能永远都达不到；有专家认为，大家对大数据和大模型关注度太高了，现在的人形机器人应该更多关注机器人本体。而关于具身智能，身为北京大学计算机学院前沿计算研究中心（CFCS）助理教授、博士生导师，同时又是...……更多

2024-04-15 10:13:00模型,三维,银河,视觉,智能,基础

谷歌 Gemini 1.5 AI 模型再进化：成本更低、性能

...日（9 月 24 日）发布博文，报道谷歌升级旗下 Gemini 1.5 AI 模型，推出了 Gemini-1.5-Pro-002和 Gemini-1.5-Flash-002，相比较此前版本成本更低、性能更强、响应更快。成本更低谷歌下调了 token 输入和输出费用，Gemini-1.5-Pro……更多

2024-09-26 09:51:00进化,更快,模型,成本,性能,模型