模型,参数,模型,基准,问题,推理头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

北大等出品，首个多模态版o1开源模型来了——代号LLaVA-o1，基于Llama-3.2-Vision模型打造，超越传统思维链提示，实现自主“慢思考”推理。在多模态推理基准测试中，LLaVA-o1超越其基础模型8.9%，并在性能上超越了一众开闭源模型...……更多

2024-11-20 09:42:00模态,推理,北大,视觉,模型,推理

Scaling Law瓶颈，Cursor编程为什么这么强？新

...者，该项目负责开发用于 AI 编程的 StarCoder 系列大型语言模型。论文标题：Planning In Natural Language Improves LLM Search For Code Generation 论文地址：https://arxiv……更多

2024-09-12 09:47:00瓶颈,武器,秘密,编程,研究,模型

「世界开源新王」跌落神坛？重测跑分暴跌实锤造假，2人团队光速

...后，开发者们甚至还发现，Reflection可能就是个「套壳」模型，而且还是连套三家的那种（Claude/GPT/Llama）。这下子，Reddit和X等平台上，立刻掀起了质疑的声浪。左右滑动查看为此，Shumer承诺将和Glaive创始人Sahil Chaudhary一起调查...……更多

2024-10-08 09:47:00神坛,光速,团队,世界,模型,基准

阿里云发布通义千问2.5，性能赶超GPT-4 Turbo

通义大模型发布一周年之际，迎来重要的历史性时刻。5月9日，阿里云正式发布通义千问2.5，模型性能全面赶超GPT-4 Turbo，成为地表最强中文大模型。同时，通义千问1100亿参数开源模型在多个基准测评收获最佳成绩，超越Llama-3-7...……更多

2024-05-09 12:00:00通义,阿里,性能,通义,模型,阿里

菲尔兹奖得主亲测GPT-4o，经典过河难题破解失败！最强Cl

...最近，菲尔兹奖得主Timothy Gowers分享了实测GPT-4o的过程，模型在最简单的题目上竟然做错了，甚至网友们发现，就连Claude 3.5也无法幸免。在经典的「狼-山羊-卷心菜」过河问题上，如今所有的LLM都失败了！几天前，菲尔兹奖得主...……更多

2024-07-01 08:58:00菲尔,得主,难题,经典,农夫,模型

开源大模型新的里程碑！Llama 3.1 模型准时发布

...KER科技7月24日消息，今日凌晨，Meta官方正式发布了Llama3.1模型。本次Llama3.1模型共有三个版本，分别是8B、70B和405B。从基准测试结果来看，超大杯Llama3.1405B与OpenAI的GPT-4o和Claude3.5Sonnet在多个项目上能够媲美。在GSM8K任……更多

2024-07-24 12:13:00模型,里程,里程碑,准时,模型,伯格

字节开源全栈AI编程基准，不小心曝光豆包代码大模型

豆包代码大模型，不小心给曝光了！在字节开源的代码大模型评估基准FullStack Bench里面，出现了此前字节未披露过的Doubao-Coder。不过目前还只是Preview版，还并没有上线。它在多种编程语言上的性能表现如下，可以看到在闭源模...……更多

2024-12-06 09:50:00豆包,基准,字节,模型,编程,代码

史上最快AI芯片「Sohu」，速度10倍于B200，哈佛辍学

...辑：泽南、杜伟生成式 AI 推理性价比是 GPU 的 140 倍。大模型时代，全球都缺算力，买铲子的英伟达市值被炒上了天。现在，终于有一家公司带着自己的 AI 芯片来叫板了。今天凌晨，科技圈迎来了一个重要新闻。美国芯片创业公...……更多

2024-06-27 09:24:00辍学生,哈佛,芯片,速度,芯片,模型

很强也很贵！OpenAI12天12场直播收官，官宣最新推理模

...网友猜测的一样，人工智能（AI）巨头OpenAI发布最新推理模型o3和o3-mini。前一天，OpenAI公司CEO山姆·奥特曼（Sam Altman）就曾发文提到三个“o”暗示了o3的到来。为何新模型跳过了o2直接命名o3？奥特曼表示是为了避免和英国电信运...……更多

2024-12-21 12:10:00推理,模型,直播,推理,模型,时间

晶圆级AI芯片WSE-3性能公布：80亿参数模型上每秒生成1

...上一代WSE-2的两倍，可用于训练业内一些最大的人工智能模型。在近日的Hot Chips 2024大会上，Cerebras Systems详细介绍了这款芯片在AI推理方面的性能。根据官方资料显示，WSE-3依然是采用了一整张12英寸晶圆来制作，基于台积电5nm制...……更多

2024-09-02 13:36:00晶圆,芯片,生成,模型,性能,参数

马斯克的AI模型登场！叛逆风格独树一帜数据优势成最大卖点

...，社交媒体平台X的AI团队发布公告，正式推出Grok大语言模型。（来源：xAI）Grok一词，是英国作家道格拉斯·亚当斯在知名科幻小说《异乡异客》造出来的概念。《牛津英语词典》对这个词的解释包括“直观地或通过同理心理解...……更多

2023-11-06 09:08:00马斯,马斯克,模型,时间,社交,团队

成本不到150元！26分钟训出个推理模型媲美o1和R1

成本不到150元，训练出一个媲美DeepSeek-R1和OpenAI o1的推理模型？！这不是洋葱新闻，而是AI教母李飞飞、斯坦福大学、华盛顿大学、艾伦人工智能实验室等携手推出的最新杰作：s1。在数学和编程能力的评测集上，s1的表现比肩Dee...……更多

2025-02-07 15:14:00推理,模型,成本,模型,团队,推理

检索总结能力超博士后，首个大模型科研智能体PaperQA2开

...最近一段时间，有关 AI 科学家的研究越来越多。大语言模型（LLM）有望帮助科学家检索、综合和总结文献，提升人们的工作效率，但在研究工作中使用仍然有很多限制。对于科研来说，事实性至关重要，而大模型会产生幻觉，...……更多

2024-09-13 13:33:00博士后,模型,科研,博士,检索,能力

给小学数学题加句废话，OpenAI o1就翻车了，苹果论文质

苹果新论文：AI 大模型可能不会推理。AI 大模型（LLM）真的像我们理解的那样能「思考」或「推理」吗？最近，苹果的一篇论文探讨了这个问题，并且给出了一个倾向于「否」的答案。相关帖子被很多人围观。这篇题为「GSM-Symb...……更多

2024-10-14 09:55:00数学题,推理,废话,苹果,数学,小学

马斯克的AI大模型登场

...下社交媒体平台X的AI团队发布公告，正式推出Grok大语言模型。一直以来，马斯克把AI描述为“历史上最具颠覆性的力量”。他是这项技术的狂热粉丝，但又充满警惕。他称，这样的结果就是，“终有一天，人们将不再需要工作”...……更多

2023-11-06 09:22:00马斯,马斯克,模型,人工智能,人工,智能

OpenAI掀小模型血战！苹果DCLM强势登场，碾压Mist

【新智元导读】小模型时代来了？OpenAI带着GPT-4o mini首次入局小模型战场，Mistral AI、HuggingFace本周接连发布了小模型。如今，苹果也发布了70亿参数小模型DCLM，性能碾压Mistral-7B。小模型的战场，打起来了！继GPT-4o mini、Mistral Ne……更多

2024-07-22 09:41:00血战,强势,模型,苹果,模型,数据

小米开源首个推理大模型Xiaomi MiMo：7B参数就超越

...官方今天正式宣布，开源首个为推理（Reasoning）而生的大模型——Xiaomi MiMo。据介绍，Xiaomi MiMo在数学推理（AIME 24-25）和代码竞赛（LiveCodeBench v5）公开测评集上，MiMo仅用7B的参数规模，超越了OpenAI的闭源推理模型o1-mini和……更多

2025-04-30 10:36:00小米,推理,模型,参数,训练,推理

DeepSeek的能力，到底从哪里来？

...ixabay撰文 | 张天祁● ● ●今年年初，DeepSeek发布DeepSeek-R1模型，引发全球的关注。在公开评测中，它的综合能力逼近当时的顶尖大模型，尤其在逻辑推理和数学题上展现出强劲性能，而且它的成本要远低于作比较的其他大模型。...……更多

2025-05-27 10:23:00里来,能力,模型,训练,推理,能力