模型,智能,测试,数据,模型,推理头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

面壁智能发布开源大模型eurux-8x22b

5月3日消息，面壁智能发布开源大模型Eurux-8x22B，包括 Eurux-8x22B-NCA 与 Eurux-8x22B-KTO，主打推理能力。官方测试中，Eurux-8x22B 在 LeetCode（180道LeetCode编程真题）与 TheoremQA（IT之家注：美国大学水准的STEM……更多

2024-05-04 08:57:00模型,智能,测试,数据,模型,推理

影响英伟达根本逻辑的大争论：OpenAI改变策略意味着什么？

大模型预训练“缩放定律”定律失效？模型推理成“解药”，英伟达一家独大格局要变天？“缩放定律”指导下，AI大模型预训练目前遭遇瓶颈。据路透12日报道，硅谷主要AI实验室的新模型训练计划目前普遍进展不顺，新模型...……更多

2024-11-13 14:09:00英伟,争论,逻辑,意味,根本,策略

奥林匹克竞赛里选最聪明的AI：Claude-3.5-Sonn

...工智能实验室 (GAIR Lab) 的研究团队，主要研究方向是：大模型训练、对齐与评估。团队主页：https://plms.ai/AI技术日新月异，近来Anthropic公司最新发布的Claude-3.5-Sonnet因在知识型推理、数学推理、编程任务及视觉推理等任务上设立...……更多

2024-06-25 09:45:00奥林,奥林匹克,竞赛,模型,推理,能力

模型即服务，卓世科技MaaS平台 2.0 正式上线

引言：MaaS(ModelasaService，模型即服务)是一种将人工智能算法模型及其相关能力封装成服务，以降低人工智能技术使用门槛、控制应用建设成本、简化系统运维管理复杂度，并提升人工智能技术的综合应用效能的模式。上新了...……更多

2024-08-07 09:45:00模型,服务,平台,科技,模型,数据

面壁智能发布2B模型：适配主流手机，推理成本仅为GPT-4的

文 | 周鑫雨编辑 | 邓咏仪当大模型加速应用落地，运行成本就成为各厂商的现实考量。将模型做小，成为现实市场需求下的趋势。但模型的Scaling Law（规模定律）已指出，参数规模是决定模型性能的最关键因素。如何用更小的参...……更多

2024-02-03 16:03:00适配,推理,模型,主流,成本,智能

重磅！OpenAI o1模型还没有实现真正的逻辑推理能力

一、o1系列模型概况9月13日OpenAI宣布发布o1系列模型，o1系列模型包括o1、o1-mini以及抢先版o1-preview，o1-preview和o1-mini模型已经可以使用。OpenAI宣布，“新模型在推理能力上代表了人工智能能力的新水平，因此，计数器将重置为1”...……更多

2024-09-18 15:01:00逻辑推理,重磅,推理,逻辑,模型,能力

人类和AI在推理任务中的表现相似，Google DeepMi

...，揭示了当前人工智能（AI），特别是大型Transformer语言模型（LMs）在推理任务中的表现及其局限性。研究结果显示，尽管这些模型在处理自然语言方面表现卓越，但在复杂逻辑推理任务中，人类和语言模型都会受到语义内容合...……更多

2024-08-19 13:49:00局限性,推理,人类,任务,研究,模型

专注于推理的OpenAI“草莓”模型两周内发布？是人工智能下

...二，据知名科技商业类媒体The Information援引多位测试过该模型的人士透露，站在时代风口浪尖的“AI宠儿”OpenAI计划在未来两周内发布名为“草莓”的最新人工智能产品，作为ChatGPT所提供服务的一部分。这比两周前传闻的“秋季...……更多

2024-09-11 09:55:00人工智能,推理,草莓,人工,模型,突破

很强也很贵！OpenAI12天12场直播收官，官宣最新推理模

...网友猜测的一样，人工智能（AI）巨头OpenAI发布最新推理模型o3和o3-mini。前一天，OpenAI公司CEO山姆·奥特曼（Sam Altman）就曾发文提到三个“o”暗示了o3的到来。为何新模型跳过了o2直接命名o3？奥特曼表示是为了避免和英国电信运...……更多

2024-12-21 12:10:00推理,模型,直播,推理,模型,时间

OpenAI o1模型到博士水平了?复旦教授:没有真正推理能

...enAI放出了一个大招，预热了许久的“草莓”（Strawberry）模型终于来了。“需要耐心等待的时刻结束了。”该公司CEO山姆·奥特曼（Sam Altman）说。这就是名为 o1的新模型，这次发布包括预览版o1-preview和小尺寸版o1-mini。OpenAI官方...……更多

2024-09-13 16:44:00复旦,相关性,概率,推理,模型,教授

刚刚，OpenAI震撼发布o1大模型！强化学习突破LLM推理

大模型领域的技术发展，今天起再次「从 1 开始」了。大语言模型还能向上突破，OpenAI 再次证明了自己的实力。北京时间 9 月 13 日午夜，OpenAI 正式公开一系列全新 AI 大模型，旨在专门解决难题。这是一个重大突破，新模型可...……更多

2024-09-13 16:42:00推理,模型,极限,突破,学习,模型

超级推理模型正面对垒：谷歌版o1发布次日，OpenAI o1

...源：硬AI圣诞节前，人工智能巨头上演了一场精彩的推理模型攻防战。谷歌和OpenAI正面对垒，谷歌刚发布自家的先进推理模型挑战OpenAI的o1，第二天，OpenAI就推出了升级版的最强推理模型o3。美东时间12月20日周五，在为期12个工作...……更多

2024-12-21 09:15:00下一代,推理,正面,模型,模型,测试

GPT刚刚公开「草莓」项目：推理能力翻倍，定价200美元？

...The Information 在最新的报道中披露，两位测试过「草莓」模型的人士表示，OpenAI 可能将在接下来的两周内发布「草莓」模型，并上线 ChatGPT。但不同于 GPT-4o、GPT-4o mini 是在优化使用体验和成本，「草莓」的目标是再一次让大模型...……更多

2024-09-12 09:49:00推理,草莓,定价,能力,项目,草莓

上海AI实验室版o1已上线！数学题、Leetcode全拿下，

...、数字游戏等任务。这就是上海AI实验室版o1——强推理模型书生InternThinker，刚刚正式开放试用！新模型不仅在长思维能力方面有了很大提升，而且还能在推理过程中进行自我反思和纠正。先来一起看两个例子感受一下：比如官...……更多

2024-11-29 09:27:00数学题,上海,实验室,实验,数学,模型

北大推出全新机器人多模态大模型！面向通用和机器人场景的高效推

...为刘家铭博士，研究方向为面向开放世界的多模态具身大模型与持续性学习技术。本工作第二作者为刘梦真，研究方向为视觉基础模型与机器人操纵。指导老师为仉尚航，北京大学计算机学院研究员、博士生导师、博雅青年学者...……更多

2024-06-21 09:52:00机器,模态,人多,机器人,推理,北大

对标o1，Kimi放出了最能打的国产模型

...性能提升关键。两个月前，OpenAI o1 的诞生再次引领了大模型技术的突破。从后训练阶段入手，通过更多的强化学习、原生的思维链和更长的推理时间，o1 将大模型的能力又往前推了一步。这段时间，国内大模型初创公司月之暗...……更多

2024-11-19 09:50:00模型,国产,模型,推理,能力,数学

OpenAI直播最后一天放出“王炸”：下一代推理模型o3亮相

...享直播活动的最后一天！周五，OpenAI发布了下一代的推理模型o3，这是今年早些时候发布的o1推理模型的升级版本。更准确地说，o3是一个模型系列——就像o1一样，同时有o3和o3-mini两个版本，后者是一款更小的精简版模型，针对...……更多

2024-12-21 17:02:00下一代,推理,模型,直播,模型,推理

神仙打架！谷歌新款大模型Gemini 和GPT-4谁能笑到最

...美国时间12月6日早间，谷歌发布了外界期待许久的大语言模型Gemini，在发布会现场，谷歌将Gemini的多项能力直接与OpenAI的GPT-4进行对比，雄心勃勃地宣布进入“Gemini时代”，更加剧了两大头部科技公司在大语言模型领域竞争的白...……更多

2023-12-07 16:15:00神仙,模型,观察,科技,模型,任务

智能体首达Kaggle Grandmaster,华为结构化推

前些时日，AI 大模型开始掌握操作计算机的能力，但整体而言，它们与物理世界互动的能力仍处于早期阶段。为了提高 LLM 在复杂的现实世界中的表现，研究者们提出了各种提示策略来提升大模型的推理和规划能力，比如思维链...……更多

2024-11-09 09:53:00华为,结构化,推理,思维,结构,智能

AI 的“心智理论”难题：Meta ExploreToM 探

...作开发了 ExploreToM 框架，旨在更有效地评估和训练大语言模型（LLM）的心智理论（Theory of Mind，ToM）能力。心智理论心智理论（Theory of Mind，ToM）是人类社会智能的基础之一，能让我们能够理解他人的想法、意图和信念。这种认...……更多

2024-12-21 09:27:00之路,心智,难题,突破,理论,模型

CPU,正在被AI时代抛弃？

...对话可以通过语音识别技术被录入到病例系统中，随后大模型AI推理技术辅助进行智能总结和诊断，医生们撰写病例的效率显著提高。AI推理的应用不仅节省了时间，也保护了患者隐私；在法院、律所等业务场景中，律师通过大...……更多

2024-07-11 16:45:00正在,时代,模型,推理,英特,英特尔

Claude 3.5深夜觉醒，学会模仿人类用电脑！编程干翻o

...，进化后的Claude 3.5 Sonnet一举击溃OpenAI o1，堪称最强推理模型。它在各个方面得到了全面显著的提升，尤其是业界领先的编码能力。而Claude 3.5 Haiku与上一代最强Claude 3 Opus性能相当，成本、速度与上一代Haiku相近。甚至，Claude现在...……更多

2024-10-23 09:55:00人类,编程,模型,能力,开发,任务

大语言模型逻辑推理“很糟糕”

...6月4日报道，以人工智能的旗舰产品GPT-4为代表的大语言模型在逻辑测试中的推理表现很糟糕：它们犯下前后不一致的错误，而且推理过程往往是荒谬的。近日发表在《皇家学会开放科学》杂志上的一项研究表明，大语言模型所...……更多

2024-06-12 18:15:00逻辑推理,推理,逻辑,模型,语言,模型

马斯克官宣Grok-2测试版！xAI将继续拥抱开源路线吗？

继旗下xAI公司宣布正式开源大模型Grok-1后，特斯拉CEO马斯克再次在大模型市场扔下一颗重磅炸弹。当地时间8月11日晚，马斯克在X平台上透露人工智能模型Grok-2测试版将在不久后发布。事实上，马斯克在7月份就在X平台上确认，Gr...……更多

2024-08-13 09:50:00马斯,马斯克,测试版,路线,测试,模型

AI新时代揭幕！会“思考解题逻辑”的OpenAI推理大模型登

...，AI时代迎来崭新的起点——能够进行通用复杂推理的大模型终于走到台前。OpenAI在官网发布公告称，开始向全体订阅用户开始推送OpenAI o1预览模型——也就是此前被广泛期待的“草莓”大模型。OpenAI表示，对于复杂推理任务而...……更多

2024-09-13 13:34:00新时代,推理,逻辑,模型,模型,问题

整合长期记忆，AI实现自我进化，探索大模型这一可能性

...。而这一切背后的机制是进化（evolution）。到了现今的大模型时代，强大的基础模型已经展现出了强大的智能水平，能完成多种多样的任务。但它们也有个缺点，训练之后就基本定型了，难以随着用户的使用而演进。但毫无疑问...……更多

2024-10-29 09:55:00进化,可能性,模型,整合,记忆,模型

ICML2024演讲爆火!Meta朱泽园揭秘大模型内心世界:

...稿邮箱：liyazhou@jiqizhixin.com；zhaoyunfeng@jiqizhixin.com大语言模型 (LLM) 是如何解数学题的？是通过模板记忆，还是真的学会了推理思维？模型的心算过程是怎样的？能学会怎样的推理技能？与人类相同，还是超越了人类？只学一种类...……更多

2024-08-06 09:27:00推理,模型,内心,人类,世界,模型

马斯克突然发布Grok-2！数学推理能力突出，攻克“9.9与

...北京时间8月14日下午，xAI正式官宣Grok-2和Grok-2 mini两款AI模型（测试版）。xAI直接揭秘，前一阵子出现在Lmsys大模型竞技场上的神秘模型“sus-column-r”就是Grok-2。在xAI给出的大模型排行榜中，Grok-2的评分优于GPT-4o-mini和Claud……更多

2024-08-15 09:56:00马斯,马斯克,推理,难题,大小,能力