科学家,训练,科学,模型,训练,基准头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

Llama 4训练已开启！Meta科学家最新采访，揭秘Llama 3.1是如何炼成的

...元导读】最近，Latent Space发布的播客节目中请来了Meta的AI科学家Thomas Scialom。他在节目中揭秘了Llama 3.1的一些研发思路，并透露了后续Llama 4的更新方向。刚刚发布的开源「巨无霸」Llama 3.1虽然自带论文，但依旧激起了广大网友强...……更多

2024-07-29 09:33:00科学家,训练,科学,模型,训练,基准

苹果开源7B模型，训练过程数据集一口气全给了，网友：很不像苹

...正的科学研究需求。而苹果这次竟然来真的！！就连NLP科学家、AutoAWQ创建者也发出惊叹：Apple发布了一个击败Mistral 7B的模型，但更棒的是他们完全开源了所有内容，包括预训练数据集也引来网友在线调侃：至于这次开源的意义...……更多

2024-07-23 09:33:00苹果,一口,模型,一口气,训练,过程

「学术版ChatGPT」登场！Ai2打造科研效率神器Open

...构发布了最新的OpenScholar系统，使用检索增强的方法帮助科学家进行文献搜索和文献综述工作，而且做到了数据、代码、模型权重的全方位开源。LLM集成到搜索引擎中，可以说是当下AI产品的一个热门落地方向。前有Perplexity横空...……更多

2024-11-27 13:33:00神器,文献,效率,科研,学术,模型

LLM数学性能暴涨168%，微软14人团队力作！合成数据2.

...在多项基准上刷新了SOTA。全世界高质量数据几乎枯竭。AI科学家们为了解决这一难题，可谓是绞尽脑汁。目前来看，合成数据或许就是大模型的未来，也成为业界公认的解决之法。就连英伟达科学家Jim Fan曾发文表示，合成数据...……更多

2024-08-20 13:44:00微软,力作,秘诀,生成,团队,性能

突发！谷歌发布史上最强大模型Gemini，打爆GPT-4

...细技术报告。消息一出，社交媒体瞬间炸了锅。英伟达AI科学家Jim Fan就第一时间转发评论：这是OpenAI王座的有力竞争者。话不多说，一起来看更多细节。谷歌史上最强大模型Gemini在LLM中的表现，也正如我们刚才所述，32个基准...……更多

2023-12-07 09:35:00突发,模型,模态,模型,基准,数据

清华UCSD提出全新微调方法，8B小模型媲美GPT-4o！科

...工具和依赖内部知识之间进行判断——就像训练一位年轻科学家如何在相信自己计算的同时知道何时咨询专业设备——可能比单纯地卷AI计算能力更为重要。微调方法简介微调方法由两部分组成：World Knowledge Distillation（WKD）和Too...……更多

2024-12-03 13:34:00正确率,清华,模型,全新,科学,方法

刚刚，OpenAI震撼发布o1大模型！强化学习突破LLM推理

...多历史记录。首先，o1 就是此前 OpenAI 从山姆・奥特曼到科学家们一直在「高调宣传」的草莓大模型。它拥有真正的通用推理能力。在一系列高难基准测试中展现出了超强实力，相比 GPT-4o 有巨大提升，让大模型的上限从「没法...……更多

2024-09-13 16:42:00推理,模型,极限,突破,学习,模型

科研党狂喜！AI预测神经学研究结论超人类专家水平 | Nat

LLM可以比科学家更准确地预测神经学的研究结果！最近，来自伦敦大学学院、剑桥大学、牛津大学等机构的团队发布了一个神经学专用基准BrainBench，登上了Nature子刊《自然人类行为（Nature human behavior）》。结果显示，经过该基...……更多

2024-12-02 09:51:00结论,神经,科研,人类,水平,专家

AI科学家太多，谁靠谱一试便知！普林斯顿新基准CORE-Be

【新智元导读】普林斯顿大学新发布的CORE-Bench基准测试，通过270个基于90篇跨学科科学论文的任务，可评估AI智能体在计算可重复性方面的表现，最简单任务的准确率可以达到60%，最难任务准确率仅有21%大模型的能力越来越强，...……更多

2024-09-26 13:38:00普林,普林斯顿,斯顿,准确率,基准,科学家

o1金牌团队揭秘AI超越人类惊人时刻！22分完整版视频全公开

...过人类时，AGI的未来变得更加明朗」。来自艾伦研究所的科学家Nathan Lambert对这个视频，做了一个精彩亮点的总结。一共有8点：1 强化学习加持的o1，比人类更善于发现新的CoT推理步骤2 自我批评的涌现，是o1最强有力的时刻3 让o1...……更多

2024-09-23 09:50:00整版,金牌,团队,人类,时刻,视频

很强也很贵！OpenAI12天12场直播收官，官宣最新推理模

...，相当于位列第175名的人类选手，甚至超过了OpenAI的首席科学家（2655分）；在数学竞赛AIME 2024和专家级科学问题基准测试GPQA Diamond中成绩都得到明显提升；而在令很多AI和数学家都束手无策的最难数学和推理挑战FrontierMath中，o3...……更多

2024-12-21 12:10:00推理,模型,直播,推理,模型,时间

这才是真开源模型！公开后训练一切，性能超越Llama 3.1

...），还在技术报告中公布了详细的后训练方法。Ai2 研究科学家 Nathan Lambert（论文一作）的推文这份 70 多页的技术报告可以说诚意满满，非常值得详细阅读： Tülu 3 发布后，社区反响热烈，甚至有用户表示测试后发现其表现比 GP...……更多

2024-11-26 09:44:00模型,性能,训练,模型,训练,数据

智能体首达Kaggle Grandmaster,华为结构化推

...个例子，在 Kaggle 数据科学竞赛中（如图 1 所示），数据科学家需要遵循一个结构化的工作流程：收集、清理、预处理和标准化数据，创建数据加载器以实现高效管理，生成关键评估指标，以及开发自定义模型。然后，这些见解...……更多

2024-11-09 09:53:00华为,结构化,推理,思维,结构,智能

Sam Altman或筹数十亿美元自造AI芯片，DeepMi

...标志着AI在数学领域推理能力的史诗级升级。3.DeepMind首席科学家Laurent Sifre或与同事Karl Tuyls离开公司创业，新公司将专注于构建新的AI模型，首轮融资可能将超过2亿欧元。1.19位OpenAI「黑手党」出走创业，融资近80亿美元！华人科...……更多

2024-01-29 09:20:00首席,科学家,芯片,创业,科学,模型

下载次数破39万！CMU、Meta联合发布VQAScore文

...Pengchuan Zhang是Meta AI（原Facebook AI研究院）的人工智能研究科学家，曾在微软研究院担任高级研究科学家。他的研究领域主要集中在深度学习、计算机视觉和多模态模型等方向，曾发表多项具有深远影响力的成果，例如AttnGAN、OSCAR...……更多

2024-11-07 09:53:00文生,次数,联合,方案,模型,文生

OpenAI o1模型到博士水平了?复旦教授:没有真正推理能

...时间，可以说是一条提升大模型能力的新路径。英伟达的科学家Jim Fan对此也点评称，模型不仅仅拥有训练时的Scaling law，还拥有推理层面的Scaling law，双曲线的共同增长，将突破大模型能力的提升瓶颈。同时，OpenAI表示，思维链...……更多

2024-09-13 16:44:00复旦,相关性,概率,推理,模型,教授

科学家建立新评价基准，助力评估大模型数据分析能力

...是数据分析领域的首个多代理沙盒环境，包含客户、数据科学家、管理员和 AI ChatBot 智能体，通过此研究人员可以模拟数据科学家与 ChatBot 智能体的交互。基于这一环境，他们开发了 Tapilot-Crossing 基准，它涵盖了从常规代码生成...……更多

2024-04-07 10:50:00立新,数据分析,基准,科学家,模型,评估

李彦宏称开源赶不上闭源？Meta发布最强开源模型，马斯克评价

...多基准测试中领先，并已经在考虑Llama 4和5。英伟达高级科学家Jim Fan认为，Llama 3-400B以上的版本其将成为某种“分水岭”，开源社区将能用上GPT-4级别的模型。这意味着，Meta与OpenAI将在开源闭源模型上开启更大的竞争。近日，开...……更多

2024-04-20 11:00:00马斯,马斯克,李彦,模型,评价,模型

OpenAI掀小模型血战！苹果DCLM强势登场，碾压Mist

...了Mistral-7B ，性能接近Llama 3、Gemma。根据苹果ML小组研究科学家Vaishaal Shankar（也是DCLM研发人员）的说法，这是迄今为止性能最好的「真正开源」的模型，不仅有权重和训练代码，而且是基于开放数据集DCLM-Baseline。相比模型性能...……更多

2024-07-22 09:41:00血战,强势,模型,苹果,模型,数据

GPT-4劲敌，谷歌进入高能+高产模式

...间2月15日，Alphabet与Google公司首席执行官Sundar Pichai携首席科学家Jeff Dean等众高管在X平台发布了多模态模型Gemini 1.5 Pro。这是继2月7日的Gemini 1.0 Ultra后，谷歌在多模态大模型赛道的又一力作。图源：X平台Alphabet与G……更多

2024-02-21 14:05:00劲敌,高产,模式,模型,上下文,处理

被DeepSeek带火的知识蒸馏开山之作曾被拒：诺奖得主坐

...之父，如今已是诺奖得主。Oriol Vinyals，Google DeepMind研究科学家，参与开发的明星项目包括TensorFlow、AlphaFold、Seq2Seq、AlphaStar等。Jeff Dean，Google DeepMind首席科学家、从2018年开始全面领导谷歌AI。大……更多

2025-02-07 17:44:00得主,知识,模型,目标,知识,训练

直面大模型“大成本”挑战，如何提高算力效率？

...对标700亿参数的LLaMA3开源大模型。浪潮信息人工智能首席科学家吴韶华在接受中新网记者采访时说，我们一直在想如何以更低的算力消耗，提高整个大模型的应用效果，能让企业、机构以更小的算力代价去获得更高的模型能力。...……更多

2024-06-03 14:07:00模型,效率,成本,模型,推理,成本