科学家,训练,科学,模型,训练,基准头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

Llama 4训练已开启！Meta科学家最新采访，揭秘Llama 3.1是如何炼成的

...元导读】最近，Latent Space发布的播客节目中请来了Meta的AI科学家Thomas Scialom。他在节目中揭秘了Llama 3.1的一些研发思路，并透露了后续Llama 4的更新方向。刚刚发布的开源「巨无霸」Llama 3.1虽然自带论文，但依旧激起了广大网友强...……更多

2024-07-29 09:33:00科学家,训练,科学,模型,训练,基准

苹果开源7B模型，训练过程数据集一口气全给了，网友：很不像苹

...正的科学研究需求。而苹果这次竟然来真的！！就连NLP科学家、AutoAWQ创建者也发出惊叹：Apple发布了一个击败Mistral 7B的模型，但更棒的是他们完全开源了所有内容，包括预训练数据集也引来网友在线调侃：至于这次开源的意义...……更多

2024-07-23 09:33:00苹果,一口,模型,一口气,训练,过程

LLM数学性能暴涨168%，微软14人团队力作！合成数据2.

...在多项基准上刷新了SOTA。全世界高质量数据几乎枯竭。AI科学家们为了解决这一难题，可谓是绞尽脑汁。目前来看，合成数据或许就是大模型的未来，也成为业界公认的解决之法。就连英伟达科学家Jim Fan曾发文表示，合成数据...……更多

2024-08-20 13:44:00微软,力作,秘诀,生成,团队,性能

突发！谷歌发布史上最强大模型Gemini，打爆GPT-4

...细技术报告。消息一出，社交媒体瞬间炸了锅。英伟达AI科学家Jim Fan就第一时间转发评论：这是OpenAI王座的有力竞争者。话不多说，一起来看更多细节。谷歌史上最强大模型Gemini在LLM中的表现，也正如我们刚才所述，32个基准...……更多

2023-12-07 09:35:00突发,模型,模态,模型,基准,数据

刚刚，OpenAI震撼发布o1大模型！强化学习突破LLM推理

...多历史记录。首先，o1 就是此前 OpenAI 从山姆・奥特曼到科学家们一直在「高调宣传」的草莓大模型。它拥有真正的通用推理能力。在一系列高难基准测试中展现出了超强实力，相比 GPT-4o 有巨大提升，让大模型的上限从「没法...……更多

2024-09-13 16:42:00推理,模型,极限,突破,学习,模型

AI科学家太多，谁靠谱一试便知！普林斯顿新基准CORE-Be

【新智元导读】普林斯顿大学新发布的CORE-Bench基准测试，通过270个基于90篇跨学科科学论文的任务，可评估AI智能体在计算可重复性方面的表现，最简单任务的准确率可以达到60%，最难任务准确率仅有21%大模型的能力越来越强，...……更多

2024-09-26 13:38:00普林,普林斯顿,斯顿,准确率,基准,科学家

o1金牌团队揭秘AI超越人类惊人时刻！22分完整版视频全公开

...过人类时，AGI的未来变得更加明朗」。来自艾伦研究所的科学家Nathan Lambert对这个视频，做了一个精彩亮点的总结。一共有8点：1 强化学习加持的o1，比人类更善于发现新的CoT推理步骤2 自我批评的涌现，是o1最强有力的时刻3 让o1...……更多

2024-09-23 09:50:00整版,金牌,团队,人类,时刻,视频

Sam Altman或筹数十亿美元自造AI芯片，DeepMi

...标志着AI在数学领域推理能力的史诗级升级。3.DeepMind首席科学家Laurent Sifre或与同事Karl Tuyls离开公司创业，新公司将专注于构建新的AI模型，首轮融资可能将超过2亿欧元。1.19位OpenAI「黑手党」出走创业，融资近80亿美元！华人科...……更多

2024-01-29 09:20:00首席,科学家,芯片,创业,科学,模型

OpenAI o1模型到博士水平了?复旦教授:没有真正推理能

...时间，可以说是一条提升大模型能力的新路径。英伟达的科学家Jim Fan对此也点评称，模型不仅仅拥有训练时的Scaling law，还拥有推理层面的Scaling law，双曲线的共同增长，将突破大模型能力的提升瓶颈。同时，OpenAI表示，思维链...……更多

2024-09-13 16:44:00复旦,相关性,概率,推理,模型,教授

科学家建立新评价基准，助力评估大模型数据分析能力

...是数据分析领域的首个多代理沙盒环境，包含客户、数据科学家、管理员和 AI ChatBot 智能体，通过此研究人员可以模拟数据科学家与 ChatBot 智能体的交互。基于这一环境，他们开发了 Tapilot-Crossing 基准，它涵盖了从常规代码生成...……更多

2024-04-07 10:50:00立新,数据分析,基准,科学家,模型,评估

李彦宏称开源赶不上闭源？Meta发布最强开源模型，马斯克评价

...多基准测试中领先，并已经在考虑Llama 4和5。英伟达高级科学家Jim Fan认为，Llama 3-400B以上的版本其将成为某种“分水岭”，开源社区将能用上GPT-4级别的模型。这意味着，Meta与OpenAI将在开源闭源模型上开启更大的竞争。近日，开...……更多

2024-04-20 11:00:00马斯,马斯克,李彦,模型,评价,模型

OpenAI掀小模型血战！苹果DCLM强势登场，碾压Mist

...了Mistral-7B ，性能接近Llama 3、Gemma。根据苹果ML小组研究科学家Vaishaal Shankar（也是DCLM研发人员）的说法，这是迄今为止性能最好的「真正开源」的模型，不仅有权重和训练代码，而且是基于开放数据集DCLM-Baseline。相比模型性能...……更多

2024-07-22 09:41:00血战,强势,模型,苹果,模型,数据

GPT-4劲敌，谷歌进入高能+高产模式

...间2月15日，Alphabet与Google公司首席执行官Sundar Pichai携首席科学家Jeff Dean等众高管在X平台发布了多模态模型Gemini 1.5 Pro。这是继2月7日的Gemini 1.0 Ultra后，谷歌在多模态大模型赛道的又一力作。图源：X平台Alphabet与G……更多

2024-02-21 14:05:00劲敌,高产,模式,模型,上下文,处理

直面大模型“大成本”挑战，如何提高算力效率？

...对标700亿参数的LLaMA3开源大模型。浪潮信息人工智能首席科学家吴韶华在接受中新网记者采访时说，我们一直在想如何以更低的算力消耗，提高整个大模型的应用效果，能让企业、机构以更小的算力代价去获得更高的模型能力。...……更多

2024-06-03 14:07:00模型,效率,成本,模型,推理,成本

谷歌DeepMind推Imagen2；ChatGPT Plu

...ChatGPT Plus重新开放订阅，提供更好的用户体验。OpenAI首席科学家Ilya Sutskever入选Nature年度十大科学人物，表彰其在ChatGPT开发中的核心作用。OpenAI发布新论文，探讨用小模型监督大模型的方法，为未来超人类AI对齐工作提供支持。K...……更多

2023-12-17 18:40:00模型,硅谷,订阅,监督,模型,融资

马斯克打脸OpenAI！全球最大模型Grok-1开源

...针对任何特定应用（例如对话）进行微调。对此，英伟达科学家Jimfan评价称，这是有史以来最大的开放大型语言模型，由世界级团队训练，通过磁力链接发布。Apache 2.0。314B，专家混合（8个活跃中的2个）。就连活动参数仅（86B...……更多

2024-03-20 13:44:00马斯,马斯克,模型,全球,马斯,马斯克

“言出必行”马斯克，全球最大开源模型Grok真的来了

...目前，Grok 已经在 GitHub 上获得了 4.3k 颗 Star。英伟达高级科学家Jim Fan表示，（这是）有史以来最大的开源大模型，由世界一流的团队训练。 ……更多

2024-03-18 11:50:00马斯,马斯克,模型,全球,马斯,马斯克

人工智能训练师与数据科学家的区别

...工智能和数据科学的快速发展中，人工智能训练师和数据科学家这两个职业常常被混淆。尽管两者在工作中有许多交集，但其核心职责和专业侧重点却有所不同。今天我们将深入分析人工智能训练师与数据科学家的区别，帮助读...……更多

2024-06-29 02:26:00人工智能,科学家,人工,训练,智能,科学

4轮暴训，Llama 7B击败GPT-4！Meta等让LLM

...证明，模型的自我提升可以摆脱对人类监督的依赖。 Meta科学家Yann LeCun也转发了这篇研究，并亲自下场玩起了双关梗——Meta提出的Meta-Judge，FAIR能否实现fair？研究不重要，重要的是Meta FAIR这一波曝光率拉满了。元奖励（Meta-Rewar...……更多

2024-08-01 09:40:00三角,进化,模型,奖励,训练,迭代

开源大模型杀疯了！Mistral新模型三分之一参数卷爆Lla

...更是达到了84.0%的准确率。消息一出，Mistral AI联创兼首席科学家第一时间转发，直接cue Llama 3.1 405B的那种：Perplexity CEO Aravind Srinivas也开麦了：开源追赶闭源的趋势很明显，未来闭源模型只有头部几个有价值。英伟达科学家Jim F……更多

2024-07-26 09:39:00模型,参数,模型,基准,问题,推理