科学家,训练,科学,模型,训练,基准头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

Llama 4训练已开启！Meta科学家最新采访，揭秘Llama 3.1是如何炼成的

...元导读】最近，Latent Space发布的播客节目中请来了Meta的AI科学家Thomas Scialom。他在节目中揭秘了Llama 3.1的一些研发思路，并透露了后续Llama 4的更新方向。刚刚发布的开源「巨无霸」Llama 3.1虽然自带论文，但依旧激起了广大网友强...……更多

2024-07-29 09:33:00科学家,训练,科学,模型,训练,基准

苹果开源7B模型，训练过程数据集一口气全给了，网友：很不像苹

...正的科学研究需求。而苹果这次竟然来真的！！就连NLP科学家、AutoAWQ创建者也发出惊叹：Apple发布了一个击败Mistral 7B的模型，但更棒的是他们完全开源了所有内容，包括预训练数据集也引来网友在线调侃：至于这次开源的意义...……更多

2024-07-23 09:33:00苹果,一口,模型,一口气,训练,过程

LLM数学性能暴涨168%，微软14人团队力作！合成数据2.

...在多项基准上刷新了SOTA。全世界高质量数据几乎枯竭。AI科学家们为了解决这一难题，可谓是绞尽脑汁。目前来看，合成数据或许就是大模型的未来，也成为业界公认的解决之法。就连英伟达科学家Jim Fan曾发文表示，合成数据...……更多

2024-08-20 13:44:00微软,力作,秘诀,生成,团队,性能

突发！谷歌发布史上最强大模型Gemini，打爆GPT-4

...细技术报告。消息一出，社交媒体瞬间炸了锅。英伟达AI科学家Jim Fan就第一时间转发评论：这是OpenAI王座的有力竞争者。话不多说，一起来看更多细节。谷歌史上最强大模型Gemini在LLM中的表现，也正如我们刚才所述，32个基准...……更多

2023-12-07 09:35:00突发,模型,模态,模型,基准,数据

刚刚，OpenAI震撼发布o1大模型！强化学习突破LLM推理

...多历史记录。首先，o1 就是此前 OpenAI 从山姆・奥特曼到科学家们一直在「高调宣传」的草莓大模型。它拥有真正的通用推理能力。在一系列高难基准测试中展现出了超强实力，相比 GPT-4o 有巨大提升，让大模型的上限从「没法...……更多

2024-09-13 16:42:00推理,模型,极限,突破,学习,模型

o1金牌团队揭秘AI超越人类惊人时刻！22分完整版视频全公开

...过人类时，AGI的未来变得更加明朗」。来自艾伦研究所的科学家Nathan Lambert对这个视频，做了一个精彩亮点的总结。一共有8点：1 强化学习加持的o1，比人类更善于发现新的CoT推理步骤2 自我批评的涌现，是o1最强有力的时刻3 让o1...……更多

2024-09-23 09:50:00整版,金牌,团队,人类,时刻,视频

Sam Altman或筹数十亿美元自造AI芯片，DeepMi

...标志着AI在数学领域推理能力的史诗级升级。3.DeepMind首席科学家Laurent Sifre或与同事Karl Tuyls离开公司创业，新公司将专注于构建新的AI模型，首轮融资可能将超过2亿欧元。1.19位OpenAI「黑手党」出走创业，融资近80亿美元！华人科...……更多

2024-01-29 09:20:00首席,科学家,芯片,创业,科学,模型

OpenAI o1模型到博士水平了?复旦教授:没有真正推理能

...时间，可以说是一条提升大模型能力的新路径。英伟达的科学家Jim Fan对此也点评称，模型不仅仅拥有训练时的Scaling law，还拥有推理层面的Scaling law，双曲线的共同增长，将突破大模型能力的提升瓶颈。同时，OpenAI表示，思维链...……更多

2024-09-13 16:44:00复旦,相关性,概率,推理,模型,教授

科学家建立新评价基准，助力评估大模型数据分析能力

...是数据分析领域的首个多代理沙盒环境，包含客户、数据科学家、管理员和 AI ChatBot 智能体，通过此研究人员可以模拟数据科学家与 ChatBot 智能体的交互。基于这一环境，他们开发了 Tapilot-Crossing 基准，它涵盖了从常规代码生成...……更多

2024-04-07 10:50:00立新,数据分析,基准,科学家,模型,评估

李彦宏称开源赶不上闭源？Meta发布最强开源模型，马斯克评价

...多基准测试中领先，并已经在考虑Llama 4和5。英伟达高级科学家Jim Fan认为，Llama 3-400B以上的版本其将成为某种“分水岭”，开源社区将能用上GPT-4级别的模型。这意味着，Meta与OpenAI将在开源闭源模型上开启更大的竞争。近日，开...……更多

2024-04-20 11:00:00马斯,马斯克,李彦,模型,评价,模型

OpenAI掀小模型血战！苹果DCLM强势登场，碾压Mist

...了Mistral-7B ，性能接近Llama 3、Gemma。根据苹果ML小组研究科学家Vaishaal Shankar（也是DCLM研发人员）的说法，这是迄今为止性能最好的「真正开源」的模型，不仅有权重和训练代码，而且是基于开放数据集DCLM-Baseline。相比模型性能...……更多

2024-07-22 09:41:00血战,强势,模型,苹果,模型,数据

GPT-4劲敌，谷歌进入高能+高产模式

...间2月15日，Alphabet与Google公司首席执行官Sundar Pichai携首席科学家Jeff Dean等众高管在X平台发布了多模态模型Gemini 1.5 Pro。这是继2月7日的Gemini 1.0 Ultra后，谷歌在多模态大模型赛道的又一力作。图源：X平台Alphabet与G……更多

2024-02-21 14:05:00劲敌,高产,模式,模型,上下文,处理

直面大模型“大成本”挑战，如何提高算力效率？

...对标700亿参数的LLaMA3开源大模型。浪潮信息人工智能首席科学家吴韶华在接受中新网记者采访时说，我们一直在想如何以更低的算力消耗，提高整个大模型的应用效果，能让企业、机构以更小的算力代价去获得更高的模型能力。...……更多

2024-06-03 14:07:00模型,效率,成本,模型,推理,成本

谷歌DeepMind推Imagen2；ChatGPT Plu

...ChatGPT Plus重新开放订阅，提供更好的用户体验。OpenAI首席科学家Ilya Sutskever入选Nature年度十大科学人物，表彰其在ChatGPT开发中的核心作用。OpenAI发布新论文，探讨用小模型监督大模型的方法，为未来超人类AI对齐工作提供支持。K...……更多

2023-12-17 18:40:00模型,硅谷,订阅,监督,模型,融资

马斯克打脸OpenAI！全球最大模型Grok-1开源

...针对任何特定应用（例如对话）进行微调。对此，英伟达科学家Jimfan评价称，这是有史以来最大的开放大型语言模型，由世界级团队训练，通过磁力链接发布。Apache 2.0。314B，专家混合（8个活跃中的2个）。就连活动参数仅（86B...……更多

2024-03-20 13:44:00马斯,马斯克,模型,全球,马斯,马斯克

“言出必行”马斯克，全球最大开源模型Grok真的来了

...目前，Grok 已经在 GitHub 上获得了 4.3k 颗 Star。英伟达高级科学家Jim Fan表示，（这是）有史以来最大的开源大模型，由世界一流的团队训练。 ……更多

2024-03-18 11:50:00马斯,马斯克,模型,全球,马斯,马斯克

人工智能训练师与数据科学家的区别

...工智能和数据科学的快速发展中，人工智能训练师和数据科学家这两个职业常常被混淆。尽管两者在工作中有许多交集，但其核心职责和专业侧重点却有所不同。今天我们将深入分析人工智能训练师与数据科学家的区别，帮助读...……更多

2024-06-29 02:26:00人工智能,科学家,人工,训练,智能,科学

4轮暴训，Llama 7B击败GPT-4！Meta等让LLM

...证明，模型的自我提升可以摆脱对人类监督的依赖。 Meta科学家Yann LeCun也转发了这篇研究，并亲自下场玩起了双关梗——Meta提出的Meta-Judge，FAIR能否实现fair？研究不重要，重要的是Meta FAIR这一波曝光率拉满了。元奖励（Meta-Rewar...……更多

2024-08-01 09:40:00三角,进化,模型,奖励,训练,迭代

开源大模型杀疯了！Mistral新模型三分之一参数卷爆Lla

...更是达到了84.0%的准确率。消息一出，Mistral AI联创兼首席科学家第一时间转发，直接cue Llama 3.1 405B的那种：Perplexity CEO Aravind Srinivas也开麦了：开源追赶闭源的趋势很明显，未来闭源模型只有头部几个有价值。英伟达科学家Jim F……更多

2024-07-26 09:39:00模型,参数,模型,基准,问题,推理

谷歌推出其最先进AI模型Gemini，希望击败GPT-4

...LLM）训练工作负载的速度提高了两倍。”谷歌DeepMind首席科学家杰夫·迪恩（Jeff Dean）写道，“对机器学习框架（JAX、PyTorch、TensorFlow）和编排工具的强大支持使我们能够在v5p上更高效地扩展。通过第二代SparseCores，我们还看到嵌...……更多

2023-12-07 10:21:00最先,模型,比斯,模型,哈萨,人工智能

AGI一日要闻：台积电预测2040年GPU芯片性能提升100

...高1000倍在IEEE文章中，台积电董事长刘德音及台积电首席科学家H.-S Philip Wong讲述了台积电是如何达成1万亿晶体管芯片的目标。文章指出，从1997年击败国际象棋人类冠军的IBM深蓝超级计算机，到2023年爆火的ChatGPT，再过15年，人工...……更多

2024-03-31 04:00:00估值,美金,要闻,芯片,高达,性能

挑战Scaling Law，Meta发布移动端350M小模型

...。作者简介本文的通讯作者Zechun Liu是Meta Reality Labs的研究科学家。她本科毕业于复旦大学，博士毕业于香港科技大学，加入Meta前曾有两年多的时间在CMU担任访问学者。Zechun的研究兴趣是深度学习在现实场景中的应用，例如资源...……更多

2024-07-23 09:39:00模型,性能,移动,模型,参数,架构

全球首篇！调研近400篇文献，鹏城实验室&中大深度解析具身智

...智能研究所汇聚了数十名智能科学与机器人领域顶尖青年科学家，依托鹏城云脑、中国算力网等自主可控 AI 基础设施，致力于打造多智能体协同与仿真训练平台、云端协同具身多模态大模型等通用基础平台，赋能工业互联网、...……更多

2024-07-29 09:39:00中大,文献,调研,深度,实验室,实验

GPT-4o的识图能力有多牛？四大维度深度体验

...计算力。”针对GPT-4o强大的多模态能力，英伟达高级研究科学家JimFan发表长文表示，从技术角度来看，这需要对标记化和架构进行一些新的研究，但总体上是一个数据和系统优化问题。在JimFan看来，GPT-4o很可能是GPT-5的一个早期...……更多

2024-05-19 14:21:00维度,深度,能力,体验,模型,训练

Claude 3大模型引起学界关注，业内人士：或将开启科研新

破解量子算法、破译古老语言、用几个小时给出科学家花费数月才能得到的研究方案……自 AI 初创公司 Anthropic 于太平洋时间 2024 年 3 月 4 日发布 Claude 3 大模型以来，全世界网友正在对其进行广泛测试，并得出科研领域正在被...……更多

2024-03-12 10:59:00范式,学界,业内人士,模型,业内,科研

对话百图生科首席AI科学家宋乐博士：“xTrimo”生命科学

...造？为了解答上述问题，3月3日下午百图生科CTO、首席 AI 科学家宋乐博士与36氪等多家媒体进行了交流。百图生科CTO、首席 AI 科学家宋乐博士据介绍，百图生科推出的“xTrimo”（Cross-modal Transformer Representation of Interactome……更多

2023-03-15 09:26:00科学,生命科学,首席,科学家,药物,模型