模型,参数,模型,基准,问题,推理头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

openai发布多语言大规模多任务语言理解

...言大规模多任务语言理解（MMMLU）数据集。背景随着语言模型日益强大，评估其在不同语言、认知和文化背景下的能力已成为当务之急。OpenAI决定推出MMMLU数据集，通过提供强大的多语言和多任务数据集，来评估大型语言模型（LL...……更多

2024-09-24 22:07:00多语,大规,大规模,任务,语言,语言

谷歌开源系模型第二代免费开放！27B媲美Llama3 70B

西风发自凹非寺量子位 | 公众号 QbitAI谷歌开源模型Gemma 2开放了！虽然前段时间Google I/O大会上，Gemma 2开源的消息就已经被放出，但谷歌还留了个小惊喜——除27B模型外，还有一个更轻的9B版本。DeepMind创始人哈萨比斯表示，27B...……更多

2024-07-01 09:21:00二代,模型,开放,模型,性能,网友

奥林匹克竞赛里选最聪明的AI：Claude-3.5-Sonn

...工智能实验室 (GAIR Lab) 的研究团队，主要研究方向是：大模型训练、对齐与评估。团队主页：https://plms.ai/AI技术日新月异，近来Anthropic公司最新发布的Claude-3.5-Sonnet因在知识型推理、数学推理、编程任务及视觉推理等任务上设立...……更多

2024-06-25 09:45:00奥林,奥林匹克,竞赛,模型,推理,能力

大模型步入推理Scaling时代,SambaNova如何挑战

...越人类专家。在性能跃升之外，更重要的是，它揭示了大模型进化范式的转变：通过更多的强化学习（训练时计算）和更多的推理（Test-Time 计算），模型可以获得更强大的性能。这又一次让我们想起 Richard Sutton 在《The Bitter Lesso...……更多

2024-10-21 09:55:00英伟,霸主,推理,模型,地位,时代

昆仑万维发布开源13B高质量商用大模型领先Llama2和B

10月30日，昆仑万维宣布开源百亿级大语言模型「天工」Skywork-13B系列，并配套开源了600GB、150B Tokens的超大高质量开源中文数据集。昆仑万维「天工」Skywork-13B系列目前包括130亿参数的两大模型：Skywork-13B-Base模型、Skywork-13B-Mat……更多

2023-10-30 15:35:00万维,昆仑,商用,高质量,模型,领先

微软开源爆火1bit大模型推理框架！千亿参数模型量化后单CP

微软开源1bit大模型推理框架！现在1000亿参数大模型量化后单CPU可跑，速度可达每秒5-7个token。就是今年爆火论文The Era of 1-bit LLMs的官方代码实现，开源不到一周GitHub已揽获7.9k Star。传统大模型参数以16位浮点数（如FP16或BF16）形...……更多

2024-10-23 12:05:00模型,微软,推理,框架,参数,模型

英伟达开源NVLM 1.0屠榜多模态！纯文本性能不降反升

【新智元导读】NVLM 1.0系列多模态大型语言模型在视觉语言任务上达到了与GPT-4o和其他开源模型相媲美的水平，其在纯文本性能甚至超过了LLM骨干模型，特别是在文本数学和编码基准测试中，平均准确率提高了4.3个百分点。文本...……更多

2024-09-24 13:36:00英伟,模态,文本,性能,模态,模型

GPT-4劲敌，谷歌进入高能+高产模式

...争相拼臂力秀肌肉。Gemini 1.5 Pro的横空出世，将多模态大模型的标准提到了一个新高度。一、极致性能背后的模型架构当地时间2月15日，Alphabet与Google公司首席执行官Sundar Pichai携首席科学家Jeff Dean等众高管在X平台发布了多模态模...……更多

2024-02-21 14:05:00劲敌,高产,模式,模型,上下文,处理

GPU训Llama 3.1疯狂崩溃，竟有大厂用CPU服务器跑

【新智元导读】是时候用CPU通用服务器跑千亿参数大模型了！马斯克19天建成由10万块H100串联的世界最大超算，已全力投入Grok 3的训练中。与此同时，外媒爆料称，OpenAI和微软联手打造的下一个超算集群，将由10万块GB200组成。...……更多

2024-08-02 09:47:00大厂,模型,参数,疯狂,服务器,服务

科学家建立新评价基准，助力评估大模型数据分析能力

...术背景人员不可或缺的工具。以 GPT-4 为代表的大型语言模型，它们已经能够理解自然语言查询，并能生成相应的代码或分析，让自动数据分析变得更加接近现实。例如，Devin 的成功，激发了人们对基于大语言模型的自动数据分...……更多

2024-04-07 10:50:00立新,数据分析,基准,科学家,模型,评估

手机市场深陷泥沼，厂商如何破冰？

...题，在这一关键节点，厂商们亟需新的解题思路。3、大模型被认为是下一突破点，但仍没合适的落地方式。自2023年初大模型成为互联网发展技术趋势的关键词，手机厂商关于大模型的探讨就一直没有停止。从逻辑上讲，手机厂...……更多

2024-01-09 10:18:00泥沼,厂商,手机,市场,手机,模型

面壁智能发布2B模型：适配主流手机，推理成本仅为GPT-4的

文 | 周鑫雨编辑 | 邓咏仪当大模型加速应用落地，运行成本就成为各厂商的现实考量。将模型做小，成为现实市场需求下的趋势。但模型的Scaling Law（规模定律）已指出，参数规模是决定模型性能的最关键因素。如何用更小的参...……更多

2024-02-03 16:03:00适配,推理,模型,主流,成本,智能

迎战GPT-4V！谷歌PaLI-3视觉语言模型问世，更小、更

...况，这一举动引起了业界的广泛关注。然而，在视觉语言模型的角逐中，谷歌也不甘示弱。近日，Google Research、Google DeepMind 和 Google Cloud 共同推出了一个更小、更快、更强大的视觉语言模型（VLM）——PaLI-3，该模型与相似的体...……更多

2023-10-17 16:31:00更快,模型,视觉,语言,训练,模型

87.8%准确率赶超GPT-4o登顶！谷歌DeepMind发

【新智元导读】谷歌DeepMind推出LLM自动评估模型FLAMe系列，FLAMe-RM-24B模型在RewardBench上表现卓越，以87.8%准确率领先GPT-4o。大语言模型都卷起来了，模型越做越大，token越来越多，输出越来越长。那么问题来了，如何有效地评估大...……更多

2024-08-05 09:37:00准确率,模型,评估,评估,模型,数据

PyTorch官宣：告别CUDA，GPU推理迎来Triton

...0%的Triton内核Pytorch最近发表了一篇技术博客，他们以两个模型——Llama3-8B和IBM的Granite-8B Code为例，100%使用Triton内核实现了FP16推理。Granite-8B Code是由IBM开发的一种仅限解码器的代码模型，专为代码生成任务设计。仓库地址：……更多

2024-09-07 09:48:00新时代,推理,内核,矩阵,乘法,英伟

思维链让大模型推理更准确？谷歌早于OpenAI押中o1模型核

几天前 OpenAI 新模型 o1 的发布，再次引发了人们对大语言模型的高度关注和讨论。而 o1 发布之所以如此“轰动”，是因为它与此前大模型由语言驱动用于聊天或语音助手有本质的不同。其不仅进入到复杂的领域，还表现出超强...……更多

2024-09-20 13:33:00模型,推理,思维,原理,核心,模型

3天把Llama训成Mamba，性能不降，推理更快！

...尔、普林斯顿等机构的研究人员成功将Llama提炼成了Mamba模型，并且设计了新的推测解码算法，加速了模型的推理。先来看一张其乐融融的图片（一眼AI）：右边的小羊驼代表Llama，而左边的蛇（Mamba）也是我们的老熟人了。至于...……更多

2024-09-06 10:01:00推理,更快,性能,模型,输出,训练

媲美OpenAI事实性基准，这个中文评测集让o1-previ

...和顶尖的技术人才，成立未来生活实验室。实验室聚焦大模型、多模态等 AI 技术方向，致力于打造大模型相关基础算法、模型能力和各类 AI Native 应用，引领 AI 在生活消费领域的技术创新。如何解决模型生成幻觉一直是人工智...……更多

2024-11-21 09:43:00事实性,基准,中文,评测,事实,模型

谷歌DeepMind推Imagen2；ChatGPT Plu

...览本周AI领域涌现多项重要进展。Runway宣布开展通用世界模型研发，旨在通过研究通用世界模型改进其视频生成系统，使其更好地模拟现实世界的互动。谷歌Deepmind推出Imagen 2，一款高质量、逼真的人工智能图像生成器。Mistral AI...……更多

2023-12-17 18:40:00模型,硅谷,订阅,监督,模型,融资

AI落地千行百业，存储痛点凸显，浪潮信息如何助力AI向实？

AI时代，存储不仅是数据的栖息之地，更是AI模型训练、落地过程中的坚实底座。在AI开启的存储行业新周期中，众多厂商已将带宽等性能指标卷至新的高度。然而，这种追求似乎将AI这一复杂应用场景简单地“存储化”了。实际...……更多

2024-11-08 09:46:00浪潮信息,痛点,浪潮,百业,落地,存储

GPT刚刚公开「草莓」项目：推理能力翻倍，定价200美元？

...The Information 在最新的报道中披露，两位测试过「草莓」模型的人士表示，OpenAI 可能将在接下来的两周内发布「草莓」模型，并上线 ChatGPT。但不同于 GPT-4o、GPT-4o mini 是在优化使用体验和成本，「草莓」的目标是再一次让大模型...……更多

2024-09-12 09:49:00推理,草莓,定价,能力,项目,草莓

百川智能发布baichuan3稳定语言模型

1月29日，百川智能发布超千亿参数的大语言模型Baichuan3。在多个权威通用能力评测如CMMLU、GAOKAO和AGI-Eval中，Baichuan3都展现了出色的能力，尤其在中文任务上更是超越了GPT-4。而在数学和代码专项评测如MATH、HumanEval和MBPP中同样表...……更多

2024-01-29 19:57:00百川,模型,语言,智能,模型,百川

阿里云发布通义千问2.5，性能全面赶超GPT-4 Turbo

...里云正式发布通义千问2.5，阿里云方面表示，通义千问2.5模型性能全面赶超GPT-4Turbo。同时，通义千问最新开源的1100亿参数模型在多个基准测评中收获最佳成绩，超越Meta的Llama-3-70B。相比通义千问2.1版本，通义千问2.5的理解能力...……更多

2024-05-09 11:39:00通义,阿里,性能,通义,阿里,模型

科学家提出情景学习新范式，让学霸大模型向学弱大模型输送能力

近日，上海算法创新研究院大模型团队的研究员李志宇和同事提出一种情景学习新范式：SLEICL（基于强模型增强的情景学习，Strong LLM Enhanced ICL），能更好地加速小模型的学术研究和产业落地。借助这一方法可以大幅提升小模型...……更多

2024-03-01 09:36:00模型,范式,科学家,情景,能力,科学

谷歌大模型推理范式，主要分为两个阶段

...出最新研究“自我发现”（Self-Discover），重新定义了大模型推理范式。与已成行业标准的思维链（CoT）相比，新方法不仅让模型在面对复杂任务时表现更佳，还把同等效果下的推理成本压缩至1/40。核心策略其实很简单：千人千...……更多

2024-02-10 21:09:00范式,推理,模型,阶段,两个,模型

LeCun 的世界模型初步实现！基于预训练视觉特征，零样本规

...Yann LeCun 批评 LLM 的推文之一相反，他更注重所谓的世界模型（World Model），也就是根据世界数据拟合的一个动态模型。比如驴，正是有了这样的世界模型，它们才能找到更省力的负重登山方法。近日，LeCun 团队发布了他们在世界...……更多

2024-11-19 09:48:00样本,模型,特征,视觉,训练,规划

让OpenAI o1逆天的慢思考，360两月前就做出来了？周

【新智元导读】o1大火背后，最关键的技术是CoT。模型通过一步一步推理，恰恰是「慢思考」的核心要义。而这一观点，其实这家国内大厂早就率先实现了。OpenAI的理念，居然被国内公司抢先践行了？比起OpenAI，这家公司的idea...……更多

2024-09-21 09:50:00周鸿,前瞻,应用,模型,推理,协作

谷歌和微软两位“印度老乡”CEO，正面硬刚

12月6日夜间，谷歌发布了其最新一代的AI大模型Gemini。谷歌的印度籍CEO Sundar Pichai亲自为这项发布站台，在公开信中将Gemini描述为：“我们迄今为止最强大、最通用的模型，它在许多领先的基准测试中都展现出了最先进的性能。...……更多

2023-12-08 16:29:00印度,微软,老乡,正面,模型,微软

非Transformer架构站起来了!首个纯无注意力大模型,

Mamba 架构的大模型又一次向 Transformer 发起了挑战。Mamba 架构模型这次终于要「站」起来了？自 2023 年 12 月首次推出以来，Mamba 便成为了 Transformer 的强有力竞争对手。此后，采用 Mamba 架构的模型不断出现，比如 Mistral 发布的首...……更多

2024-08-14 09:39:00力大,架构,模型,模型,架构,训练