模型,参数,模型,基准,问题,推理头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

首届空天信息技术大会开幕，发布全球首个百亿级遥感解译基础模型

...合鹏城实验室，正式发布自主研制的百亿级遥感解译基础模型——“空天·灵眸”3.0版，这是迄今为止全球首个百亿参数级空天一体遥感解译基础模型。近年来，我国遥感数据获取能力不断增强，已进入遥感大数据时代，人工智...……更多

2024-09-23 11:53:00空天,遥感,首届,模型,大会,基础

Mamba作者新作：将Llama3蒸馏成混合线性 RNN

...功的关键是注意力机制。注意力机制让基于 Transformer 的模型关注与输入序列相关的部分，实现了更好的上下文理解。然而，注意力机制的缺点是计算开销大，会随输入规模而二次增长，Transformer 也因此难以处理非常长的文本。...……更多

2024-09-03 09:59:00线性,新作,混合,作者,模型,线性

阿维塔07 Ultra版将在10月下旬开始生产

...竞争关系。近日，苹果公司推出了300亿参数的多模态AI大模型MM1.5，该版本是在前代MM1的架构基础上发展而来的。该模型继续遵循数据驱动的训练原则，着重探究在不同训练周期中混合各类数据对模型性能产生的影响，相关模型...……更多

2024-10-15 02:11:00阿维,生产,阿维,模型,别为,苹果公司

谷歌再出大招，发布最新开源大模型Gemma，笔记本上即可运行

...领域再次展现了其强大的研发实力，通过开源其最新的AI模型Gemma，向业界展示了其在轻量级、高性能AI技术方面的最新进展。这一轻量级模型系列号称是当前同等规模中最先进的，超越了之前表现最出色的Mistral7B模型，在数学和...……更多

2024-02-23 09:18:00模型,运行,笔记本,笔记,模型,人工智能

OpenAI o1模型到博士水平了?复旦教授:没有真正推理能

...enAI放出了一个大招，预热了许久的“草莓”（Strawberry）模型终于来了。“需要耐心等待的时刻结束了。”该公司CEO山姆·奥特曼（Sam Altman）说。这就是名为 o1的新模型，这次发布包括预览版o1-preview和小尺寸版o1-mini。OpenAI官方...……更多

2024-09-13 16:44:00复旦,相关性,概率,推理,模型,教授

小模型越级挑战14倍参数大模型，谷歌Test-Time端新的

不必增加模型参数，计算资源相同，小模型性能超过比它大14倍的模型！谷歌DeepMind最新研究引发热议，甚至有人表示这可能就是OpenAI即将发布的新模型草莓所用的方法。研究团队探究了在大模型推理时进行计算优化的方法，根...……更多

2024-09-12 09:58:00模型,参数,模型,训练,测试,时计

背水一战狙击GPT-4，谷歌最强大模型Gemini终发布，听

最有希望超越GPT-4的模型来了——美国硅谷时间12月6日上午，谷歌CEO劈柴正式宣布，“大杀器”Gemini 1.0，正式上线。Gemini是一个原生多模态大模型，谷歌在今年5月的I/O大会宣布开始研发后，Gemini的传说不断：将谷歌大脑和DeepMin...……更多

2023-12-07 08:18:00全能,选手,模型,焦点,分析,模型

又慢又贵？OpenAI推理模型“草莓”来了，GPT-5还有多

...12日，人工智能（AI）巨头OpenAI发布代号“草莓”的AI推理模型OpenAI o1系列，包括OpenAI o1-preview以及小版本的o1-mini。据OpenAI介绍， o1会花更多时间思考问题，然后再做出反应，就像人一样。通过训练学会了完善自己的思考过程，尝...……更多

2024-09-13 15:28:00多远,推理,草莓,模型,模型,思维

openai发布多语言大规模多任务语言理解

...言大规模多任务语言理解（MMMLU）数据集。背景随着语言模型日益强大，评估其在不同语言、认知和文化背景下的能力已成为当务之急。OpenAI决定推出MMMLU数据集，通过提供强大的多语言和多任务数据集，来评估大型语言模型（LL...……更多

2024-09-24 22:07:00多语,大规,大规模,任务,语言,语言

谷歌开源系模型第二代免费开放！27B媲美Llama3 70B

西风发自凹非寺量子位 | 公众号 QbitAI谷歌开源模型Gemma 2开放了！虽然前段时间Google I/O大会上，Gemma 2开源的消息就已经被放出，但谷歌还留了个小惊喜——除27B模型外，还有一个更轻的9B版本。DeepMind创始人哈萨比斯表示，27B...……更多

2024-07-01 09:21:00二代,模型,开放,模型,性能,网友

奥林匹克竞赛里选最聪明的AI：Claude-3.5-Sonn

...工智能实验室 (GAIR Lab) 的研究团队，主要研究方向是：大模型训练、对齐与评估。团队主页：https://plms.ai/AI技术日新月异，近来Anthropic公司最新发布的Claude-3.5-Sonnet因在知识型推理、数学推理、编程任务及视觉推理等任务上设立...……更多

2024-06-25 09:45:00奥林,奥林匹克,竞赛,模型,推理,能力

昆仑万维发布开源13B高质量商用大模型领先Llama2和B

10月30日，昆仑万维宣布开源百亿级大语言模型「天工」Skywork-13B系列，并配套开源了600GB、150B Tokens的超大高质量开源中文数据集。昆仑万维「天工」Skywork-13B系列目前包括130亿参数的两大模型：Skywork-13B-Base模型、Skywork-13B-Mat……更多

2023-10-30 15:35:00万维,昆仑,商用,高质量,模型,领先

GPT-4劲敌，谷歌进入高能+高产模式

...争相拼臂力秀肌肉。Gemini 1.5 Pro的横空出世，将多模态大模型的标准提到了一个新高度。一、极致性能背后的模型架构当地时间2月15日，Alphabet与Google公司首席执行官Sundar Pichai携首席科学家Jeff Dean等众高管在X平台发布了多模态模...……更多

2024-02-21 14:05:00劲敌,高产,模式,模型,上下文,处理

英伟达开源NVLM 1.0屠榜多模态！纯文本性能不降反升

【新智元导读】NVLM 1.0系列多模态大型语言模型在视觉语言任务上达到了与GPT-4o和其他开源模型相媲美的水平，其在纯文本性能甚至超过了LLM骨干模型，特别是在文本数学和编码基准测试中，平均准确率提高了4.3个百分点。文本...……更多

2024-09-24 13:36:00英伟,模态,文本,性能,模态,模型

GPU训Llama 3.1疯狂崩溃，竟有大厂用CPU服务器跑

【新智元导读】是时候用CPU通用服务器跑千亿参数大模型了！马斯克19天建成由10万块H100串联的世界最大超算，已全力投入Grok 3的训练中。与此同时，外媒爆料称，OpenAI和微软联手打造的下一个超算集群，将由10万块GB200组成。...……更多

2024-08-02 09:47:00大厂,模型,参数,疯狂,服务器,服务

科学家建立新评价基准，助力评估大模型数据分析能力

...术背景人员不可或缺的工具。以 GPT-4 为代表的大型语言模型，它们已经能够理解自然语言查询，并能生成相应的代码或分析，让自动数据分析变得更加接近现实。例如，Devin 的成功，激发了人们对基于大语言模型的自动数据分...……更多

2024-04-07 10:50:00立新,数据分析,基准,科学家,模型,评估

手机市场深陷泥沼，厂商如何破冰？

...题，在这一关键节点，厂商们亟需新的解题思路。3、大模型被认为是下一突破点，但仍没合适的落地方式。自2023年初大模型成为互联网发展技术趋势的关键词，手机厂商关于大模型的探讨就一直没有停止。从逻辑上讲，手机厂...……更多

2024-01-09 10:18:00泥沼,厂商,手机,市场,手机,模型

面壁智能发布2B模型：适配主流手机，推理成本仅为GPT-4的

文 | 周鑫雨编辑 | 邓咏仪当大模型加速应用落地，运行成本就成为各厂商的现实考量。将模型做小，成为现实市场需求下的趋势。但模型的Scaling Law（规模定律）已指出，参数规模是决定模型性能的最关键因素。如何用更小的参...……更多

2024-02-03 16:03:00适配,推理,模型,主流,成本,智能

迎战GPT-4V！谷歌PaLI-3视觉语言模型问世，更小、更

...况，这一举动引起了业界的广泛关注。然而，在视觉语言模型的角逐中，谷歌也不甘示弱。近日，Google Research、Google DeepMind 和 Google Cloud 共同推出了一个更小、更快、更强大的视觉语言模型（VLM）——PaLI-3，该模型与相似的体...……更多

2023-10-17 16:31:00更快,模型,视觉,语言,训练,模型

87.8%准确率赶超GPT-4o登顶！谷歌DeepMind发

【新智元导读】谷歌DeepMind推出LLM自动评估模型FLAMe系列，FLAMe-RM-24B模型在RewardBench上表现卓越，以87.8%准确率领先GPT-4o。大语言模型都卷起来了，模型越做越大，token越来越多，输出越来越长。那么问题来了，如何有效地评估大...……更多

2024-08-05 09:37:00准确率,模型,评估,评估,模型,数据

PyTorch官宣：告别CUDA，GPU推理迎来Triton

...0%的Triton内核Pytorch最近发表了一篇技术博客，他们以两个模型——Llama3-8B和IBM的Granite-8B Code为例，100%使用Triton内核实现了FP16推理。Granite-8B Code是由IBM开发的一种仅限解码器的代码模型，专为代码生成任务设计。仓库地址：……更多

2024-09-07 09:48:00新时代,推理,内核,矩阵,乘法,英伟