模型,性能,调查,模型,任务,长上头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

OpenAI开启调查：GPT-4o及4o-mini模型性能下

...据报道，OpenAI发布事故报告指出，当前遭遇GPT-4o和4o-mini模型性能下降问题，目前正在进行调查，并将尽快发布最新消息。近期，科研人员创新性地推出了一项名为LONGPROC的基准测试工具，该工具专为评估模型在处理长上下文中的...……更多

2025-01-20 15:59:00模型,性能,调查,模型,任务,长上

无一大模型及格！北大/通研院提出超难基准，评估长文本理解生

在长文本理解能力这块，竟然没有一个大模型及格！北大联合北京通用人工智能研究院提出了一个新基准数据集：LooGLE，专门用于测试和评估大语言模型（LLMs）长上下文理解能力。该数据集既能够评估LLMs对长文本的处理和检索...……更多

2024-08-08 09:39:00基准,北大,生成,模型,文本,评估

长上下文能力只是吹牛？最强GPT-4o正确率仅55.8%，开

...今的LLM已经号称能够支持百万级别的上下文长度，这对于模型的能力来说，意义重大。但近日的两项独立研究表明，它们可能只是在吹牛，LLM实际上并不能理解这么长的内容。大数字一向吸引眼球。千亿参数、万卡集群，——还...……更多

2024-07-23 17:12:00正确率,长上,下文,模型,只是,能力

支持1024帧、准确率近100％，英伟达「LongVILA」

现在，长上下文视觉语言模型（VLM）有了新的全栈解决方案 ——LongVILA，它集系统、模型训练与数据集开发于一体。现阶段，将模型的多模态理解与长上下文能力相结合是非常重要的，支持更多模态的基础模型可以接受更灵活...……更多

2024-08-22 09:51:00英伟,准确率,支持,视频,序列,训练

微软连发3款Phi-3.5模型：128K上下文，首用MoE架

...东西8月21日消息，今天，微软一口气甩出3款超强轻量级模型！微软本次发布的轻量级模型系列名为Phi-3.5，适合在内存和算力受限的环境中运行，均支持128k上下文长度。Phi-3.5-mini-instruct主要面向基础快速推理任务，Phi-3.5-MoE-instru...……更多

2024-08-22 09:49:00上下文,微软,架构,模型,上下,性能

腾讯推出 Hunyuan-Large 开源大模型

IT之家11月5日消息，腾讯今日宣布推出Hunyuan-Large大模型，官方表示这是目前业界已经开源的基于Transformer的最大MoE模型，拥有3890亿总参数（389B）和520亿激活参数（52B）。腾讯今日在HuggingFace开源了Hunyuan-A52B-Pretrain、Hun……更多

2024-11-05 18:56:00腾讯,模型,模型,长上,腾讯,训练

梁文锋杨植麟论文撞题，“注意力机制”对大模型意味着什么

2月18日，在大洋彼岸的马斯克秀出最新大模型Grok 3当天，国产AI公司深度求索（DeepSeek）最新一篇论文引发关注，创始人梁文锋在署名之列，并2月16日提交到预印本平台arxiv。这篇论文的核心关于NSA(Natively Sparse Attention，原生稀疏...……更多

2025-02-19 18:43:00文锋,对大,注意力,模型,意味,机制

北大林宙辰团队全新混合序列建模架构MixCon：性能远超Ma

...领域中，序列建模是一项至关重要的任务。然而，现有的模型在捕捉长程依赖关系和高效建模序列方面仍面临诸多挑战。因此，北京大学林宙辰、徐鑫提出了一种全新混合序列建模架构 ——MixCon，它为解决这些难题带来了创新...……更多

2024-10-16 13:34:00序列,架构,北大,混合,团队,性能

不是RNN的锅！清华团队深入分析长上下文建模中的状态崩溃，M

【新智元导读】RNN模型在长上下文中表现不佳？近日，来自清华的研究团队对此进行了深入的实验分析，结果表明：不是RNN的锅。与Transformer相比，RNN模型的一大优势是应对长序列的能力。比如Mamba，内部状态大小始终保持不变...……更多

2024-11-28 12:03:00长上,清华,下文,团队,状态,作者

王小川公布最新大模型，号称全球最长上下文，是GPT-4的14

搜狗创始人、百川智能创始人兼CEO 王小川国内大模型技术竞争加速，继讯飞星火、智谱推出最新产品之后，百川也迎来了新的大模型成果。钛媒体获悉，10月30日上午，王小川创立的 AI 大模型公司“百川智能”宣布，推出Baichuan...……更多

2023-10-30 15:02:00王小川,王小,上下文,模型,上下,焦点

87.8%准确率赶超GPT-4o登顶！谷歌DeepMind发

【新智元导读】谷歌DeepMind推出LLM自动评估模型FLAMe系列，FLAMe-RM-24B模型在RewardBench上表现卓越，以87.8%准确率领先GPT-4o。大语言模型都卷起来了，模型越做越大，token越来越多，输出越来越长。那么问题来了，如何有效地评估大...……更多

2024-08-05 09:37:00准确率,模型,评估,评估,模型,数据

真香！智谱大模型，有了首个免费的API

大模型API，正式进入Flash时代。最近一段时间，国内外的大模型行业卷的是「快速版」。5 月谷歌 I/O 大会上，新发布的 Gemini 1.5 大模型序列中出现了 Flash 版，主打轻量化和响应速度。到 7 月，OpenAI 又在 GPT-4o 的基础上推出了 Min...……更多

2024-08-28 09:43:00真香,模型,模型,能力,应用,开发

阿里大模型，再次开源大放送

阿里大模型，再次开源大放送——发布Qwen1.5版本，直接放出六种尺寸。最大的Qwen1.5-72B-Chat模型，在MT-Bench和Alpaca-Evalv2上，超越Claude-2.1、GPT-3.5-Turbo-0613。甚至在部分任务中，得分已经超过前几个版本的GPT-4。各地的开发者前……更多

2024-02-20 14:45:00阿里,模型,再次,模型,多语,能力

又热闹了！OpenAI的加强版“Her”正式开放，压过了Ge

...gle，更确切地说，是Google今天刚刚更新的两款升级版Gemini模型：Gemini-1.5-Pro-002和Gemini-1.5-Flash-002。狙击方式简单粗暴：直接宣布万众期待的GPT语音功能今天起正式开放。两个小时不到，就双叒抢走了Google好不容易的高光时刻。我...……更多

2024-09-25 09:54:00升级,开放,生产,开发者,开发,模型