上下文,微软,架构,模型,上下,性能头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

微软连发3款Phi-3.5模型：128K上下文，首用MoE架构，部分性能超GPT-4o mini

...Phi-3.5，适合在内存和算力受限的环境中运行，均支持128k上下文长度。Phi-3.5-mini-instruct主要面向基础快速推理任务，Phi-3.5-MoE-instruct可胜任复杂推理任务，Phi-3.5-vision-instruct则兼具文本与视觉能力。性能最强大的Phi-3……更多

2024-08-22 09:49:00上下文,微软,架构,模型,上下,性能

GPT-4劲敌，谷歌进入高能+高产模式

...内的大模型而言，只有Minimax采用了MoE架构。二、扩容的上下文窗口意味着什么？虽然Gemini 1.5 Pro是 Gemini 1.5 系列的初代版本，但初代便表现不俗。扩大上下文窗口后的高水平性能是Gemini 1.5 Pro的一大亮点。多模态大模型卷到今日...……更多

2024-02-21 14:05:00劲敌,高产,模式,模型,上下文,处理

AMD MI300绝杀英伟达H100？跑GPT-4性能超25

...希望一举打破英伟达的垄断地位。而AMD的MI300，在部署32K上下文窗口的GPT-4模型时，居然比H100效果更好？AI芯片大决战，即将来临！AI硬件开发商初创公司的未来会怎样？Tenstorrent CEO David Bennett直言不讳地表示，在我们这个行业，...……更多

2023-11-06 15:12:00英伟,大决战,芯片,性能,英伟,芯片

北大林宙辰团队全新混合序列建模架构MixCon：性能远超Ma

...层，相比 Mamba 可将 KV 缓存减少 32 倍。例如，在 256K 令牌上下文环境中，MixCon 仍能保持较小的 KV 缓存优势（如表 1 所示）。在吞吐量方面，处理长序列时，Conba 层计算效率更高，增加其比例可提高整体吞吐量。基本配置单位是 ...……更多

2024-10-16 13:34:00序列,架构,北大,混合,团队,性能

林达华谈大模型发展之路：未来会有更高效的模型结构出现

大模型的上下文长度快速增长，超长上下文解锁新应用，但推理计算代价高昂，上下文本身对于信息不会进行压缩，不能直接捕捉其中的深层知识和规律。上海人工智能实验室领军科学家林达华。过去一年，人工智能领域风起...……更多

2024-03-25 10:53:00林达,模型,之路,结构,发展,模型

微软宣布Team Copilot发布，年内将推出初步预览版

...此类新功能构建的Copilot现在可以利用内存和知识来获取上下文信息、推理操作和输入、根据用户反馈进行学习并在遇到不知道如何处理的情况时寻求帮助，从而独立管理复杂、长期运行的业务流程。AzureAIStudio现已支持提供GPT-4oA...……更多

2024-05-22 20:01:00微软,微软,纳德拉,纳德,模型,功能

OpenAI掀小模型血战！苹果DCLM强势登场，碾压Mist

...T的DCLM，DCLM-7B模型又进一步过滤出其中的2.5T用于训练。上下文长度为2048，小于Mistral 7B和Gemma 2 9B的8k长度。性能方面，作者直接使用评估套件LLM Foundry，测试了模型在53个基准任务上的分数。与其他模型进行比较时，除了MMLU分...……更多

2024-07-22 09:41:00血战,强势,模型,苹果,模型,数据

挑战Scaling Law，Meta发布移动端350M小模型

...层的参数占到了相当大的比例。比如，125M模型中要使用上下文长度32k、维度512的编码，输入和输出编码层就包含了16M的参数，占比达到20%。相较之下，大模型的编码层参数量显得微不足道。比如LLaMA-7B中，这个比例就下降到了3.7...……更多

2024-07-23 09:39:00模型,性能,移动,模型,参数,架构

Mamba再次挑战霸主Transformer！首个通用Mam

...有效地捕获其关系。这种通过比较文本中每个token来理解上下文的方式，需要更多的计算能力和内存来处理不断增长的上下文窗口。如果资源没有相应扩展，推理速度会变慢，最终无法处理超过某个固定长度的文本。为了解决这...……更多

2024-08-14 09:43:00一鸣,霸主,模型,再次,模型,序列

王小川公布最新大模型，号称全球最长上下文，是GPT-4的14

...模型公司“百川智能”宣布，推出Baichuan2-192K大模型，其上下文窗口长度高达192K，能够处理约35万个汉字。百川智能称，Baichuan2-192K是目前全球最长的上下文窗口，也是目前支持长上下文窗口最优秀大模型Claude2（支持100K上下文窗...……更多

2023-10-30 15:02:00王小川,王小,上下文,模型,上下,焦点

OpenCity大模型预测交通路况，零样本下表现出色，来自港

...任务中展现了广泛的适用性。模型只需快速微调就能适应上下文，可以无缝部署在各种场景中。可扩展性：OpenCity展示了有希望的缩放定律，表明该模型有潜力在最小的额外训练或微调需求下有效地扩展和适应新的、以前未见过...……更多

2024-09-02 13:34:00路况,样本,模型,交通,交通,模型

微软一夜干翻苹果Mac！GPT-4o装进全家桶，微软把全世界

...工作信息，开不完的会议。而现在，通过Recall，提供几句上下文，就可以迅速找到桌面上任何内容。比如寻找自己与好友Renat乘车旅行的照片，在搜索栏中，给出提示，Recall便会提供相匹配的结果。不仅仅是电脑的文件，包括你...……更多

2024-05-21 13:47:00微软,装进,全家,全世界,苹果,微软

非Transformer架构站起来了!首个纯无注意力大模型,

...每个单词（或 token）与文本中的每个单词进行比较来理解上下文，它需要更多的计算能力和内存需求来处理不断增长的上下文窗口。但是如果不相应地扩展计算资源，模型推理速度就会变慢，超过一定长度的文本就没法处理了。...……更多

2024-08-14 09:39:00力大,架构,模型,模型,架构,训练

零一万物大模型Yi-34B夺得全球开源评测“双料冠军”，已在

...代码能力和数学能力专项的继续训练模型。全球最长200K上下文窗口Yi-34B模型将发布全球最长、可支持200K超上下文窗口(contextwindow)版本，可以处理约40万汉字超文本输入。上下文窗口是大模型综合运算能力的金指标之一，对于理...……更多

2023-11-06 15:25:00阿里,万物,模型,评测,冠军,全球

AGI一日要闻：台积电预测2040年GPU芯片性能提升100

...k。如今，马斯克更新到Grok 1.5模型。新一代模型实现了长上下文理解和高级推理能力，计划将在未来几天内向早期测试人员和 X 平台（前 Twitter）上的现有 Grok 用户提供。具体来说，首先，Grok-1.5 最明显的改进之一是其在代码和...……更多

2024-03-31 04:00:00估值,美金,要闻,芯片,高达,性能

梁文锋杨植麟论文撞题，“注意力机制”对大模型意味着什么

...于NSA(Natively Sparse Attention，原生稀疏注意力)。据DeepSeek，上下文建模对于下一代语言模型至关重要，但标准注意力机制的高计算成本带来了巨大的计算挑战。NSA（稀疏注意力）在提高效率同时，为提高模型能力提供新的方向，实...……更多

2025-02-19 18:43:00文锋,对大,注意力,模型,意味,机制

infini-attention：谷歌大内存机制

谷歌大改Transformer，“无限”长度上下文来了。现在，1B大模型上下文长度可扩展到1M（100万token，大约相当于10部小说），并能完成Passkey检索任务。8B大模型在500K上下文长度的书籍摘要任务中，拿下最新SOTA。这就是谷歌最新提...……更多

2024-04-14 02:57:00大内,机制,上下文,模型,处理,上下

AI大模型行业报告：大模型发展迈入爆发期，开启AI新纪元（附

...以带来大幅的模型性能提升。同时，GPT-3论文正式提出“上下文学习”，建立了以提示学习方法为基础技术路线的任务求解范式。ChatGPT：一举成为现象级应用，引入RLHF算法改进训练数据GPT系列模型的技术演变（ChatGPT）：在GPT-3...……更多

2024-10-21 10:03:00模型,行业报告,新纪元,报告,发展,行业

本周AI不得了！OpenAI的Sora“模拟世界”、Gemi

...质量令人着迷。总结：谷歌可能找到了某种新方法，将长上下文的架构理念与他们的 TPU 计算堆栈相结合，并取得了很好的效果。据 Gemini 长语境的负责人之一Pranav Shyam说，这个想法几个月前才刚刚萌芽。如果以小版本（v1.5）而...……更多

2024-02-17 19:48:00上下文,新贵,上下,世界,模型,视频

谷歌「诚意之作」，开源9B、27B版Gemma2，主打高效、

...发者提供了前段时间在I/O大会上官宣的Gemini 1.5 Pro的200万上下文窗口访问权限、Gemini API的代码执行功能，并在Google AI Studio中添加了Gemma 2。在最新的博客中，谷歌宣布向所有开发者开放了Gemini 1.5 Pro的200万token上下文窗口访……更多

2024-06-29 09:37:00诚意,经济,模型,训练,性能,注意力