劲敌,高产,模式,模型,上下文,处理头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

GPT-4劲敌，谷歌进入高能+高产模式

...内的大模型而言，只有Minimax采用了MoE架构。二、扩容的上下文窗口意味着什么？虽然Gemini 1.5 Pro是 Gemini 1.5 系列的初代版本，但初代便表现不俗。扩大上下文窗口后的高水平性能是Gemini 1.5 Pro的一大亮点。多模态大模型卷到今日...……更多

2024-02-21 14:05:00劲敌,高产,模式,模型,上下文,处理

OpenAI劲敌来了！这款大模型多项测试超越GPT-4o，号

...价为3美元，每生成百万token为15美元，并具有20万个token的上下文窗口，约合15万个单词。现在，用户可以通过Anthropic的网页客户端和iOS应用免费试用新模型，Claude Pro和Claude Team的订阅用户将获得五倍的速率限制。此外，新模型也...……更多

2024-06-21 12:43:00劲敌,模型,智能,测试,模型,前代

OpenCity大模型预测交通路况，零样本下表现出色，来自港

...任务中展现了广泛的适用性。模型只需快速微调就能适应上下文，可以无缝部署在各种场景中。可扩展性：OpenCity展示了有希望的缩放定律，表明该模型有潜力在最小的额外训练或微调需求下有效地扩展和适应新的、以前未见过...……更多

2024-09-02 13:34:00路况,样本,模型,交通,交通,模型

零样本即可时空预测！港大、华南理工等发布时空大模型Urban

...即整合时空依赖编码器，以提升大型语言模型在捕捉时空上下文中的时间序列依赖性的能力。具体来说，我们设计的时空编码器由两个核心组件构成：一个是门控扩散卷积层，另一个是多层次关联注入层。上式为初始化时空嵌...……更多

2024-08-01 09:40:00时空,华南,样本,理工,模型,时空

infini-attention：谷歌大内存机制

谷歌大改Transformer，“无限”长度上下文来了。现在，1B大模型上下文长度可扩展到1M（100万token，大约相当于10部小说），并能完成Passkey检索任务。8B大模型在500K上下文长度的书籍摘要任务中，拿下最新SOTA。这就是谷歌最新提...……更多

2024-04-14 02:57:00大内,机制,上下文,模型,处理,上下

支持1024帧、准确率近100％，英伟达「LongVILA」

现在，长上下文视觉语言模型（VLM）有了新的全栈解决方案 ——LongVILA，它集系统、模型训练与数据集开发于一体。现阶段，将模型的多模态理解与长上下文能力相结合是非常重要的，支持更多模态的基础模型可以接受更灵活...……更多

2024-08-22 09:51:00英伟,准确率,支持,视频,序列,训练

梁文锋杨植麟论文撞题，“注意力机制”对大模型意味着什么

...于NSA(Natively Sparse Attention，原生稀疏注意力)。据DeepSeek，上下文建模对于下一代语言模型至关重要，但标准注意力机制的高计算成本带来了巨大的计算挑战。NSA（稀疏注意力）在提高效率同时，为提高模型能力提供新的方向，实...……更多

2025-02-19 18:43:00文锋,对大,注意力,模型,意味,机制

林达华谈大模型发展之路：未来会有更高效的模型结构出现

大模型的上下文长度快速增长，超长上下文解锁新应用，但推理计算代价高昂，上下文本身对于信息不会进行压缩，不能直接捕捉其中的深层知识和规律。上海人工智能实验室领军科学家林达华。过去一年，人工智能领域风起...……更多

2024-03-25 10:53:00林达,模型,之路,结构,发展,模型

陈天奇团队LLM结构化生成新引擎XGrammar：百倍加速、

...就是遵循某个特定格式（如 JSON、SQL 等）的数据。但使用上下文无关语法（CFG）来进行约束解码的方法并不高效。针对这个困难，陈天奇团队提出了一种新的解决方案：XGrammar。XGrammar 是一个开源软件库，可实现高效、灵活且可...……更多

2024-11-27 13:37:00结构化,开销,生成,团队,结构,引擎

无一大模型及格！北大/通研院提出超难基准，评估长文本理解生

...据集：LooGLE，专门用于测试和评估大语言模型（LLMs）长上下文理解能力。该数据集既能够评估LLMs对长文本的处理和检索能力，又可以评估其对文本长程依赖的建模和理解能力。结果不评不知道，一评估发现这些模型在复杂的长...……更多

2024-08-08 09:39:00基准,北大,生成,模型,文本,评估

调研219篇文献，全面了解GenAI在自适应系统中的现状与研

...系统中的应用潜力概览监控功能：GenAI，特别是 LLMs，在上下文理解和预测方面显著增强了自适应系统的监控能力。LLMs 可将监控收集的非结构化数据进行结构化处理，辅助异常检测；在上下文预测方面，基于 LLM 和扩散模型的时...……更多

2024-09-27 13:42:00路线图,文献,调研,路线,现状,研究

Anthropic再反击！发布Claude 3.5吊打GPT

...kens收费3美元，每百万输出Tokens收费15美元，具有200K Tokens上下文窗口。Anthropic表示，目标是每隔几个月就大幅改善智能、速度和成本之间的权衡曲线。除了开发下一代模型系列外，还正在开发新模式和功能，以支持更多企业用例...……更多

2024-06-21 11:50:00逻辑推理,推理,逻辑,视觉,方面,模型

北大林宙辰团队全新混合序列建模架构MixCon：性能远超Ma

...层，相比 Mamba 可将 KV 缓存减少 32 倍。例如，在 256K 令牌上下文环境中，MixCon 仍能保持较小的 KV 缓存优势（如表 1 所示）。在吞吐量方面，处理长序列时，Conba 层计算效率更高，增加其比例可提高整体吞吐量。基本配置单位是 ...……更多

2024-10-16 13:34:00序列,架构,北大,混合,团队,性能

Bengio团队提出多模态新基准，直指Claude 3.5和

...代表包含了图像（VI）和图像中的文字（TEI）两部分作为上下文信息，模型能还原出被遮住的文字的准确率。蓝色框内表示仅包含图像中的文字（TEI）的作为上下文信息，并不包含图像（VI），模型能还原出的遮住文字的准确率...……更多

2024-06-29 09:37:00模态,基准,弱点,团队,模型,任务

AI赋能、短剧兴起，影视赛道 “一路生花“

...交互体验。Kimi智能助手的核心特点和功能包括：（1）长上下文处理：Kimi能够处理长达200万字的无损上下文，这意味着它可以理解和记忆大量信息，并在此基础上进行有效的交流和任务处理。（2）能力圈：Kimi的能力圈广泛，包...……更多

2024-03-26 10:55:00生花,短剧,赛道,影视,基金,短剧

Kimi爆火背后：访问量仅次于文心一言和阿里通义，国内外大模

...款面向C端的大模型产品。早前，该公司宣布在大模型长上下文窗口技术上取得新的突破，Kimi已支持200万字超长无损上下文，并开启产品内测，该能力在不到半年内提升9倍。市场的火爆，导致Kimi服务器一度瘫痪，无法回复用户...……更多

2024-03-23 14:00:00卷上,通义,阿里,文心,下文,模型

Meta祭出三篇最详尽Llama微调指南！千字长文，0基础小

...驱动的LLM文本生成」。RAG于2020年推出，它使用动态提示上下文，通过用户问题检索并注入LLM提示，以引导其使用检索到的内容，而不是预训练的知识。Chat LangChain是由RAG支持的、在Lang Chain文档上流行的Q/A聊天机器人。上下文学...……更多

2024-08-27 12:03:00小白,长文,千字,基础,指南,训练

EMQ 如何用DeepSeek大模型重构可观测性数据分析？

...升可观测性数据分析的智能化水平：·智能化推理：结合上下文对系统异常进行推理和判断，而非依赖硬编码规则。·自然语言处理：通过AI生成代码的方式灵活处理数据，满足特殊场景需求。·向量化知识库：利用AI推理能力，...……更多

2025-02-27 14:45:00重构,数据分析,观测,模型,分析,数据

10分钟速成专家，「Kimi智能助手」正式支持200万上下文

...正式宣布，旗下的Kimi智能助手，已支持200万字超长无损上下文，并于即日起开启产品内测。Kimi智能助手是月之暗面（Moonshot AI）基于自研千亿参数大模型打造的对话式 AI 助手产品，在2023年10月正式发布。而月之暗面也是国内大...……更多

2024-03-21 12:36:00上下文,速成,助手,上下,对话,支持

阿里云百炼上线Qwen2.5-Turbo模型，可支持100万

...的Qwen2.5-Turbo已在阿里云百炼上线，该模型支持100万超长上下文，相当于100万个英文单词或150万个汉字，在多个长文本评测集上的性能表现超越GPT-4。即日起，所有用户可在阿里云百炼调用Qwen2.5-TurboAPI，百万tokens仅需0.3元。全新...……更多

2024-11-21 09:48:00百炼,阿里,上下文,模型,上下,支持

Kimi爆火出圈，国产大模型首次超越海外！

2024年3月18日，国产AI大模型Kimi将上下文无损输入长度提升至200万字，成为国内大模型首次在部分能力上超越海外主流产品的里程碑。上下文输入长度的增加能够帮助模型更好学习文本知识，从而更有针对性得与用户互动。在长...……更多

2024-04-02 18:31:00模型,国产,模型,上下文,能力,应用

非Transformer架构站起来了!首个纯无注意力大模型,

...每个单词（或 token）与文本中的每个单词进行比较来理解上下文，它需要更多的计算能力和内存需求来处理不断增长的上下文窗口。但是如果不相应地扩展计算资源，模型推理速度就会变慢，超过一定长度的文本就没法处理了。...……更多

2024-08-14 09:39:00力大,架构,模型,模型,架构,训练

AI大模型行业报告：大模型发展迈入爆发期，开启AI新纪元（附

...以带来大幅的模型性能提升。同时，GPT-3论文正式提出“上下文学习”，建立了以提示学习方法为基础技术路线的任务求解范式。ChatGPT：一举成为现象级应用，引入RLHF算法改进训练数据GPT系列模型的技术演变（ChatGPT）：在GPT-3...……更多

2024-10-21 10:03:00模型,行业报告,新纪元,报告,发展,行业

鬼手操控着你的手机？大模型GUI智能体易遭受环境劫持

...两个目的找到了一个共同的操作。虽然框中的内容提供了上下文，指示了按钮的真实功能，但模型经常会忽略上下文的含义。（2）拒绝弹框的按钮被重写为情绪化表达。这种引导性的情绪有时可以影响甚至操纵用户决策。这种...……更多

2024-09-03 09:59:00模型,环境,智能,手机,环境,干扰

突破时间序列组合推理难题！南加大发布一站式多步推理框架TS-

...asoner是一个创新的多步推理框架，结合了大型语言模型的上下文学习和推理能力，通过程序化多步推理、模块化设计、自定义模块生成和多领域数据集评估，有效提高了复杂时间序列任务的推理能力和准确性。实验结果表明，TS-...……更多

2024-10-29 09:55:00推理,时间序列,序列,框架,难题,突破

顺丰科技函证LaaS元能力碰撞数字生态

...应用级和服务级元能力的标准定义。通过界定领域实体与上下文界限、排线模型抽象设计等实践，重新定义函证LaaS的元能力，为加速数字生态构建奠定了坚实基础。LaaS元能力函证领域分析函证处理上下文（排线模型）函证领域...……更多

2024-03-14 15:00:00顺丰,碰撞,生态,能力,数字,科技

给小学数学题加句废话，OpenAI o1就翻车了，苹果论文质

...为。该观点还指出，人类在解决数学问题时通常有明确的上下文，而 LLM 在处理数学问题时可能没有这样的上下文。因此，如果通过适当的提示工程，向模型明确这是一个数学考试的环境，那么它们在添加多余子句时导致的性能...……更多

2024-10-14 09:55:00数学题,推理,废话,苹果,数学,小学

Mamba再次挑战霸主Transformer！首个通用Mam

...有效地捕获其关系。这种通过比较文本中每个token来理解上下文的方式，需要更多的计算能力和内存来处理不断增长的上下文窗口。如果资源没有相应扩展，推理速度会变慢，最终无法处理超过某个固定长度的文本。为了解决这...……更多

2024-08-14 09:43:00一鸣,霸主,模型,再次,模型,序列

零一万物大模型Yi-34B夺得全球开源评测“双料冠军”，已在

...代码能力和数学能力专项的继续训练模型。全球最长200K上下文窗口Yi-34B模型将发布全球最长、可支持200K超上下文窗口(contextwindow)版本，可以处理约40万汉字超文本输入。上下文窗口是大模型综合运算能力的金指标之一，对于理...……更多

2023-11-06 15:25:00阿里,万物,模型,评测,冠军,全球

对标or颠覆？Anthropic让创业者狠狠共情

...能力为优势的大模型，Claude3 Opus版本支持了 200K Tokens 的上下文窗口，并且可以处理100万Tokens 的输入。对于许多自然语言处理任务来说，例如机器翻译、摘要生成、问答系统等，长期依赖性是一个关键挑战，因为文本的含义通常...……更多

2024-03-08 15:00:00创业者,颠覆,狠狠,创业,人工智能,人工

page 1/2667 首页上一页 12 3 4 5 6 下一页末页

更多关于科技的资讯：

京东开启第6届孝老爱老购物节发放亿元暖阳孝心券、免费送装拆

10月27日，在民政部养老服务司、北京市民政局的指导组织下，京东举办第6届孝老爱老购物节暨暖阳行动发布会。在适老消费需求高速增长

2025-10-28 12:01:00

方家铺子亮相深圳礼品展：AI赋能东方滋养，助力“一人一方”落

摘要：方家铺子亮相深圳礼品展，以AI赋能个性化滋补，展现了东方养生的智能化新趋势。10月23日，为期4天的第33届中国（深圳）国际礼品及家居用品展览会圆满落幕

2025-10-28 12:04:00

京东七鲜京津冀布局再加速！石家庄首店12月裕华万达开业

石家庄的“新鲜”生活要来了！据官方确认，石家庄京东七鲜首店将于12月在裕华万达广场正式开业，为市民带来生鲜购物与生活方式的全新升级

2025-10-28 12:05:00

OPPO携手火山引擎，Find X9 新机里藏了个“AI旅拍

近日，OPPO发布了Find X9系列新机，以“画质革命”为核心，全面升级了移动影像能力，致力于打造手机摄影的旗舰新标杆

2025-10-28 12:07:00

第八届世界声博会11月2日在合肥开幕！讯飞星火大模型升级版即

大皖新闻讯 10月28日，安徽省人民政府新闻办公室召开第八届世界声博会暨2025科大讯飞全球1024开发者节筹备情况新闻发布会

2025-10-28 13:23:00

智推互联：以“开拓求新”破传播边界，用“精进不止”筑服务壁垒

当AI浪潮席卷全球，企业品牌传播正面临前所未有的挑战。某企业市场部负责人看着一组棘手的数据：预算投入持续，但品牌声量始终不温不火

2025-10-28 13:51:00

记者走基层｜裸眼3D，让影像“悬浮”在空中

10月27日，河北景优数字仿真科技有限公司，三维视觉设计师正在制作3D片源。河北日报记者常方圆摄一只蜜蜂翩然“飞”离播放设备

2025-10-28 08:33:00

第三届山西省智能制造推进大会在太原举行

10月27日，第三届山西省智能制造推进大会在太原举行。在山西省卓越级智能工厂和智能制造优秀供应商授牌仪式上，太钢不锈钢股份有限公司

2025-10-28 07:23:00

从“复活”一只龙鸟到定义一个产业，越疆用具身智能撬动文化科技

当电影《博物馆奇妙夜》中展品“活”过来的奇幻场景照进现实，一场由科技驱动的文旅产业变革正悄然拉开序幕。近日，越疆初息工厂宣布成功打造全球首个超仿生具身智能体——以多模态具身智能技术“复活”的中华龙鸟

2025-10-28 07:48:00

近400名人才角逐南京市“双创项目”

近400名人才角逐南京市“双创项目”人才“赛马”金陵城，创新与产业双向奔赴□南京日报/紫金山新闻记者张安琪10月26日

2025-10-28 07:50:00

消协帮您找扫码辨商品 “消协315”小程序上线新功能

中国消费者协会与中国物品编码中心合作，于近日在“全国消协智慧315”小程序上线“消协帮您找，扫码辨商品”新功能。该功能依托编码中心国家商品数据库的权威信息

2025-10-28 07:58:00

大金科工开业！锚定3亿年产值，打造绿色智造新标杆！

近日，大金科工（天津）车业有限公司（以下简称“大金科工”）开业仪式在武清开发区举行。大金科工由大行科工（深圳）股份有限公司与金轮集团共同注资成立

2025-10-27 14:11:00

电竞赛事下沉重构经济文化新生态

第十二届王者荣耀全国大赛举办颁奖礼第十二届王者荣耀全国大赛总决赛落地天津五大道民园广场无畏契约嘉年华前王者荣耀职业联赛选手刺痛（右）与粉丝合影无畏契约瓦友社迎新季线下活动和平精英村镇赛广东清远站

2025-10-27 14:11:00

2025中国GEO服务市场格局解读：主流GEO服务商优势对比

据IDC数据显示，2025年中国GEO市场规模突破200亿元，年复合增长率高达67%，超过78%的企业已将GEO纳入品牌增长与智能营销的核心战略

2025-10-27 14:20:00

中国品牌出海：从产品制造向品牌价值跃升

“不出海，就出局。”这句话听起来很极端，但折射出中国制造业在全球化时代的现实处境。今天，中国企业出海，已不再是讨生活般的生存选择

2025-10-27 14:23:00

头条订阅服务