劲敌,高产,模式,模型,上下文,处理头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

谷歌推出datagemma开放权重语言模型新版本

...数据共享平台检索相关信息来进一步提高回复的质量。长上下文窗口由Gemini1.5Pro实现，确保了回答的全面性和清晰度，同时引入了表格和脚注以提供更深层次的上下文。研究团队强调这些技术如何帮助大语言模型判断何时依赖外...……更多

2024-09-13 20:42:00权重,模型,语言,开放,模型,数据

OpenAI开启调查：GPT-4o及4o-mini模型性能下

...为LONGPROC的基准测试工具，该工具专为评估模型在处理长上下文中的复杂信息并生成相应回复的能力而设计。实验结果略显意外：包括GPT-4o在内的众多顶尖模型，虽然在常规长上下文回忆基准测试中表现优异，但在应对复杂的长...……更多

2025-01-20 15:59:00模型,性能,调查,模型,任务,长上

MemGPT团队官宣创业，融资1000万美金，硅谷大佬Jef

...宣创业。由该团队创立的Letta公司，推出了一个同名的AI上下文内存管理平台Letta。最近2年，大语言模型快速发展，但受到上下文窗口长度的限制，导致它在多轮对话和文档分析等任务中的适用性较差。针对这个问题，Letta提出了...……更多

2024-09-26 13:42:00大佬,硅谷,美金,融资,团队,创业

清华提出时间序列大模型：面向通用时序分析的生成式Transf

...步自回归给出任意长的预测结果。作者团队发现，在预测上下文长度不超过预训练序列长度的情况下，模型不会出现明显的多步误差累积现象。（2）时序填补（Imputation）：类似语言模型T5，作者引入Mask Token表示一段连续的缺失...……更多

2024-07-22 09:44:00时间序列,时序,清华,序列,生成,模型

全面叫板OpenAI！谷歌发布多模态大模型全家桶：从AI助手

...将具备多步骤推理能力。来源：谷歌谷歌的Gemini以超长的上下文窗口而出名。在大会上，谷歌重点强调了大模型Gemini 1.5 Pro的多模态和长文本能力，为其推出一系列更新。谷歌将向全球150多个国家地区的Gemini Advanced订阅者提供最...……更多

2024-05-15 09:54:00文生,模型,模态,全家,助手,视频

RAG没有银弹！四级难度，最新综述覆盖数据集、解决方案，教你

...24文中还讨论了将外部数据集成到LLMs中的三种主要形式：上下文、小模型和微调，分析各自的优势、局限性以及适合解决的问题类型。级别1：显式事实查询（explicit fact queries）例：2024年夏季奥运会将在何处举行？Where will the 2024...……更多

2024-11-22 09:54:00银弹,数据,姿势,难度,解决方案,方案

有望改写AI未来！NVIDIA全新nGPT使训练速度暴增20

...少了4到20倍，具体加速效果取决于序列长度。例如，在1k上下文中，训练速度提高了4倍；在4k上下文中，提高了10倍；而在8k上下文中，更是提高了20倍。研究人员指出，nGPT的优化路径从超球面上的点开始，通过位移来贡献最终的...……更多

2024-10-20 15:52:00速度,训练,全新,模型,球面,上下文

商汤升级“日日新5.0”大模型，对标GPT-4Turbo

...专家架构，超10TB tokens训练，覆盖大量合成数据，推理时上下文窗口达200K左右。云、端、边全栈大模型产品矩阵中，用于终端设备的“商汤端侧大模型”可满足各类终端用户对大模型技术的应用需求。“日日新5.0”和GPT-4回答趣...……更多

2024-04-24 09:32:00商汤,模型,升级,商汤,模型,推理

AI 胡说八道怎么办？牛津大学开发了一种“测谎”方法

...是合理的。（谁说是 Python？我 C++第一个不服！！）2忽略上下文和常识语义熵主要基于统计和概率计算，可能忽略了上下文和常识的影响。在一些需要综合上下文和常识来判断的问题中，语义熵可能无法提供准确的可靠性评估。...……更多

2024-07-01 11:40:00牛津大学,八道,牛津,怎么办,方法,开发

现场直击一文总结！OpenAI开发者大会，史上最强GPT-4

...4月的绝大部分世界事件。不仅如此GPT4 Turbo版还提供128k的上下文窗口，也就是说，它可以一次容纳相当于300多页文本内容的提示词（很难想象一下子有这么多提示词还能做到不崩溃）。相比原版GPT-4，Turbo版的收费做了大幅下降...……更多

2023-11-07 09:18:00一文,开发者,地震,大会,开发,用户

生成式AI时代的业务流程管理变革，BPM迎来大型流程模型

...流程模型定义（比如重新设计招聘流程等）、在业务流程上下文中生成实际内容（比如自动创建的职位描述等）以及详细阐述文档和数据（比如总结客户支持交互等）来实现。第三种类型，与生成式AI提高专业和公民开发人员的...……更多

2023-10-31 21:02:00流程,业务流程,变革,生成,模型,业务

openai推出gpt-4turbo：比上代便宜三倍

...者而言“比上代GPT-4便宜三倍”。据悉，GPT-4Turbo支持128k上下文，输入价格比GPT-4便宜了三倍，速率限制翻倍，知识库更新到2023年4月，此外还添加了JSONMode，更新了多个函数调用能力。相对此前GPT-4性能更强、价格更便宜、开发成...……更多

2023-11-07 11:18:00上代,模型,开发,人民币,上下文,价格

打脸“AI灭绝伦”！研究反驳：大模型涌现能力不会威胁人类生存

...（ACL）上。他们通过一系列实验验证了 AI 大模型在不同上下文条件下的表现，结果发现：在零样本（zero-shot）的情况下，许多大模型根本无法展现所谓的“涌现能力”，反而表现得相当一般。他们表示，这一发现有助于理解 LLM ...……更多

2024-08-19 09:31:00模型,威胁,人类,能力,研究,模型

AI“大姨”现场刁难智能客服！直击一群AI打PK赛，真能落地

...个满足现在用户需求的智能客服。能理解用户问题、结合上下文给出解决办法，并且有情商、说人话、能面对各种复杂情景。而且上手门槛很低。比如参赛选手云蝠智能，他们的主打业务是电话客服，在文本客服方面的积累不...……更多

2024-09-23 09:53:00大姨,一群,落地,智能,百炼,模型

Kimi引爆人工智能新风口，龙头连续20CM涨停！哪些公司可

...宣布，公司旗下的kimi智能助手，已支持200万字超长无损上下文，并已开启产品内测。继昨日爆发后，kimi概念股今天（3月21日）继续上涨。其中，龙头股华策影视（300133.SZ）再次涨停，连续收获两个20CM涨停，捷成股份（300182.SZ）...……更多

2024-03-21 16:48:00风口,人工智能,龙头,人工,智能,公司

真香！智谱大模型，有了首个免费的API

...应用的底层逻辑。新一代大语言模型继续保持多模态、长上下文等方面的性能优势，又因为速度和效率的大幅提升获得了更多开发者的青睐。在实际应用场景中，新模型适用于处理高频次、相对简单的任务，禁得起人们的反复调...……更多

2024-08-28 09:43:00真香,模型,模型,能力,应用,开发

四大新功能让生成式AI“如虎添翼”

...本并进行训练，这种训练使聊天机器人能够在对话中结合上下文语境，产生类似人类的文本响应。目前，智能客服聊天机器人集成了这项技术。随着这些机器人在语言翻译、创造性写作、理解上下文并作出有意义反应方面的能力...……更多

2023-12-15 01:28:00如虎,新功能,生成,生成,机器人,机器

金融和汽车将是大模型最早使用两大场景

...单查找答案的方式不同，大模型能够根据提问者的意图和上下文信息，生成针对特定问题的个性化回答。它还能够理解问题的含义，并从已有的知识库中找到最合适的词汇和解释来回答问题。这种能力使得大模型在某些方面甚至...……更多

2023-11-02 01:25:00模型,场景,金融,汽车,模型,重庆

鄂维南院士领衔新作：大模型不止有RAG、参数存储，还有第3种

...LM 中，显式记忆是继隐式记忆（模型参数）和工作记忆（上下文键值）之后的第三种记忆形式。具体而言，本文引入了一种新的记忆格式，即显式记忆，其特点是写入成本和读取成本相对较低。如图 1 所示，模型首先将知识库...……更多

2024-07-11 09:33:00维南,领衔,院士,新作,模型,存储

Mistral放大招！124B多模态巨无霸登场，免费版Cha

...展1230亿参数的多模态解码器，10亿参数的视觉编码器128K上下文窗口长度：可容纳至少30张高分辨率图像具体来说，Pixtral Large是Mistral多模态系列的第二个模型，基于Mistral Large 2构建，有1240亿参数。该模型能够理解文档、图表和自...……更多

2024-11-20 09:43:00巨无霸,免费版,模态,突袭,模型,生成

OpenAI史诗级更新！最强大模型炸场，128K上下文、价格

...大方面更新重点值得关注和思考。1、GPT-4 Turbo：支持128k上下文，相当于300页文档，输入价格大降2/3，速率限制翻倍，知识更新到2023年4月，改进指令跟随和JSON Mode，更新多个函数调用能力。这意味着比GPT-4更强、更便宜、开发成...……更多

2023-11-07 17:45:00上下文,史诗,模型,上下,更新,价格

谷歌「诚意之作」，开源9B、27B版Gemma2，主打高效、

...发者提供了前段时间在I/O大会上官宣的Gemini 1.5 Pro的200万上下文窗口访问权限、Gemini API的代码执行功能，并在Google AI Studio中添加了Gemma 2。在最新的博客中，谷歌宣布向所有开发者开放了Gemini 1.5 Pro的200万token上下文窗口访……更多

2024-06-29 09:37:00诚意,经济,模型,训练,性能,注意力