正确率,长上,下文,模型,只是,能力头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

OpenAI发布最新技术研究，AI“黑盒”不再是难题！

...数字可能出现在版本号、股票代码、基金表现、汇率等上下文中，这些场景下的数字大小并不总是具有直接的比较意义。如果训练数据中存在关于数字比较的偏差或不足，模型可能无法学习到正确的比较规则。另一方面，可能由...……更多

2024-07-18 09:47:00最新技术,难题,研究,技术,模型,小数

检索总结能力超博士后，首个大模型科研智能体PaperQA2开

...索步骤对论文块进行排序，然后进行大模型重新排序和上下文摘要（RCS）步骤。在回答 LitQA2 问题时，PaperQA2 平均每道题解析并使用 14.5 ± 0.6（平均值 ± SD，n = 3）篇论文。在 LitQA2 上运行 PaperQA2 可获得 85.2% ± 1.1%（平均值 ……更多

2024-09-13 13:33:00博士后,模型,科研,博士,检索,能力

林达华谈大模型发展之路：未来会有更高效的模型结构出现

大模型的上下文长度快速增长，超长上下文解锁新应用，但推理计算代价高昂，上下文本身对于信息不会进行压缩，不能直接捕捉其中的深层知识和规律。上海人工智能实验室领军科学家林达华。过去一年，人工智能领域风起...……更多

2024-03-25 10:53:00林达,模型,之路,结构,发展,模型

大模型是否有推理能力？DeepMind数月前的论文让AI社区

...一化。因此，模型输出对数概率。在动作 - 值预测中，上下文大小为 79，而在状态 - 值预测和行为克隆中，上下文大小为 78。对于动作和状态 - 值预测，输出大小为，对于行为克隆，输出大小为 1968（所有可能合法动作的数量）...……更多

2024-10-23 12:05:00推理,模型,能力,论文,社区,模型

infini-attention：谷歌大内存机制

...compressivememory）整合到线性注意力机制中，用来处理无限长上下文。压缩记忆允许模型在处理新输入时保留和重用之前的上下文信息。它通过固定数量的参数来存储和回忆信息，而不是随着输入序列长度的增加而增加参数量，能...……更多

2024-04-14 02:57:00大内,机制,上下文,模型,处理,上下

CMU副教授：在多智能体流行的当下，不要忽视单智能体系统

...M 可能无法关注到重点，但随着模型能力提升，LLM 在确定长上下文中的重要信息方面越来越强了。检索增强式提示：另一种可能的选择是使用检索。如同检索增强式生成（RAG）系统一样，可以出于效率或准确度的目的对长上下...……更多

2024-10-11 12:03:00智能,副教授,体系,智能,提示,体系

Kimi引爆人工智能新风口，龙头连续20CM涨停！哪些公司可

...还会有新成果亮相。开启大模型应用新篇章事实上，无损长上下文是通往通用人工智能的基础技术，它也是业界一直以来的研究重点。从历史上看，模型架构的演进，本质上都是在提升有效的、无损的上下文长度。此次Kimi智能...……更多

2024-03-21 16:48:00风口,人工智能,龙头,人工,智能,公司

用过GPT-4 Turbo以后，我们再也回不去了

...的 GPT。根据官方说法，这一波 GPT 的升级包括：更长的上下文长度：128k，相当于 300 页文本。更高的智能程度，更好的 JSON / 函数调用。更高的速度：每分钟两倍 token。知识更新：目前的截止日期为 2023 年 4 月。定制化：GPT3 1...……更多

2023-11-08 18:08:00模型,测试,用户,代码,基准,尝试

AI赋能游戏：问答机器人的设计与实现

...所有这些向量建立索引，从而查询出与用户提问相关的上下文，最后创建一个带上下文的大语言模型提示语，让模型回答用户的查询。我们可以对比有无检索模型对回答的差别：大语言模型同样是ChatGPT3.5，提问“赵云要怎么培...……更多

2024-06-26 13:43:00机器人,问答,机器,设计,模型,语料

《红楼梦》里有大量东北方言？实测AI大模型“长文阅读”

...简单。今年2月，谷歌发布的Gemini 1.5Pro模型曾一度创下最长上下文窗口的纪录。根据官方数据，谷歌Gemini1.5 Pro将上下文窗口容量提到了100万token（极限为1000万token）。这意味着机器可以一下子处理22小时的录音、超过十倍的完整...……更多

2024-03-28 10:06:00红楼梦,长文,实测,方言,红楼,模型

智谱AI发布基座大模型GLM-4，发起大模型开源基金

...长度内，GLM-4模型均可做到几乎100%的精度召回，并未出现长上下文全局信息因为失焦而导致的精度下降。在多模态能力方面，文生图和多模态理解得到增强。此外，GLM-4的All Tools能力（即Agent智能体能力）全新发布，GLM-4可自主根...……更多

2024-01-17 16:47:00模型,基座,基金,模型,文生,模态

Kimi概念站上AI“新风口” 这股风究竟该不该追

...，通用人工智能创业公司Moonshot(月之暗面)宣布在大模型长上下文窗口技术上取得新的突破，其自研的Kimi智能助手(KimiChat)从2023年10月的20万汉字上下文能力，增长至200万字超长无损上下文。“近期非常火的AI语言模型反复发酵，...……更多

2024-03-23 11:48:00风口,概念,概念股,模型,概念,公司

马斯克新动向！365亿元

...前，Grok的最新版本为3月底发布的Grok 1.5，该版本实现了长上下文理解和高级推理能力，可以处理128K token的长上下文窗口。xAI官方博客表示：“对于构建能够理解世界的AGI（通用人工智能）来说，提高我们的多模态理解和生成能...……更多

2024-05-29 11:14:00马斯,马斯克,动向,马斯,马斯克,英伟

从AI搜索到语音陪练，腾讯元宝全面评测来了！大模型C端玩家谁

...答问题的准确率和速度。记者观察到，尽管元宝和GPT-4o的正确率相同，正确率都是75%，但两者的答题风格各有千秋。GPT-4o以简洁、直接和结构化的方式呈现答案，使用数学公式清晰地展示计算过程，迅速传达结果；而腾讯元宝则...……更多

2024-05-31 18:07:00腾讯,陪练,元宝,语音,模型,评测

科大讯飞联手华为首次攻克全国产算力下推理模型训练难关

...译员的思维链路进行训练，具备实时意群理解和切分、上下文语境精准选词以及碎片化信息重组的能力，这一特性使得星火语音同传大模型在处理复杂句式和语境时表现出色，能够迅速准确地传达原意。技术测试结果显示，即便...……更多

2025-01-15 15:07:00讯飞,华为,难关,模型,训练,全国

OpenAI o1模型到博士水平了?复旦教授:没有真正推理能

...现。上述评测还显示，o1模型在MMLU Categories中的高数测试正确率高达98%，且在ML Benchmarks中的数学测试相较GPT-4o获得了超过34%的最大绝对性优势，足以显示o1模型是个数学超级“学霸”。 OpenAI还选择了专为美国最优秀的高中数学...……更多

2024-09-13 16:44:00复旦,相关性,概率,推理,模型,教授

OpenAI直播第二弹！奥特曼2024年最大惊喜竟来自字节？

...，他们设置了三个不同的评估指标，分别是Top-1（第一项正确率）、Top-5（前五项正确率）和Top-max（是否包含正确答案）。在Top-1指标中，o1 mini在约200条数据上的得分是17%。o1得到了25%，而微调后的o1 mini，得到了31%。ChatGPT就此生...……更多

2024-12-09 09:53:00奥特,奥特曼,字节,直播,惊喜,模型

本周AI不得了！OpenAI的Sora“模拟世界”、Gemi

...示质量令人着迷。总结：谷歌可能找到了某种新方法，将长上下文的架构理念与他们的 TPU 计算堆栈相结合，并取得了很好的效果。据 Gemini 长语境的负责人之一Pranav Shyam说，这个想法几个月前才刚刚萌芽。如果以小版本（v1.5）...……更多

2024-02-17 19:48:00上下文,新贵,上下,世界,模型,视频

以图灵机为师：通过微调训练让大语言模型懂执行计算过程

...生成代码并将其提交给外部 Python 执行程序以处理表格上下文中的数学问题。Wang et al. (2023) [5] 采用监督学习的方式让 LLM 学习如何通过构建用于解决数学问题的程序，而 Zhou et al. (2023) [6] 提出了一种零样本提示方法，以实现代码...……更多

2024-10-21 09:54:00灵机,模型,训练,过程,语言,运算符

趣丸科技副总裁兼CTO谢睿：多模态智能激发应用新场景 | 新

...两大技术手段。特定人群文本识别：采用单文本检测+上下文识别的方案。其中，单文本识别我们自研了通用的关键词匹配分析框架，支持多种匹配方式、支持自定义过滤条件、支持特殊标记等；上下文识别采用大模型进行复杂...……更多

2024-05-24 22:22:00模态,生产力,副总,场景,大会,智能

AI科学家太多，谁靠谱一试便知！普林斯顿新基准CORE-Be

...简单任务的准确率可以达到60%，最难任务准确率仅有21%大模型的能力越来越强，用户在一些重要的任务中也可以依赖大模型，比如说辅助做科研。不过现有科研辅助相关的基准测试都太简单，跟现实世界的任务差距还是比较大的...……更多

2024-09-26 13:38:00普林,普林斯顿,斯顿,准确率,基准,科学家

OpenAI o1 模型 PlanBench 规划能力实测：

...州立大学的科研团队利用 PlanBench 基准，测试了 OpenAI o1 模型的规划能力。研究结果表明 o1 模型取得了长足的进步，但仍然存在很大的局限性。PlanBench 基准简介PlanBench 开发于 2022 年，用于评估人工智能系统的规划能力，包括 600 ...……更多

2024-09-26 09:50:00准确率,实测,模型,能力,规划,模型

国产大模型加速落地，争夺“中国版ChatGPT”心智定位

...国版ChatGPT”心智定位。3月18日，月之暗面宣布在大模型长上下文窗口技术上取得新的突破，其自研的Kimi智能助手已支持200万字超长无损上下文，并开启产品内测。5月6日，Kimi进行大规模更新，推出全新的Kimi++功能。今年4月，科...……更多

2024-05-07 18:33:00心智,中国,落地,模型,定位,国产

Kimi开启大模型应用元年券商推荐万兴科技掌阅科技等龙头

...金证券表示,“在发展通用人工智能(AGI)的过程中,无损的长上下文将会是一个很关键的基础技术”,并进一步表示“长文本能力大幅升级,有望催化AI应用落地。”开源证券认为,“Kimi等AI产品持续迭代,AI应用商业化或加速。”华福证...……更多

2024-03-29 19:00:00万兴,科技,券商,龙头,模型,应用

科研也完了，AI暴虐170位人类专家！Nature子刊：大模

...如果大模型对预测结果表示具有高度自信时，回答结果的正确率也更高，也就是说，大模型完全可以辅助人类做科研新发现。最重要的是，这种方法并不特定于某一个学科，其他知识密集型任务上也可以使用。科研结果预测即使...……更多

2024-12-09 09:50:00暴虐,准确率,模型,高达,完了,科研

AGI一日要闻：台积电预测2040年GPU芯片性能提升100

...Grok。如今，马斯克更新到Grok 1.5模型。新一代模型实现了长上下文理解和高级推理能力，计划将在未来几天内向早期测试人员和 X 平台（前 Twitter）上的现有 Grok 用户提供。具体来说，首先，Grok-1.5 最明显的改进之一是其在代码...……更多

2024-03-31 04:00:00估值,美金,要闻,芯片,高达,性能

精准狙击Llama 3.1？Mistral AI开源Larg

...媲美。今年 2 月，Mistral AI 推出了最初的 Large 模型，其上下文窗口包含 32,000 个 token，新版模型在此基础上构建，具有更大的 128,000 个上下文窗口（大约相当于一本 300 页的书）—— 与 OpenAI 的 GPT-4o 和 GPT-4o mini 以及……更多

2024-07-26 09:36:00模型,基准,多语,测试,性能,生成