正确率,长上,下文,模型,只是,能力头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...索步骤对论文块进行排序，然后进行大模型重新排序和上下文摘要（RCS）步骤。在回答 LitQA2 问题时，PaperQA2 平均每道题解析并使用 14.5 ± 0.6（平均值 ± SD，n = 3）篇论文。在 LitQA2 上运行 PaperQA2 可获得 85.2% ± 1.1%（平均值 ……更多

2024-09-13 13:33:00博士后,模型,科研,博士,检索,能力

大模型是否有推理能力？DeepMind数月前的论文让AI社区

...一化。因此，模型输出对数概率。在动作 - 值预测中，上下文大小为 79，而在状态 - 值预测和行为克隆中，上下文大小为 78。对于动作和状态 - 值预测，输出大小为，对于行为克隆，输出大小为 1968（所有可能合法动作的数量）...……更多

2024-10-23 12:05:00推理,模型,能力,论文,社区,模型

infini-attention：谷歌大内存机制

...compressivememory）整合到线性注意力机制中，用来处理无限长上下文。压缩记忆允许模型在处理新输入时保留和重用之前的上下文信息。它通过固定数量的参数来存储和回忆信息，而不是随着输入序列长度的增加而增加参数量，能...……更多

2024-04-14 02:57:00大内,机制,上下文,模型,处理,上下

CMU副教授：在多智能体流行的当下，不要忽视单智能体系统

...M 可能无法关注到重点，但随着模型能力提升，LLM 在确定长上下文中的重要信息方面越来越强了。检索增强式提示：另一种可能的选择是使用检索。如同检索增强式生成（RAG）系统一样，可以出于效率或准确度的目的对长上下...……更多

2024-10-11 12:03:00智能,副教授,体系,智能,提示,体系

Kimi引爆人工智能新风口，龙头连续20CM涨停！哪些公司可

...还会有新成果亮相。开启大模型应用新篇章事实上，无损长上下文是通往通用人工智能的基础技术，它也是业界一直以来的研究重点。从历史上看，模型架构的演进，本质上都是在提升有效的、无损的上下文长度。此次Kimi智能...……更多

2024-03-21 16:48:00风口,人工智能,龙头,人工,智能,公司

用过GPT-4 Turbo以后，我们再也回不去了

...的 GPT。根据官方说法，这一波 GPT 的升级包括：更长的上下文长度：128k，相当于 300 页文本。更高的智能程度，更好的 JSON / 函数调用。更高的速度：每分钟两倍 token。知识更新：目前的截止日期为 2023 年 4 月。定制化：GPT3 1...……更多

2023-11-08 18:08:00模型,测试,用户,代码,基准,尝试

AI赋能游戏：问答机器人的设计与实现

...所有这些向量建立索引，从而查询出与用户提问相关的上下文，最后创建一个带上下文的大语言模型提示语，让模型回答用户的查询。我们可以对比有无检索模型对回答的差别：大语言模型同样是ChatGPT3.5，提问“赵云要怎么培...……更多

2024-06-26 13:43:00机器人,问答,机器,设计,模型,语料

《红楼梦》里有大量东北方言？实测AI大模型“长文阅读”

...简单。今年2月，谷歌发布的Gemini 1.5Pro模型曾一度创下最长上下文窗口的纪录。根据官方数据，谷歌Gemini1.5 Pro将上下文窗口容量提到了100万token（极限为1000万token）。这意味着机器可以一下子处理22小时的录音、超过十倍的完整...……更多

2024-03-28 10:06:00红楼梦,长文,实测,方言,红楼,模型

智谱AI发布基座大模型GLM-4，发起大模型开源基金

...长度内，GLM-4模型均可做到几乎100%的精度召回，并未出现长上下文全局信息因为失焦而导致的精度下降。在多模态能力方面，文生图和多模态理解得到增强。此外，GLM-4的All Tools能力（即Agent智能体能力）全新发布，GLM-4可自主根...……更多

2024-01-17 16:47:00模型,基座,基金,模型,文生,模态

Kimi概念站上AI“新风口” 这股风究竟该不该追

...，通用人工智能创业公司Moonshot(月之暗面)宣布在大模型长上下文窗口技术上取得新的突破，其自研的Kimi智能助手(KimiChat)从2023年10月的20万汉字上下文能力，增长至200万字超长无损上下文。“近期非常火的AI语言模型反复发酵，...……更多

2024-03-23 11:48:00风口,概念,概念股,模型,概念,公司

马斯克新动向！365亿元

...前，Grok的最新版本为3月底发布的Grok 1.5，该版本实现了长上下文理解和高级推理能力，可以处理128K token的长上下文窗口。xAI官方博客表示：“对于构建能够理解世界的AGI（通用人工智能）来说，提高我们的多模态理解和生成能...……更多

2024-05-29 11:14:00马斯,马斯克,动向,马斯,马斯克,英伟

从AI搜索到语音陪练，腾讯元宝全面评测来了！大模型C端玩家谁

...答问题的准确率和速度。记者观察到，尽管元宝和GPT-4o的正确率相同，正确率都是75%，但两者的答题风格各有千秋。GPT-4o以简洁、直接和结构化的方式呈现答案，使用数学公式清晰地展示计算过程，迅速传达结果；而腾讯元宝则...……更多

2024-05-31 18:07:00腾讯,陪练,元宝,语音,模型,评测

OpenAI o1模型到博士水平了?复旦教授:没有真正推理能

...现。上述评测还显示，o1模型在MMLU Categories中的高数测试正确率高达98%，且在ML Benchmarks中的数学测试相较GPT-4o获得了超过34%的最大绝对性优势，足以显示o1模型是个数学超级“学霸”。 OpenAI还选择了专为美国最优秀的高中数学...……更多

2024-09-13 16:44:00复旦,相关性,概率,推理,模型,教授

OpenAI直播第二弹！奥特曼2024年最大惊喜竟来自字节？

...，他们设置了三个不同的评估指标，分别是Top-1（第一项正确率）、Top-5（前五项正确率）和Top-max（是否包含正确答案）。在Top-1指标中，o1 mini在约200条数据上的得分是17%。o1得到了25%，而微调后的o1 mini，得到了31%。ChatGPT就此生...……更多

2024-12-09 09:53:00奥特,奥特曼,字节,直播,惊喜,模型

本周AI不得了！OpenAI的Sora“模拟世界”、Gemi

...示质量令人着迷。总结：谷歌可能找到了某种新方法，将长上下文的架构理念与他们的 TPU 计算堆栈相结合，并取得了很好的效果。据 Gemini 长语境的负责人之一Pranav Shyam说，这个想法几个月前才刚刚萌芽。如果以小版本（v1.5）...……更多

2024-02-17 19:48:00上下文,新贵,上下,世界,模型,视频

以图灵机为师：通过微调训练让大语言模型懂执行计算过程

...生成代码并将其提交给外部 Python 执行程序以处理表格上下文中的数学问题。Wang et al. (2023) [5] 采用监督学习的方式让 LLM 学习如何通过构建用于解决数学问题的程序，而 Zhou et al. (2023) [6] 提出了一种零样本提示方法，以实现代码...……更多

2024-10-21 09:54:00灵机,模型,训练,过程,语言,运算符

趣丸科技副总裁兼CTO谢睿：多模态智能激发应用新场景 | 新

...两大技术手段。特定人群文本识别：采用单文本检测+上下文识别的方案。其中，单文本识别我们自研了通用的关键词匹配分析框架，支持多种匹配方式、支持自定义过滤条件、支持特殊标记等；上下文识别采用大模型进行复杂...……更多

2024-05-24 22:22:00模态,生产力,副总,场景,大会,智能

AI科学家太多，谁靠谱一试便知！普林斯顿新基准CORE-Be

...简单任务的准确率可以达到60%，最难任务准确率仅有21%大模型的能力越来越强，用户在一些重要的任务中也可以依赖大模型，比如说辅助做科研。不过现有科研辅助相关的基准测试都太简单，跟现实世界的任务差距还是比较大的...……更多

2024-09-26 13:38:00普林,普林斯顿,斯顿,准确率,基准,科学家

OpenAI o1 模型 PlanBench 规划能力实测：

...州立大学的科研团队利用 PlanBench 基准，测试了 OpenAI o1 模型的规划能力。研究结果表明 o1 模型取得了长足的进步，但仍然存在很大的局限性。PlanBench 基准简介PlanBench 开发于 2022 年，用于评估人工智能系统的规划能力，包括 600 ...……更多

2024-09-26 09:50:00准确率,实测,模型,能力,规划,模型

国产大模型加速落地，争夺“中国版ChatGPT”心智定位

...国版ChatGPT”心智定位。3月18日，月之暗面宣布在大模型长上下文窗口技术上取得新的突破，其自研的Kimi智能助手已支持200万字超长无损上下文，并开启产品内测。5月6日，Kimi进行大规模更新，推出全新的Kimi++功能。今年4月，科...……更多

2024-05-07 18:33:00心智,中国,落地,模型,定位,国产

Kimi开启大模型应用元年券商推荐万兴科技掌阅科技等龙头

...金证券表示,“在发展通用人工智能(AGI)的过程中,无损的长上下文将会是一个很关键的基础技术”,并进一步表示“长文本能力大幅升级,有望催化AI应用落地。”开源证券认为,“Kimi等AI产品持续迭代,AI应用商业化或加速。”华福证...……更多

2024-03-29 19:00:00万兴,科技,券商,龙头,模型,应用

科研也完了，AI暴虐170位人类专家！Nature子刊：大模

...如果大模型对预测结果表示具有高度自信时，回答结果的正确率也更高，也就是说，大模型完全可以辅助人类做科研新发现。最重要的是，这种方法并不特定于某一个学科，其他知识密集型任务上也可以使用。科研结果预测即使...……更多

2024-12-09 09:50:00暴虐,准确率,模型,高达,完了,科研

AGI一日要闻：台积电预测2040年GPU芯片性能提升100

...Grok。如今，马斯克更新到Grok 1.5模型。新一代模型实现了长上下文理解和高级推理能力，计划将在未来几天内向早期测试人员和 X 平台（前 Twitter）上的现有 Grok 用户提供。具体来说，首先，Grok-1.5 最明显的改进之一是其在代码...……更多

2024-03-31 04:00:00估值,美金,要闻,芯片,高达,性能

精准狙击Llama 3.1？Mistral AI开源Larg

...媲美。今年 2 月，Mistral AI 推出了最初的 Large 模型，其上下文窗口包含 32,000 个 token，新版模型在此基础上构建，具有更大的 128,000 个上下文窗口（大约相当于一本 300 页的书）—— 与 OpenAI 的 GPT-4o 和 GPT-4o mini 以及……更多

2024-07-26 09:36:00模型,基准,多语,测试,性能,生成