• 我的订阅
  • 头条热搜
OpenAI发布最新技术研究,AI“黑盒”不再是难题!
...数字可能出现在版本号、股票代码、基金表现、汇率等上下文中,这些场景下的数字大小并不总是具有直接的比较意义。如果训练数据中存在关于数字比较的偏差或不足,模型可能无法学习到正确的比较规则。另一方面,可能由...……更多
检索总结能力超博士后,首个大模型科研智能体PaperQA2开源了
...索步骤对论文块进行排序,然后进行大模型重新排序和上下文摘要(RCS)步骤。 在回答 LitQA2 问题时,PaperQA2 平均每道题解析并使用 14.5 ± 0.6(平均值 ± SD,n = 3)篇论文。在 LitQA2 上运行 PaperQA2 可获得 85.2% ± 1.1%(平均值 ……更多
林达华谈大模型发展之路:未来会有更高效的模型结构出现
大模型的上下文长度快速增长,超长上下文解锁新应用,但推理计算代价高昂,上下文本身对于信息不会进行压缩,不能直接捕捉其中的深层知识和规律。上海人工智能实验室领军科学家林达华。过去一年,人工智能领域风起...……更多
大模型是否有推理能力?DeepMind数月前的论文让AI社区吵起来了
...一化。因此,模型输出对数概率。在动作 - 值预测中,上下文大小为 79,而在状态 - 值预测和行为克隆中,上下文大小为 78。对于动作和状态 - 值预测,输出大小为 ,对于行为克隆,输出大小为 1968(所有可能合法动作的数量)...……更多
infini-attention:谷歌大内存机制
...compressivememory)整合到线性注意力机制中,用来处理无限长上下文。压缩记忆允许模型在处理新输入时保留和重用之前的上下文信息。它通过固定数量的参数来存储和回忆信息,而不是随着输入序列长度的增加而增加参数量,能...……更多
CMU副教授:在多智能体流行的当下,不要忽视单智能体系统
...M 可能无法关注到重点,但随着模型能力提升,LLM 在确定长上下文中的重要信息方面越来越强了。 检索增强式提示:另一种可能的选择是使用检索。如同检索增强式生成(RAG)系统一样,可以出于效率或准确度的目的对长上下...……更多
Kimi引爆人工智能新风口,龙头连续20CM涨停!哪些公司可
...还会有新成果亮相。开启大模型应用新篇章事实上,无损长上下文是通往通用人工智能的基础技术,它也是业界一直以来的研究重点。从历史上看,模型架构的演进,本质上都是在提升有效的、无损的上下文长度。此次Kimi智能...……更多
用过GPT-4 Turbo以后,我们再也回不去了
...的 GPT。根据官方说法,这一波 GPT 的升级包括:更长的上下文长度:128k,相当于 300 页文本。 更高的智能程度,更好的 JSON / 函数调用。 更高的速度:每分钟两倍 token。 知识更新:目前的截止日期为 2023 年 4 月。 定制化:GPT3 1...……更多
AI赋能游戏:问答机器人的设计与实现
...所有这些向量建立索引,从而查询出与用户提问相关的上下文,最后创建一个带上下文的大语言模型提示语,让模型回答用户的查询。我们可以对比有无检索模型对回答的差别:大语言模型同样是ChatGPT3.5,提问“赵云要怎么培...……更多
《红楼梦》里有大量东北方言?实测AI大模型“长文阅读”
...简单。今年2月,谷歌发布的Gemini 1.5Pro模型曾一度创下最长上下文窗口的纪录。根据官方数据,谷歌Gemini1.5 Pro将上下文窗口容量提到了100万token(极限为1000万token)。这意味着机器可以一下子处理22小时的录音、超过十倍的完整...……更多
智谱AI发布基座大模型GLM-4,发起大模型开源基金
...长度内,GLM-4模型均可做到几乎100%的精度召回,并未出现长上下文全局信息因为失焦而导致的精度下降。在多模态能力方面,文生图和多模态理解得到增强。此外,GLM-4的All Tools能力(即Agent智能体能力)全新发布,GLM-4可自主根...……更多
...,通用人工智能创业公司Moonshot(月之暗面)宣布在大模型长上下文窗口技术上取得新的突破,其自研的Kimi智能助手(KimiChat)从2023年10月的20万汉字上下文能力,增长至200万字超长无损上下文。“近期非常火的AI语言模型反复发酵,...……更多
马斯克新动向!365亿元
...前,Grok的最新版本为3月底发布的Grok 1.5,该版本实现了长上下文理解和高级推理能力,可以处理128K token的长上下文窗口。xAI官方博客表示:“对于构建能够理解世界的AGI(通用人工智能)来说,提高我们的多模态理解和生成能...……更多
从AI搜索到语音陪练,腾讯元宝全面评测来了!大模型C端玩家谁更胜一筹?
...答问题的准确率和速度。记者观察到,尽管元宝和GPT-4o的正确率相同,正确率都是75%,但两者的答题风格各有千秋。GPT-4o以简洁、直接和结构化的方式呈现答案,使用数学公式清晰地展示计算过程,迅速传达结果;而腾讯元宝则...……更多
科大讯飞联手华为首次攻克全国产算力下推理模型训练难关
...译员的思维链路进行训练,具备实时意群理解和切分、上下文语境精准选词以及碎片化信息重组的能力,这一特性使得星火语音同传大模型在处理复杂句式和语境时表现出色,能够迅速准确地传达原意。技术测试结果显示,即便...……更多
OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性
...现。上述评测还显示,o1模型在MMLU Categories中的高数测试正确率高达98%,且在ML Benchmarks中的数学测试相较GPT-4o获得了超过34%的最大绝对性优势,足以显示o1模型是个数学超级“学霸”。 OpenAI还选择了专为美国最优秀的高中数学...……更多
OpenAI直播第二弹!奥特曼2024年最大惊喜竟来自字节?强化微调让o1-mini逆袭o1
...,他们设置了三个不同的评估指标,分别是Top-1(第一项正确率)、Top-5(前五项正确率)和Top-max(是否包含正确答案)。在Top-1指标中,o1 mini在约200条数据上的得分是17%。o1得到了25%,而微调后的o1 mini,得到了31%。ChatGPT就此生...……更多
本周AI不得了!OpenAI的Sora“模拟世界”、Gemini 1.5“10M上下文”、Mistral的开源新贵同日出现
...示质量令人着迷。总结:谷歌可能找到了某种新方法,将长上下文的架构理念与他们的 TPU 计算堆栈相结合,并取得了很好的效果。据 Gemini 长语境的负责人之一Pranav Shyam说,这个想法几个月前才刚刚萌芽。如果以小版本(v1.5)...……更多
以图灵机为师:通过微调训练让大语言模型懂执行计算过程
...生成代码并将其提交给外部 Python 执行程序以处理表格上下文中的数学问题。Wang et al. (2023) [5] 采用监督学习的方式让 LLM 学习如何通过构建用于解决数学问题的程序,而 Zhou et al. (2023) [6] 提出了一种零样本提示方法,以实现代码...……更多
趣丸科技副总裁兼CTO谢睿:多模态智能激发应用新场景 | 新质生产力·AI Partner大会
...两大技术手段。特定人群文本识别:采用单文本检测+上下文识别的方案。其中,单文本识别我们自研了通用的关键词匹配分析框架,支持多种匹配方式、支持自定义过滤条件、支持特殊标记等;上下文识别采用大模型进行复杂...……更多
AI科学家太多,谁靠谱一试便知!普林斯顿新基准CORE-Bench:最强模型仅有21%准确率
...简单任务的准确率可以达到60%,最难任务准确率仅有21%大模型的能力越来越强,用户在一些重要的任务中也可以依赖大模型,比如说辅助做科研。不过现有科研辅助相关的基准测试都太简单,跟现实世界的任务差距还是比较大的...……更多
OpenAI o1 模型 PlanBench 规划能力实测:准确率 97.8%
...州立大学的科研团队利用 PlanBench 基准,测试了 OpenAI o1 模型的规划能力。研究结果表明 o1 模型取得了长足的进步,但仍然存在很大的局限性。PlanBench 基准简介PlanBench 开发于 2022 年,用于评估人工智能系统的规划能力,包括 600 ...……更多
国产大模型加速落地,争夺“中国版ChatGPT”心智定位
...国版ChatGPT”心智定位。3月18日,月之暗面宣布在大模型长上下文窗口技术上取得新的突破,其自研的Kimi智能助手已支持200万字超长无损上下文,并开启产品内测。5月6日,Kimi进行大规模更新,推出全新的Kimi++功能。今年4月,科...……更多
Kimi开启大模型应用元年 券商推荐万兴科技掌阅科技等龙头
...金证券表示,“在发展通用人工智能(AGI)的过程中,无损的长上下文将会是一个很关键的基础技术”,并进一步表示“长文本能力大幅升级,有望催化AI应用落地。”开源证券认为,“Kimi等AI产品持续迭代,AI应用商业化或加速。”华福证...……更多
科研也完了,AI暴虐170位人类专家!Nature子刊:大模型精准预测研究结果,准确率高达81%
...如果大模型对预测结果表示具有高度自信时,回答结果的正确率也更高,也就是说,大模型完全可以辅助人类做科研新发现。最重要的是,这种方法并不特定于某一个学科,其他知识密集型任务上也可以使用。科研结果预测即使...……更多
AGI一日要闻:台积电预测2040年GPU芯片性能提升1000倍;Scale估值高达130亿美金
...Grok。如今,马斯克更新到Grok 1.5模型。新一代模型实现了长上下文理解和高级推理能力,计划将在未来几天内向早期测试人员和 X 平台(前 Twitter)上的现有 Grok 用户提供。具体来说,首先,Grok-1.5 最明显的改进之一是其在代码...……更多
精准狙击Llama 3.1?Mistral AI开源Large 2,123B媲美Llama 405B
...媲美。今年 2 月,Mistral AI 推出了最初的 Large 模型,其上下文窗口包含 32,000 个 token,新版模型在此基础上构建,具有更大的 128,000 个上下文窗口(大约相当于一本 300 页的书)—— 与 OpenAI 的 GPT-4o 和 GPT-4o mini 以及……更多
国内创业者和投资人如何看待 Figure 01 机器人:距离具身智能还有多远?
...应速度,与人自然交互。 另外,也用上了大语言模型的长上下文的理解能力,比如「你能把它们放到那里吗」,谁是「它们」,「那里」是哪里?这些只有大语言模型才有能力精准抓取长上下文里的指代关系。Figure 是否用到了...……更多
ICML2024演讲爆火!Meta朱泽园揭秘大模型内心世界:不同于人类推理
...,当在 op≤21 的题目上进行训练时,模型不仅能达到 99% 正确率,还能在更高难度的题目(如 op=32)上保持 83% 的正确率(见图 3)。这表明模型学会了某种推理技能,毕竟它从未见过 op>21 的题。(顺带一提,GPT-4o 在该数据集...……更多
清华UCSD提出全新微调方法,8B小模型媲美GPT-4o!科学问题正确率提高28%
【新智元导读】最近,一支来自UCSD和清华的研究团队提出了一种全新的微调方法。经过这种微调后,一个仅80亿参数的小模型,在科学问题上也能和GPT-4o一较高下!或许,单纯地卷AI计算能力并不是唯一的出路。我们都知道,在...……更多
更多关于科技的资讯:
以旧换新消费热!汇川区家电家居卖场客流倍增
多彩贵州网讯 春节期间,消费市场迎来旺季,汇川区紧跟国家步伐,借力消费品以旧换新补贴政策,在家电、家居、汽车等关键领域精准发力
2025-02-12 22:48:00
雷军要学叉车了 还号召同事一起学 组织叉车比赛
快科技2月12日消息,此前在12月31日晚间,雷军在跨年直播时表示,他曾经想过开叉车,被告知还需要专门的驾照。雷军当场立下flag
2025-02-12 22:50:00
网友馋哭了!小米食堂好吃还不贵:午餐、晚餐平均仅16元
快科技2月12日消息,今晚雷军开启了元宵节直播,两个多小时里,带大家逛了小米食堂,还品尝了食堂最有特色的美食。据了解,小米食堂一共11800平方米
2025-02-12 22:50:00
贵州超算赋能动画电影《哪吒2》| 实现艺术性与工业美学完美结合
2025年春节档的票房大战硝烟未散,一部以东方神话为底色的动画电影《哪吒之魔童闹海》(以下简称《哪吒2》)以雷霆之势横扫市场
2025-02-12 22:51:00
【观点摘登】许淑萍:深化科技创新,提升体育产业竞争力
加强科技创新是提升体育产业竞争力的关键。近年来,随着材料技术、人工智能、大数据等前沿科技与体育深度融合,体育产业科技含量越来越高
2025-02-12 22:51:00
买奥迪当嫁妆两个月无法提车 4S店:合格证在银行 所有车都卖不了
快科技2月12日消息,据报道,浙江绍兴周女士介绍,去年12月8日,家里人在绍兴宏奥4S店,花费22.6万多给她外甥女购买了一辆奥迪A4L
2025-02-12 19:19:00
2.7万条三文鱼“出逃” 海产品公司竟以每条325元悬赏抓捕
快科技2月12日消息,据媒体报道,近日,总部位于挪威的全球知名海产品公司美威正在重金悬赏抓捕“出逃”的2.7万条三文鱼
2025-02-12 19:19:00
美味的深海怪物!一鮟鱇鱼海面游泳被人类偶遇:着实罕见
快科技2月12日消息,在常年见不到阳光的海洋深处,其实也生活着不少的动物,其中大多数长相丑陋,毕竟也见不到什么人,就随便长长算了
2025-02-12 19:19:00
23岁小伙两个月减肥40斤致秃头:不吃任何碳水化合物
2月12日消息,据媒体报道,宁波一名小伙遇到了“脱发危机”。据小伙介绍,他体重200斤,决心依靠“管住嘴”来减重,几乎不碰油脂
2025-02-12 19:19:00
最高频率近3.3GHz!索泰RTX 5080 AMP EXTREME INFINITY评测:超频后与RTX 4090相去不远
一、前言:支持双BIOS的索泰RTX 5080次旗舰1月29日,RTX 5080正式解禁,在实际功耗比上代RTX 4080低了近10%的情况下
2025-02-12 19:49:00
山东登上《哪吒2》全国各省票房榜第一名 网友:山东人不语只是一味买票
2月12日消息,据媒体报道,截至2月12日11时,《哪吒2》全国各省份票房数据显示,山东登上全国第一位。对此,有网友表示
2025-02-12 19:49:00
ABC比基尼安睡裤卫生巾被抵制 官方回应:非新品 去年已停止生产
快科技2月12日消息,日前,ABC一款“比基尼安睡裤”卫生巾新品引发热议。有网友认为,该产品为“经期性感”牺牲舒适度,比基尼式还有偷工减料的嫌疑
2025-02-12 19:49:00
如何理解引力波效应?《张朝阳的物理课》推导测地偏离方程
上次物理课已讲完引力波的挤压模式和摇摆模式,本次物理课从测地线方程推导出弱场慢速近似下的形变方程。2月9日12时,《张朝阳的物理课》第二百三十三期开播
2025-02-12 19:56:00
江西定南:开足马力忙生产
本文转自:人民网-江西频道在生产车间内,智能“下片”机器人在抓取生产的光伏玻璃产品。近日,在位于定南县老城镇的赣悦新材料有限公司生产车间内
2025-02-12 20:04:00
雷军元宵节宴请SU7 Ultra车主 称不少宝马Mpower车主选择我们
快科技2月12日消息,雷军元宵节直播时宴请了几位小米SU7 Ultra车主。在得知该用户是宝马M5车主后雷军表示:“不少宝马Mpower车主选择我们”
2025-02-12 20:19:00