• 我的订阅
  • 头条热搜
以图灵机为师:通过微调训练让大语言模型懂执行计算过程
...此外,CAEF 具有高度的可扩展性,允许组合已经学习到的运算符,以降低复杂运算符的学习难度。评估表明,LlaMA 3.1-8B 模型配合 CAEF 可在 7 种经典数学算术运算的测试中实现了近乎 100% 的准确率,且能够支撑 100 位操作数的计算...……更多
PyTorch官宣:告别CUDA,GPU推理迎来Triton加速新时代
...ompile与AMD flash attention内核的兼容性,我们需要自定义torch运算符,主要包括以下两步: 1. 将函数包装到PyTorch自定义运算符中2. 在运算符中添加一个FakeTensor Kernel,给定flash输入张量的形状(q、k 和 v),它可以提供一种计算f……更多
Yann LeCun说自回归要完,DeepMind论文证明自回归能实现通用计算
...通过外部记忆来增强 LLM,从而通过提示来实现对通用图灵机的模拟。但是,如果使用会将计算责任转移到语言模型之外的外部控制机制(尤其是正则表达式解析工具),则可能削弱这一结果。那无辅助的 LLM 是否能成为通用图灵...……更多
如何理解纳维尔-斯托克斯方程?《张朝阳的物理课》详解流体的动力学
...而用上被张朝阳比喻为“牛刀”的张量语言后,这些运算过程将得到极大的化简。在微分几何与张量分析的表达中,矢量也被称为一阶张量。利用一组合适的基底,可以将其表达为逆变形式其中α=1,2,3是三个空间分量。这里沿袭...……更多
Python数据分析入门教程:快速掌握核心技能
...尔值等。 变量 用于存储数据,可以是任意数据类型。 运算符 包括算术、比较、逻辑运算符等。 控制流语句 包括条件语句(if)、循环语句(for、while)等。掌握这些基础知识将为后续的数据分析打下坚实的基础。例如,您...……更多
Yandex推出开源大语言模型训练工具,称可节省高达20%的图形处理器资源
...球科技公司Yandex推出了YaFSDP,这是一种用于训练大型语言模型(LLM)的开源方法。据介绍,YaFSDP是目前在大型语言模型训练中增强图形处理器(GPU)通信并减少内存使用量的公开可用的最有效工具,与FSDP相比,根据架构和参数数量...……更多
百川智能发布baichuan3稳定语言模型
1月29日,百川智能发布超千亿参数的大语言模型Baichuan3。在多个权威通用能力评测如CMMLU、GAOKAO和AGI-Eval中,Baichuan3都展现了出色的能力,尤其在中文任务上更是超越了GPT-4。而在数学和代码专项评测如MATH、HumanEval和MBPP中同样表...……更多
CMU清华教LLM练成数学高手,LeanSTaR训练模型边思考边证明,登顶新SOTA
...学生怎么办?CMU清华团队提出了Lean-STaR训练框架,在语言模型进行推理的每一步中都植入CoT,提升了模型的定理证明能力,成为miniF2F上的新SOTA。如果想训练LLM证明定理的能力,你会怎么做?既然模型可以通过海量语料学会生成...……更多
Nature封面:AI训AI 越训越傻
...等学校机构的研究人员最新发现,使用合成数据训练,大模型可能会崩溃。其研究成果被选为最新的Nature封面。直接一个:GARBAGE OUT!要知道,现在绝大部分科技公司的大模型都在用合成数据来缓解“数据荒”。这下无疑是整个...……更多
迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测试
...这是该团队在继 PMC-LLaMA 后,在持续构建开源医疗语言大模型的最新进展。该项目受到科创 2030—“新一代人工智能” 重大项目支持。在医疗领域中,大语言模型已经有了广泛的研究。然而,这些进展主要依赖于英语的基座模型...……更多
9.11和9.9哪个大?实测12个大模型8个都答错,ChatGPT也翻车了
一道小学生难度的数学题难倒了一众海内外AI大模型。9.11和9.9哪个更大?就此问题,第一财经记者测试了12个大模型,其中阿里通义千问、百度文心一言、Minimax和腾讯元宝答对,但ChatGPT-4o、字节豆包、月之暗面kimi、智谱清言、...……更多
苹果300亿参数大模型首亮相,还买了家AI公司|焦点分析
...武静静编辑|邓咏仪放弃造车后的苹果,正在加速入局大模型战争。当地时间3月15日,苹果就披露了两个关键大模型动作。其中一个值得关注的是苹果的收购事件。彭博社报道称,苹果已经收购了一家加拿大AI初创公司DarwinAI。...……更多
首个o1复现开源RL框架OpenR来了,UCL、上交等高校联合团队发布
...理教授(研究)杨林易。o1 作为 OpenAI 在推理领域的最新模型,大幅度提升了 GPT-4o 在推理任务上的表现,甚至超过了平均人类水平。o1 背后的技术到底是什么?OpenAI 技术报告中所强调的强化学习和推断阶段的 Scaling Law 如何实现...……更多
让大模型能听会说,国内机构开源首个端到端语音对话模型Mini-Omni
...非与启元世界多模态负责人吴昌桥,研究兴趣为多模态大模型、LLM Agents 等。本论文上线几天内在 github 上斩获 1000+ 星标。随着多类型大模型的飞速发展,全球 AI 已经进入到了多模交互时代。2024 年 5 月,OpenAI 推出了全新的多模...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...、张钊为、汪明志、钟伊凡等。团队就强化学习方法及大模型的后训练对齐技术开展了一系列重要工作,包括 Aligner(NeurIPS 2024 Oral)、ProgressGym(NeurIPS 2024 Spotlight)以及 Safe-RLHF(ICLR 2024 Spotlight)等系列……更多
人类和AI在推理任务中的表现相似,Google DeepMind研究揭示AI局限性
...,揭示了当前人工智能(AI),特别是大型Transformer语言模型(LMs)在推理任务中的表现及其局限性。研究结果显示,尽管这些模型在处理自然语言方面表现卓越,但在复杂逻辑推理任务中,人类和语言模型都会受到语义内容合...……更多
LeCun最新万字演讲:纯语言模型到不了人类水平,我们基本已放弃
...达到人类水平。他还透露,现在Meta基本已经放弃纯语言模型,因为,仅通过文本训练,永远不会达到接近人类水平的智能。除此之外,他还谈到当前大模型的局限性、以目标驱动的AI架构,包括利用世界模型进行推理和规划,最...……更多
大模型“翻车”小学题?
...——这样一道简单的“小升初”数学题难倒一众网友和大模型。上周五(7月12日)综艺《歌手2024》投票率出炉,孙楠以13.8%的投票率位居第三,Chanté Moore以13.11%的投票率排在第四。一位网友留言质疑“13.8%比13.11%高?”迅速引起热...……更多
文生图参数量升至240亿!Playground v3发布:深度融合LLM,图形设计能力超越人类
【新智元导读】Playground Research推出了新一代文本到图像模型PGv3,具备240亿参数量,采用深度融合的大型语言模型,实现了在图形设计和遵循文本提示指令上甚至超越了人类设计师,同时支持精确的RGB颜色控制和多语言识别。自...……更多
综合RLHF、DPO、KTO优势,统一对齐框架UNA来了
...Alignment。3. 黄灿:厦门大学数学系副教授随着大规模语言模型的快速发展,如 GPT、Claude 等,LLM 通过预训练海量的文本数据展现了惊人的语言生成能力。然而,即便如此,LLM 仍然存在生成不当或偏离预期的结果。这种现象在推...……更多
人工智能的偏见——基于全球大语言模型情商与智商偏见测试
...AGI-AIGC-GPT 评测 DIKWP(全球)实验室发布了全球大语言模型(LLM)情商(EQ)与智商(IQ)偏见测试。该测试旨在评估和比较国内外大语言模型分别在“男性”和“女性”视角下的智商和情商水平。(全球大语言模型(LLM)情商...……更多
英伟达最新技术分享:手把手教你用Llama 3.1合成数据改进模型!附代码
【新智元导读】适逢Llama 3.1模型刚刚发布,英伟达就发表了一篇技术博客,手把手教你如何好好利用这个强大的开源模型,为领域模型或RAG系统的微调生成合成数据。Epoch AI上个月刚刚发文,结果。真实数据稀缺可能不再是问题...……更多
OpenAI-o1思考替代法火了!焦剑涛高徒一作提出思考偏好优化
OpenAI-o1替代品来了,大模型能根据任务复杂度进行不同时间的思考。不限于推理性的逻辑或数学任务,一般问答也能思考的那种。最近畅销书《Python机器学习》作者Sebastian Raschka推荐了一项新研究,被网友们齐刷刷码住了。论文...……更多
苹果开源7B模型,训练过程数据集一口气全给了,网友:很不像苹果
苹果最新杀入开源大模型战场,而且比其他公司更开放。推出7B模型,不仅效果与Llama 3 8B相当,而且一次性开源了全部训练过程和资源。要知道,不久前Nature杂志编辑Elizabeth Gibney还撰文批评:许多声称开源的AI模型,实际上在...……更多
英伟达开源NVLM 1.0屠榜多模态!纯文本性能不降反升
【新智元导读】NVLM 1.0系列多模态大型语言模型在视觉语言任务上达到了与GPT-4o和其他开源模型相媲美的水平,其在纯文本性能甚至超过了LLM骨干模型,特别是在文本数学和编码基准测试中,平均准确率提高了4.3个百分点。文本...……更多
小模型正在成为AI界的新宠
大模型的发展已经进入了万亿级参数时代。DeepMind 联合创始人穆斯塔法・苏莱曼(Mustafa Suleyman)预测, 仅在未来三年内,大模型规模以惊人的速度继续扩张,将增长 1000 倍。一方面,模型的参数量与其能够处理和学习的复杂性...……更多
ICML2024演讲爆火!Meta朱泽园揭秘大模型内心世界:不同于人类推理
...稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com大语言模型 (LLM) 是如何解数学题的?是通过模板记忆,还是真的学会了推理思维?模型的心算过程是怎样的?能学会怎样的推理技能?与人类相同,还是超越了人类?只学一种类...……更多
免训练大模型知识编辑,吸收新数据更高效|EMNLP\\\'24
让大模型能快速、准确、高效地吸收新知识!被EMNLP 2024收录的一项新研究,提出了一种检索增强的连续提示学习新方法,可以提高知识终身学习的编辑和推理效率。模型编辑旨在纠正大语言模型中过时或错误的知识,同时不需...……更多
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...想要达成通用人工智能 AGI 的终极目标,首先要达成的是模型要能完成人类所能轻松做到的任务。为了做到这一点,大模型开发的关键指导之一便是如何让机器像人类一样思考和推理。诸如注意力机制和思维链(Chain-of-Thought)等...……更多
姚期智院士大模型新研究:思维图DoT,用数学理论确保AI逻辑一致
姚期智院士领衔,推出大模型新推理框架,CoT“王冠”戴不住了。提出思维图(DiagramofThought),让大模型思考更像人类。团队更是为这种推理过程提供了数学基础,通过拓扑斯理论(Topos Theory)正式化(formalize)DoT,确保其逻...……更多
更多关于科技的资讯:
型号为“2409BRN2CC”的小米Redmi新机已于11月14日获工信部电信设备进网许可,该设备支持双卡双待功能,“证件照”现已上线
2024-11-25 11:24:00
2024年11月25日GlobalInfoResearch调研机构发布了《2024年全球市场血管内多环圈套器总体规模、主要企业
2024-11-25 11:24:00
随着数字技术与实体经济不断融合,以数字化、智能化为表征的数智经济快速发展,成为消费扩容提质的重要力量。催生新业态、新模式
2024-11-25 11:25:00
大唐(Maxtang)现已在京东上架一款型号为“MAXN100”的迷你主机,该机搭载英特尔N100 处理器,可选准系统版本或“16GBRAM+512GB 存储空间版本”
2024-11-25 11:26:00
视频生成AI创企RunwayML今天推出了“ExpandVideo”新功能。用户可通过输入文本提示,在原始画面基础上生成额外内容
2024-11-25 11:27:00
羊曲水电站1号机组成功并网:建成年发电量达47.32亿千瓦时
快科技11月25日消息,据报道,国家电投集团黄河上游水电开发有限责任公司羊曲水电站第二台(1号)机组顺利通过72小时试运行
2024-11-25 11:29:00
无痕抗菌 加厚加绒!猫人无痕加绒保暖套装大促29.9元
天猫猫人经典内衣旗舰店,猫人无痕加绒保暖套装 ,官方大促叠加优惠卷和满减后,到手29.9元。男女11款可选,无痕抗菌,加厚加绒
2024-11-25 11:29:00
盖世小鸡官方昨日发文宣布,旗下超新星游戏手柄支持精英软件GameSirConnect 软件调参。除有线连接外,超新星手柄接收器升级固件后
2024-11-25 11:31:00
如何解读德国盖博牛奶分析仪的数据?-海谊科技
随着乳制品市场的不断扩大和消费者对产品质量要求的提升,乳制品的质量检测显得尤为重要。牛奶分析仪作为一种专业的理化检测设备
2024-11-25 11:31:00
瓦尔基里台式电脑机箱VK03-M现开启预售,该款机箱配备6.2英寸屏幕,拥有9风扇位,定价329元、首发价299元。据介绍
2024-11-25 11:32:00
博主 @熊猫很禿然今日曝光了荣耀300/Pro手机的续航规格以及外围参数,IT之家整理如下:荣耀300标准版:5300mAh电池+100W有线快充
2024-11-25 11:33:00
本文转自:人民网-广西频道近日,2024年自然资源卫星创新应用与技术体系建设交流会在南京召开,评选出自然资源卫星创新应用优秀案例
2024-11-25 11:33:00
2024年中国个护大会,海洋至尊荣获“2024年度个护大奖「影响力品牌」
随着消费者对个人护理需求的日益增长,洗护市场持续扩容,洗护产业正面临着前所未有的内卷挑战。2024年11月,由美妆头条主办的2024年第二届中国个护大会在广州成功举办
2024-11-25 11:33:00
凯叔讲故事亮相乌镇峰会未成年人网络保护论坛 内容创新护航未成年人成长
11月21日,2024年世界互联网大会乌镇峰会未成年人网络保护论坛在浙江乌镇举行。论坛围绕“数智时代保护未成年人的责任与挑战”主题
2024-11-25 11:33:00
航天彩虹昨日宣布,2024年11月15日,航天彩虹无人机股份有限公司彩虹-4无人机获得中国民航局颁发的国内首张大型民用无人驾驶航空器特殊适航证
2024-11-25 11:34:00