灵机,模型,训练,过程,语言,运算符头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...此外，CAEF 具有高度的可扩展性，允许组合已经学习到的运算符，以降低复杂运算符的学习难度。评估表明，LlaMA 3.1-8B 模型配合 CAEF 可在 7 种经典数学算术运算的测试中实现了近乎 100% 的准确率，且能够支撑 100 位操作数的计算...……更多

2024-10-21 09:54:00灵机,模型,训练,过程,语言,运算符

PyTorch官宣：告别CUDA，GPU推理迎来Triton

...ompile与AMD flash attention内核的兼容性，我们需要自定义torch运算符，主要包括以下两步： 1. 将函数包装到PyTorch自定义运算符中2. 在运算符中添加一个FakeTensor Kernel，给定flash输入张量的形状（q、k 和 v），它可以提供一种计算f……更多

2024-09-07 09:48:00新时代,推理,内核,矩阵,乘法,英伟

Yann LeCun说自回归要完,DeepMind论文证明自

...通过外部记忆来增强 LLM，从而通过提示来实现对通用图灵机的模拟。但是，如果使用会将计算责任转移到语言模型之外的外部控制机制（尤其是正则表达式解析工具），则可能削弱这一结果。那无辅助的 LLM 是否能成为通用图灵...……更多

2024-10-09 09:50:00论文,图灵机,图灵,系统,模型,符号

如何理解纳维尔-斯托克斯方程？《张朝阳的物理课》详解流体的动

...而用上被张朝阳比喻为“牛刀”的张量语言后，这些运算过程将得到极大的化简。在微分几何与张量分析的表达中，矢量也被称为一阶张量。利用一组合适的基底，可以将其表达为逆变形式其中α=1,2,3是三个空间分量。这里沿袭...……更多

2024-10-28 17:12:00克斯,斯托,张朝阳,纳维尔,斯托克斯,纳维

Python数据分析入门教程：快速掌握核心技能

...尔值等。变量用于存储数据，可以是任意数据类型。运算符包括算术、比较、逻辑运算符等。控制流语句包括条件语句（if）、循环语句（for、while）等。掌握这些基础知识将为后续的数据分析打下坚实的基础。例如，您...……更多

2024-10-31 09:48:00入门教程,数据分析,技能,核心,教程,分析

Yandex推出开源大语言模型训练工具，称可节省高达20%的

...球科技公司Yandex推出了YaFSDP，这是一种用于训练大型语言模型(LLM)的开源方法。据介绍，YaFSDP是目前在大型语言模型训练中增强图形处理器（GPU）通信并减少内存使用量的公开可用的最有效工具，与FSDP相比，根据架构和参数数量...……更多

2024-06-18 16:13:00处理器,图形,模型,高达,训练,语言

百川智能发布baichuan3稳定语言模型

1月29日，百川智能发布超千亿参数的大语言模型Baichuan3。在多个权威通用能力评测如CMMLU、GAOKAO和AGI-Eval中，Baichuan3都展现了出色的能力，尤其在中文任务上更是超越了GPT-4。而在数学和代码专项评测如MATH、HumanEval和MBPP中同样表...……更多

2024-01-29 19:57:00百川,模型,语言,智能,模型,百川

古汉语大语言模型的构建及应用研究

... 青岛大学近年来，随着人工智能技术的飞速发展，语言模型在自然语言处理领域的应用愈加广泛。古汉语作为中国古代文化的重要载体，蕴含着丰富的历史信息和文化内涵，因此构建古汉语大语言模型具有重要的理论和实践意...……更多

2024-12-27 10:08:00古汉,模型,语言,应用,研究,古汉

湖南资兴：“运算符”筑牢安全“防护网”

...安全隐患，正是资兴市局（分公司）运用“加减乘除”“运算符”筑牢安全防线的生动缩影。今年以来，资兴市局（分公司）坚持“安全第一、预防为主、综合治理”的方针，将数学运算法则创新融入安全管理实践，通过培训做...……更多

2025-07-15 13:50:00资兴,运算符,防护网,湖南,运算,防护

CMU清华教LLM练成数学高手，LeanSTaR训练模型边思

...学生怎么办？CMU清华团队提出了Lean-STaR训练框架，在语言模型进行推理的每一步中都植入CoT，提升了模型的定理证明能力，成为miniF2F上的新SOTA。如果想训练LLM证明定理的能力，你会怎么做？既然模型可以通过海量语料学会生成...……更多

2024-08-10 09:47:00顶新,成数,清华,模型,训练,高手

Nature封面：AI训AI 越训越傻

...等学校机构的研究人员最新发现，使用合成数据训练，大模型可能会崩溃。其研究成果被选为最新的Nature封面。直接一个：GARBAGE OUT！要知道，现在绝大部分科技公司的大模型都在用合成数据来缓解“数据荒”。这下无疑是整个...……更多

2024-07-28 07:29:00封面,模型,误差,数据,训练,生成

迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测

...这是该团队在继 PMC-LLaMA 后，在持续构建开源医疗语言大模型的最新进展。该项目受到科创 2030—“新一代人工智能” 重大项目支持。在医疗领域中，大语言模型已经有了广泛的研究。然而，这些进展主要依赖于英语的基座模型...……更多

2024-09-30 09:51:00多语,大规,模型,语料,基准,大规模

9.11和9.9哪个大？实测12个大模型8个都答错，Chat

一道小学生难度的数学题难倒了一众海内外AI大模型。9.11和9.9哪个更大?就此问题，第一财经记者测试了12个大模型，其中阿里通义千问、百度文心一言、Minimax和腾讯元宝答对，但ChatGPT-4o、字节豆包、月之暗面kimi、智谱清言、...……更多

2024-07-17 11:56:00实测,模型,模型,数学,小数,问题

苹果300亿参数大模型首亮相，还买了家AI公司｜焦点分析

...武静静编辑｜邓咏仪放弃造车后的苹果，正在加速入局大模型战争。当地时间3月15日，苹果就披露了两个关键大模型动作。其中一个值得关注的是苹果的收购事件。彭博社报道称，苹果已经收购了一家加拿大AI初创公司DarwinAI。...……更多

2024-03-16 18:14:00模型,苹果,参数,焦点,分析,公司

首个o1复现开源RL框架OpenR来了，UCL、上交等高校联

...理教授（研究）杨林易。o1 作为 OpenAI 在推理领域的最新模型，大幅度提升了 GPT-4o 在推理任务上的表现，甚至超过了平均人类水平。o1 背后的技术到底是什么？OpenAI 技术报告中所强调的强化学习和推断阶段的 Scaling Law 如何实现...……更多

2024-10-15 09:56:00框架,团队,联合,模型,过程,步骤

让大模型能听会说,国内机构开源首个端到端语音对话模型Mini

...非与启元世界多模态负责人吴昌桥，研究兴趣为多模态大模型、LLM Agents 等。本论文上线几天内在 github 上斩获 1000+ 星标。随着多类型大模型的飞速发展，全球 AI 已经进入到了多模交互时代。2024 年 5 月，OpenAI 推出了全新的多模...……更多

2024-09-07 09:44:00模型,语音,对话,机构,语音,文本

全模态对齐框架align-anything来啦：实现跨模态指

...、张钊为、汪明志、钟伊凡等。团队就强化学习方法及大模型的后训练对齐技术开展了一系列重要工作，包括 Aligner（NeurIPS 2024 Oral）、ProgressGym（NeurIPS 2024 Spotlight）以及 Safe-RLHF（ICLR 2024 Spotlight）等系列……更多

2024-10-18 09:47:00模态,指令,框架,模态,模型,数据