灵机,模型,训练,过程,语言,运算符头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...此外，CAEF 具有高度的可扩展性，允许组合已经学习到的运算符，以降低复杂运算符的学习难度。评估表明，LlaMA 3.1-8B 模型配合 CAEF 可在 7 种经典数学算术运算的测试中实现了近乎 100% 的准确率，且能够支撑 100 位操作数的计算...……更多

2024-10-21 09:54:00灵机,模型,训练,过程,语言,运算符

PyTorch官宣：告别CUDA，GPU推理迎来Triton

...ompile与AMD flash attention内核的兼容性，我们需要自定义torch运算符，主要包括以下两步： 1. 将函数包装到PyTorch自定义运算符中2. 在运算符中添加一个FakeTensor Kernel，给定flash输入张量的形状（q、k 和 v），它可以提供一种计算f……更多

2024-09-07 09:48:00新时代,推理,内核,矩阵,乘法,英伟

Yann LeCun说自回归要完,DeepMind论文证明自

...通过外部记忆来增强 LLM，从而通过提示来实现对通用图灵机的模拟。但是，如果使用会将计算责任转移到语言模型之外的外部控制机制（尤其是正则表达式解析工具），则可能削弱这一结果。那无辅助的 LLM 是否能成为通用图灵...……更多

2024-10-09 09:50:00论文,图灵机,图灵,系统,模型,符号

如何理解纳维尔-斯托克斯方程？《张朝阳的物理课》详解流体的动

...而用上被张朝阳比喻为“牛刀”的张量语言后，这些运算过程将得到极大的化简。在微分几何与张量分析的表达中，矢量也被称为一阶张量。利用一组合适的基底，可以将其表达为逆变形式其中α=1,2,3是三个空间分量。这里沿袭...……更多

2024-10-28 17:12:00克斯,斯托,张朝阳,纳维尔,斯托克斯,纳维

Python数据分析入门教程：快速掌握核心技能

...尔值等。变量用于存储数据，可以是任意数据类型。运算符包括算术、比较、逻辑运算符等。控制流语句包括条件语句（if）、循环语句（for、while）等。掌握这些基础知识将为后续的数据分析打下坚实的基础。例如，您...……更多

2024-10-31 09:48:00入门教程,数据分析,技能,核心,教程,分析

Yandex推出开源大语言模型训练工具，称可节省高达20%的

...球科技公司Yandex推出了YaFSDP，这是一种用于训练大型语言模型(LLM)的开源方法。据介绍，YaFSDP是目前在大型语言模型训练中增强图形处理器（GPU）通信并减少内存使用量的公开可用的最有效工具，与FSDP相比，根据架构和参数数量...……更多

2024-06-18 16:13:00处理器,图形,模型,高达,训练,语言

百川智能发布baichuan3稳定语言模型

1月29日，百川智能发布超千亿参数的大语言模型Baichuan3。在多个权威通用能力评测如CMMLU、GAOKAO和AGI-Eval中，Baichuan3都展现了出色的能力，尤其在中文任务上更是超越了GPT-4。而在数学和代码专项评测如MATH、HumanEval和MBPP中同样表...……更多

2024-01-29 19:57:00百川,模型,语言,智能,模型,百川

CMU清华教LLM练成数学高手，LeanSTaR训练模型边思

...学生怎么办？CMU清华团队提出了Lean-STaR训练框架，在语言模型进行推理的每一步中都植入CoT，提升了模型的定理证明能力，成为miniF2F上的新SOTA。如果想训练LLM证明定理的能力，你会怎么做？既然模型可以通过海量语料学会生成...……更多

2024-08-10 09:47:00顶新,成数,清华,模型,训练,高手

Nature封面：AI训AI 越训越傻

...等学校机构的研究人员最新发现，使用合成数据训练，大模型可能会崩溃。其研究成果被选为最新的Nature封面。直接一个：GARBAGE OUT！要知道，现在绝大部分科技公司的大模型都在用合成数据来缓解“数据荒”。这下无疑是整个...……更多

2024-07-28 07:29:00封面,模型,误差,数据,训练,生成

迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测

...这是该团队在继 PMC-LLaMA 后，在持续构建开源医疗语言大模型的最新进展。该项目受到科创 2030—“新一代人工智能” 重大项目支持。在医疗领域中，大语言模型已经有了广泛的研究。然而，这些进展主要依赖于英语的基座模型...……更多

2024-09-30 09:51:00多语,大规,模型,语料,基准,大规模

9.11和9.9哪个大？实测12个大模型8个都答错，Chat

一道小学生难度的数学题难倒了一众海内外AI大模型。9.11和9.9哪个更大?就此问题，第一财经记者测试了12个大模型，其中阿里通义千问、百度文心一言、Minimax和腾讯元宝答对，但ChatGPT-4o、字节豆包、月之暗面kimi、智谱清言、...……更多

2024-07-17 11:56:00实测,模型,模型,数学,小数,问题

苹果300亿参数大模型首亮相，还买了家AI公司｜焦点分析

...武静静编辑｜邓咏仪放弃造车后的苹果，正在加速入局大模型战争。当地时间3月15日，苹果就披露了两个关键大模型动作。其中一个值得关注的是苹果的收购事件。彭博社报道称，苹果已经收购了一家加拿大AI初创公司DarwinAI。...……更多

2024-03-16 18:14:00模型,苹果,参数,焦点,分析,公司

首个o1复现开源RL框架OpenR来了，UCL、上交等高校联

...理教授（研究）杨林易。o1 作为 OpenAI 在推理领域的最新模型，大幅度提升了 GPT-4o 在推理任务上的表现，甚至超过了平均人类水平。o1 背后的技术到底是什么？OpenAI 技术报告中所强调的强化学习和推断阶段的 Scaling Law 如何实现...……更多

2024-10-15 09:56:00框架,团队,联合,模型,过程,步骤

让大模型能听会说,国内机构开源首个端到端语音对话模型Mini

...非与启元世界多模态负责人吴昌桥，研究兴趣为多模态大模型、LLM Agents 等。本论文上线几天内在 github 上斩获 1000+ 星标。随着多类型大模型的飞速发展，全球 AI 已经进入到了多模交互时代。2024 年 5 月，OpenAI 推出了全新的多模...……更多

2024-09-07 09:44:00模型,语音,对话,机构,语音,文本

全模态对齐框架align-anything来啦：实现跨模态指

...、张钊为、汪明志、钟伊凡等。团队就强化学习方法及大模型的后训练对齐技术开展了一系列重要工作，包括 Aligner（NeurIPS 2024 Oral）、ProgressGym（NeurIPS 2024 Spotlight）以及 Safe-RLHF（ICLR 2024 Spotlight）等系列……更多

2024-10-18 09:47:00模态,指令,框架,模态,模型,数据

人类和AI在推理任务中的表现相似，Google DeepMi

...，揭示了当前人工智能（AI），特别是大型Transformer语言模型（LMs）在推理任务中的表现及其局限性。研究结果显示，尽管这些模型在处理自然语言方面表现卓越，但在复杂逻辑推理任务中，人类和语言模型都会受到语义内容合...……更多

2024-08-19 13:49:00局限性,推理,人类,任务,研究,模型

LeCun最新万字演讲：纯语言模型到不了人类水平，我们基本已

...达到人类水平。他还透露，现在Meta基本已经放弃纯语言模型，因为，仅通过文本训练，永远不会达到接近人类水平的智能。除此之外，他还谈到当前大模型的局限性、以目标驱动的AI架构，包括利用世界模型进行推理和规划，最...……更多

2024-10-18 09:42:00模型,人类,水平,语言,系统,模型

大模型“翻车”小学题？

...——这样一道简单的“小升初”数学题难倒一众网友和大模型。上周五(7月12日)综艺《歌手2024》投票率出炉，孙楠以13.8%的投票率位居第三，Chanté Moore以13.11%的投票率排在第四。一位网友留言质疑“13.8%比13.11%高？”迅速引起热...……更多

2024-07-18 16:39:00模型,小学,模型,小数,记者,南都

综合RLHF、DPO、KTO优势，统一对齐框架UNA来了

...Alignment。3. 黄灿：厦门大学数学系副教授随着大规模语言模型的快速发展，如 GPT、Claude 等，LLM 通过预训练海量的文本数据展现了惊人的语言生成能力。然而，即便如此，LLM 仍然存在生成不当或偏离预期的结果。这种现象在推...……更多

2024-10-10 09:56:00框架,优势,统一,综合,模型,奖励

文生图参数量升至240亿！Playground v3发布：深

【新智元导读】Playground Research推出了新一代文本到图像模型PGv3，具备240亿参数量，采用深度融合的大型语言模型，实现了在图形设计和遵循文本提示指令上甚至超越了人类设计师，同时支持精确的RGB颜色控制和多语言识别。自...……更多

2024-10-08 09:48:00文生,图形设计,深度,图形,人类,参数

人工智能的偏见——基于全球大语言模型情商与智商偏见测试

...AGI－AIGC－GPT 评测 DIKWP（全球）实验室发布了全球大语言模型（LLM）情商（EQ）与智商（IQ）偏见测试。该测试旨在评估和比较国内外大语言模型分别在“男性”和“女性”视角下的智商和情商水平。（全球大语言模型（LLM）情商...……更多

2024-01-04 13:54:00偏见,人工智能,情商,智商,人工,模型

英伟达最新技术分享：手把手教你用Llama 3.1合成数据改

【新智元导读】适逢Llama 3.1模型刚刚发布，英伟达就发表了一篇技术博客，手把手教你如何好好利用这个强大的开源模型，为领域模型或RAG系统的微调生成合成数据。Epoch AI上个月刚刚发文，结果。真实数据稀缺可能不再是问题...……更多

2024-07-30 09:38:00手把,英伟,最新技术,模型,代码,数据

OpenAI-o1思考替代法火了！焦剑涛高徒一作提出思考偏好

OpenAI-o1替代品来了，大模型能根据任务复杂度进行不同时间的思考。不限于推理性的逻辑或数学任务，一般问答也能思考的那种。最近畅销书《Python机器学习》作者Sebastian Raschka推荐了一项新研究，被网友们齐刷刷码住了。论文...……更多

2024-10-29 09:58:00高徒,偏好,模型,过程,基线,偏好

苹果开源7B模型，训练过程数据集一口气全给了，网友：很不像苹

苹果最新杀入开源大模型战场，而且比其他公司更开放。推出7B模型，不仅效果与Llama 3 8B相当，而且一次性开源了全部训练过程和资源。要知道，不久前Nature杂志编辑Elizabeth Gibney还撰文批评：许多声称开源的AI模型，实际上在...……更多

2024-07-23 09:33:00苹果,一口,模型,一口气,训练,过程

英伟达开源NVLM 1.0屠榜多模态！纯文本性能不降反升

【新智元导读】NVLM 1.0系列多模态大型语言模型在视觉语言任务上达到了与GPT-4o和其他开源模型相媲美的水平，其在纯文本性能甚至超过了LLM骨干模型，特别是在文本数学和编码基准测试中，平均准确率提高了4.3个百分点。文本...……更多

2024-09-24 13:36:00英伟,模态,文本,性能,模态,模型

小模型正在成为AI界的新宠

大模型的发展已经进入了万亿级参数时代。DeepMind 联合创始人穆斯塔法・苏莱曼（Mustafa Suleyman）预测，仅在未来三年内，大模型规模以惊人的速度继续扩张，将增长 1000 倍。一方面，模型的参数量与其能够处理和学习的复杂性...……更多

2024-06-24 09:42:00新宠,模型,正在,模型,参数,训练

ICML2024演讲爆火!Meta朱泽园揭秘大模型内心世界:

...稿邮箱：liyazhou@jiqizhixin.com；zhaoyunfeng@jiqizhixin.com大语言模型 (LLM) 是如何解数学题的？是通过模板记忆，还是真的学会了推理思维？模型的心算过程是怎样的？能学会怎样的推理技能？与人类相同，还是超越了人类？只学一种类...……更多

2024-08-06 09:27:00推理,模型,内心,人类,世界,模型

首个可保留情感的音频LLM！Meta重磅开源7B-Spiri

...元导读】Meta最近开源了一个7B尺寸的Spirit LM的多模态语言模型，能够理解和生成语音及文本，可以非常自然地在两种模式间转换，不仅能处理基本的语音转文本和文本转语音任务，还能捕捉和再现语音中的情感和风格。在纯文本...……更多

2024-11-23 09:43:00音频,模态,重磅,文本,任务,情感

$免训练大模型知识编辑，吸收新数据更高效｜EMNLP\'24$

免训练大模型知识编辑，吸收新数据更高效｜EMNLP'24

让大模型能快速、准确、高效地吸收新知识！被EMNLP 2024收录的一项新研究，提出了一种检索增强的连续提示学习新方法，可以提高知识终身学习的编辑和推理效率。模型编辑旨在纠正大语言模型中过时或错误的知识，同时不需...……更多

2024-10-30 09:57:00模型,训练,知识,数据,模型,知识

Bengio团队提出多模态新基准，直指Claude 3.5和

...想要达成通用人工智能 AGI 的终极目标，首先要达成的是模型要能完成人类所能轻松做到的任务。为了做到这一点，大模型开发的关键指导之一便是如何让机器像人类一样思考和推理。诸如注意力机制和思维链（Chain-of-Thought）等...……更多

2024-06-29 09:37:00模态,基准,弱点,团队,模型,任务

page 1/2667 首页上一页 12 3 4 5 6 下一页末页

更多关于科技的资讯：

京东11.11直播技术全面升级，立影3D技术、JoyAI大模

随着京东 11.11 大促的火热进行，京东直播再度升级技术布局，以 “立影 3D 技术”“JoyAI大模型”等创新技术

2025-10-27 15:39:00

电机能效提升领域再添标杆！25 项产品 / 技术入选全国节能

为深入贯彻国家 “双碳” 战略，加快电机领域节能降碳技术创新与成果转化，中国电子节能技术协会此前启动 “全国节能降碳示范产品 / 技术推荐” 征集工作

2025-10-27 15:42:00

吉刻现场｜硬核登场！吉林选手角逐第三届全国博士后创新创业大赛

10月26日，第三届全国博士后创新创业大赛在福建泉州（晋江）开幕。本届大赛，吉林省派出23个项目团队组成的参赛队伍角逐三个大赛道

2025-10-27 14:09:00

$厦心医院实现手术\$

厦心医院实现手术"跨洲同台" 全球首例跨国机器人心脏介入手术

厦门网讯（厦门日报记者楚燕通讯员许良友付磊刘云芳）10月23日，一项载入医学史册的创新手术在厦门大学附属心血管病医院（以下简称“厦心医院”）圆满完成

2025-10-27 08:11:00

新闻纵深·解码钢铁大模型｜邯钢构建六大领域全链条智能大模型：

邯钢构建六大领域全链条智能大模型“聪明大脑”带来极致能效编者按当钢铁遇上人工智能，一场“智变”正悄然发生。为生动展现人工智能为钢铁产业生产

2025-10-27 08:12:00

江苏规模最大，1400名软件工程师在宁“聚会”

第十一届NJSD软件开发者会议在软件谷举行江苏规模最大，1400名软件工程师在宁“聚会”南报网讯（记者于洁尘通讯员林园园）70多位业界“大咖”登台演讲

2025-10-27 08:20:00

南化公司首套除盐装置投用技术突破降本增效年可节约超500万

南报网讯（通讯员郑瑞于品华杨刚记者徐宁）近日，南化公司自主研发的橡胶防老剂中间产品RT培司（4-氨基二苯胺）除盐技术取得突破

2025-10-27 08:21:00

南林大携手乐惠国际共建智慧包装产业研究院

南报网讯（通讯员杨淏涵记者张希）日前，南京林业大学与乐惠国际南京基地签署《校企全面合作协议》《产业研究院共建协议》，全面开启校企战略合作

2025-10-27 08:22:00

高效，是都市青年的通行证：InstaShake以“一杯营养”

在生活节奏不断加速的上海，追求健康与追求效率似乎成为一道单选题。然而，新锐健康饮品品牌InstaShake正以其独特的“零添加

2025-10-27 08:39:00

济宁银行锚定金融“五篇大文章” 多维发力赋能区域经济高质量发

鲁网10月27日讯近年来，济宁银行围绕做好金融“五篇大文章”，深入洞察科技企业、中小微企业以及重点产业链金融需求，以产品创新破解融资难题

2025-10-27 11:07:00

量贩零食店，价廉味美才可能“长红”

汪昌莲据《经济日报》报道，“两三元就能买品牌饼干薯片”“上百种散装零食任意挑选”……从县城到乡镇，在街角与量贩零食店不期而遇已成逛街“标配”

2025-10-27 11:10:00

济南未来七天天气预报

受冷空气影响，气温先降后升，27日早晨气温较低。26日夜间到27日白天晴间多云，北风转南风2～3级，最低气温市区4℃左右

2025-10-27 11:28:00

2025青岛虚拟现实创新大会将启，雷神科技聚焦信创生态构建

鲁网10月27日讯虚实无界，智享未来。2025青岛虚拟现实创新大会即将在崂山区拉开帷幕。2017年以来，由崂山区成功承办的虚拟现实创新大会

2025-10-27 11:48:00

智能锁变“共享锁”？家门安全不能成虚设-中国吉林网

长白时评评论员唐小兰近日，北京一市民反映有陌生男子在她家中无人时，通过指纹解锁智能门锁多次进入她家。当事人焦女士告诉新京报记者

2025-10-27 13:38:00

生物制药工艺与设备发展新趋势研讨会举行

“生物制药工艺与设备发展新趋势研讨会”于10月16日下午举行，麦济生物、艾捷博雅科技、碧博生物等企业的代表，就生物制药工艺优化与设备选型提供了新思路与新方法。责编：卢思宇、姚凯红

2025-10-27 10:19:00

头条订阅服务