得主,知识,模型,目标,知识,训练头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...看它的主创阵容。 Hinton，深度学习之父，如今已是诺奖得主。Oriol Vinyals，Google DeepMind研究科学家，参与开发的明星项目包括TensorFlow、AlphaFold、Seq2Seq、AlphaStar等。Jeff Dean，Google DeepMind首席科……更多

2025-02-07 17:44:00得主,知识,模型,目标,知识,训练

重磅！OpenAI o1模型还没有实现真正的逻辑推理能力

...其AI系统在今年国际数学奥林匹克(IMO)中首次取得与银牌得主同等的成绩， Anthropic在 6月推出了Claude 3.5 Sonnet模型，在推理、编码等测试中的得分也超过了GPT-4o，竞争对手的AI模型与o1差距并不远。三、AlphaGo模型借鉴OpenAI并没有公...……更多

2024-09-18 15:01:00逻辑推理,重磅,推理,逻辑,模型,能力

超越YOLOv10/11、RT-DETRv2/3！D-FIN

...传递，又可以保持一致的优化目标。新任诺贝尔物理学奖得主 Geoffrey Hinton 在《Distilling the Knowledge in a Neural Network》一文中提到：概率即「知识」。FDR 将概率分布变成了网络输出，并搭载了定位知识 (Localization K……更多

2024-10-30 09:52:00边界,任务,检测,目标,边界,进一

OpenAI-o1思考替代法火了！焦剑涛高徒一作提出思考偏好

...论文一作为华人学者Tianhao Wu，导师之一是2011年清华特奖得主焦剑涛。团队提出了一种称作思考偏好优化（Thought Preference Optimization）的方法，能让模型像OpenAI-o1一样，通过内部“思考”输出更好答案，最终只显示结果，不展示思...……更多

2024-10-29 09:58:00高徒,偏好,模型,过程,基线,偏好

国产模型指令跟随全球第一！来自LeCun亲推的最难作弊LLM

...SYS Chatboat Arena）那么广为人知，但资格杠杠的——图灵奖得主、Meta首席AI科学家杨立昆（Yann LeCun），联合纽约大学等在今年6月推出。号称是“全球首个无法作弊的LLM基准测试”。而这次冷不丁杀出来的黑马，其实比较熟悉国内...……更多

2024-11-22 09:54:00指令,模型,国产,全球,模型,模态

微美全息（NASDAQ:WIMI)将迁移学习引入到语义分割模

...习引入到语义分割模型中。迁移学习是一种通过利用已有知识来改善新任务学习性能的方法。在语义分割模型中，迁移学习可以通过从预训练的模型中初始化参数、共享特征提取器或者调整模型的学习率等方式来实现。这样可使...……更多

2023-11-15 01:02:00语义,全息,高质量,模型,任务,学习

2023内容科技应用典型案例：农业银行大模型ChatABC

...述农业银行大模型ChatABC，对于大模型精调、提示工程、知识增强、检索增强、人类反馈的强化学习（RLHF）等大模型相关新技术进行了深入探索和综合应用，结合农业银行研发支持知识库、内部问答数据以及人工标注数据等金融...……更多

2024-04-08 17:06:00农业银行,典型案例,模型,典型,案例,银行

大模型时代结束？大佬齐预测：AI模型或需先缩小规模，才能再次

...地处理未曾见过的新问题和新任务，能够基于之前学到的知识进行合理的推测和回答，具有更强的泛化能力。再加上AI领域竞争激烈，各研究机构和巨头都致力于开发更大更强的模型，展示技术实力和领先地位，卷模型大小自然...……更多

2024-07-23 09:40:00大佬,模型,规模,再次,时代,模型

百度CTO王海峰：文心大模型的底色和成色

...的准确性，文心大模型4.0在输入、输出两个阶段都运用了知识点增强，具体做法为在输入端对用户输入的问题进行理解，并拆解所需的知识点，然后在搜索引擎、知识图谱、数据库中获取准确知识，最后把得到的知识组装进prompt...……更多

2023-10-19 05:50:00王海,王海峰,成色,底色,文心,模型

与OpenAI o1技术理念相似，TDPO-R算法有效缓解奖

...套严格的评分标准（就像是奖励模型），目的是测试你的知识深度和理解能力。这套标准非常全面，涵盖了大量的知识点和难题，理论上应该能够准确衡量你的学习水平。然而，你发现了一些 “捷径”：考试中虽然有很多问题...……更多

2024-10-26 09:48:00算法,奖励,理念,问题,技术,模型

$免训练大模型知识编辑，吸收新数据更高效｜EMNLP\'24$

免训练大模型知识编辑，吸收新数据更高效｜EMNLP'24

让大模型能快速、准确、高效地吸收新知识！被EMNLP 2024收录的一项新研究，提出了一种检索增强的连续提示学习新方法，可以提高知识终身学习的编辑和推理效率。模型编辑旨在纠正大语言模型中过时或错误的知识，同时不需...……更多

2024-10-30 09:57:00模型,训练,知识,数据,模型,知识

天工skyagents助力大模型走入千家万户

...作系统模块的方式，实现执行包括问题预设、指定回复、知识库创建与检索、意图识别、文本提取、http请求等任务。在「天工SkyAgents」平台上，用户可以通过自然语言和简单操作，无需代码编程，即可在几分钟之内部署属于自...……更多

2023-12-02 11:21:00力大,天工,千家,模型,天工,模型

全球科研团队竞逐低成本AI模型研发新范式

...算资源等成本只需几十美元。s1的核心创新在于采用了“知识蒸馏”技术和“预算强制”方法。“知识蒸馏”好比把别人酿好的酒进一步提纯。该模型训练数据是基于谷歌Gemini Thinking Experimental模型“蒸馏”出的仅有1000个样本的...……更多

2025-02-27 05:08:00范式,模型,科研,团队,成本,全球

摒弃人工标注，AutoAlign方法基于大模型让知识图谱对齐

..., Jianzhong Qi 等学者团队联合完成。该团队专注于大模型、知识图谱、推荐搜索、自然语言处理、大数据等方向的研究。知识图谱作为结构化知识的重要载体，广泛应用于信息检索、电商、决策推理等众多领域。然而，由于不同机...……更多

2024-07-27 09:28:00图谱,人工,模型,自动化,方法,知识

3天把Llama训成Mamba，性能不降，推理更快！

...（8B）。不过世界上有那么多成功的Transformer大模型，而知识就包含在这些模型参数里。如果能够锁住知识，同时把Transformer微调成Mamba，不就解决问题了？在本文中，研究人员结合渐进式蒸馏、监督微调（SFT）和定向偏好优化（D...……更多

2024-09-06 10:01:00推理,更快,性能,模型,输出,训练

百度神器！读英文论文真的跟读中文没两样了

...之下，中国的科研力量越来越受到全世界的关注。图灵奖得主LeCun就在最新访谈中，肯定了来自中国团队的创新成果，并表示“世界上的任何地区都无法垄断好的创意”。那么，当语言的门槛进一步被技术所抹平，科研也将更加...……更多

2025-03-13 06:50:00英文,神器,中文,论文,论文,模型

CybotStar——大模型一站式应用开发平台

...型、创造复杂任务的Agent（智能体）、以及打造企业专属知识库。大模型一站式应用开发平台技术架构四大核心能力，助力拥抱生成式AI时代CybotStar的基础层由CPU、GPU、TPU等算力系统组成，为整个体系提供强悍的算力支撑，支撑...……更多

2024-08-30 14:57:00应用开发,模型,应用,开发,平台,模型

一文看懂AI结果优化（AIRO）和生成引擎优化（GEO）的区

...nerativeEngineOptimization》,旨在通过优化内容的语义相关性、知识权威性及结构化呈现,提升其在生成式AI(如ChatGPT、Midjourney)中的可见性和引用权重,例如,优化后的内容更易被AI生成答案时引用,或在生成图片时关联品牌视觉元素。目标...……更多

2025-03-16 20:57:00一文,生成,引擎,结果,品牌,生成

鄂维南院士领衔新作：大模型不止有RAG、参数存储，还有第3种

...记忆格式）来降低这一成本。从概念上讲，由于其大部分知识都外化为显式记忆，因而 LLM 可以享受更少的参数大小、训练成本和推理成本。论文地址：https://arxiv.org/pdf/2407.01178论文标题：Memory3 : Language Modeling with Explici……更多

2024-07-11 09:33:00维南,领衔,院士,新作,模型,存储