• 我的订阅
  • 头条热搜
被DeepSeek带火的知识蒸馏 开山之作曾被拒:诺奖得主坐镇都没用
...看它的主创阵容。 Hinton,深度学习之父,如今已是诺奖得主。Oriol Vinyals,Google DeepMind研究科学家,参与开发的明星项目包括TensorFlow、AlphaFold、Seq2Seq、AlphaStar等。Jeff Dean,Google DeepMind首席科……更多
重磅!OpenAI o1模型还没有实现真正的逻辑推理能力
...其AI系统在今年国际数学奥林匹克(IMO)中首次取得与银牌得主同等的成绩, Anthropic在 6月推出了Claude 3.5 Sonnet模型,在推理、编码等测试中的得分也超过了GPT-4o,竞争对手的AI模型与o1差距并不远。三、AlphaGo模型借鉴OpenAI并没有公...……更多
超越YOLOv10/11、RT-DETRv2/3!D-FINE重新定义边界框回归任务
...传递,又可以保持一致的优化目标。新任诺贝尔物理学奖得主 Geoffrey Hinton 在《Distilling the Knowledge in a Neural Network》一文中提到:概率即 「知识」。FDR 将概率分布变成了网络输出,并搭载了定位知识 (Localization K……更多
OpenAI-o1思考替代法火了!焦剑涛高徒一作提出思考偏好优化
...论文一作为华人学者Tianhao Wu,导师之一是2011年清华特奖得主焦剑涛。团队提出了一种称作思考偏好优化(Thought Preference Optimization)的方法,能让模型像OpenAI-o1一样,通过内部“思考”输出更好答案,最终只显示结果,不展示思...……更多
国产模型指令跟随全球第一!来自LeCun亲推的最难作弊LLM新榜单
...SYS Chatboat Arena)那么广为人知,但资格杠杠的——图灵奖得主、Meta首席AI科学家杨立昆(Yann LeCun),联合纽约大学等在今年6月推出。号称是“全球首个无法作弊的LLM基准测试”。而这次冷不丁杀出来的黑马,其实比较熟悉国内...……更多
微美全息(NASDAQ:WIMI)将迁移学习引入到语义分割模型,实现高质量的语义分割任务
...习引入到语义分割模型中。迁移学习是一种通过利用已有知识来改善新任务学习性能的方法。在语义分割模型中,迁移学习可以通过从预训练的模型中初始化参数、共享特征提取器或者调整模型的学习率等方式来实现。这样可使...……更多
2023内容科技应用典型案例:农业银行大模型ChatABC
...述农业银行大模型ChatABC,对于大模型精调、提示工程、知识增强、检索增强、人类反馈的强化学习(RLHF) 等大模型相关新技术进行了深入探索和综合应用,结合农业银行研发支持知识库、内部问答数据以及人工标注数据等金融...……更多
大模型时代结束?大佬齐预测:AI模型或需先缩小规模,才能再次扩大规模
...地处理未曾见过的新问题和新任务,能够基于之前学到的知识进行合理的推测和回答,具有更强的泛化能力。再加上AI领域竞争激烈,各研究机构和巨头都致力于开发更大更强的模型,展示技术实力和领先地位,卷模型大小自然...……更多
百度CTO王海峰:文心大模型的底色和成色
...的准确性,文心大模型4.0在输入、输出两个阶段都运用了知识点增强,具体做法为在输入端对用户输入的问题进行理解,并拆解所需的知识点,然后在搜索引擎、知识图谱、数据库中获取准确知识,最后把得到的知识组装进prompt...……更多
与OpenAI o1技术理念相似,TDPO-R算法有效缓解奖励过优化问题
...套严格的评分标准(就像是奖励模型),目的是测试你的知识深度和理解能力。这套标准非常全面,涵盖了大量的知识点和难题,理论上应该能够准确衡量你的学习水平。 然而,你发现了一些 “捷径”:考试中虽然有很多问题...……更多
免训练大模型知识编辑,吸收新数据更高效|EMNLP\'24
让大模型能快速、准确、高效地吸收新知识!被EMNLP 2024收录的一项新研究,提出了一种检索增强的连续提示学习新方法,可以提高知识终身学习的编辑和推理效率。模型编辑旨在纠正大语言模型中过时或错误的知识,同时不需...……更多
天工skyagents助力大模型走入千家万户
...作系统模块的方式,实现执行包括问题预设、指定回复、知识库创建与检索、意图识别、文本提取、http请求等任务。在「天工SkyAgents」平台上,用户可以通过自然语言和简单操作,无需代码编程,即可在几分钟之内部署属于自...……更多
...算资源等成本只需几十美元。s1的核心创新在于采用了“知识蒸馏”技术和“预算强制”方法。“知识蒸馏”好比把别人酿好的酒进一步提纯。该模型训练数据是基于谷歌Gemini Thinking Experimental模型“蒸馏”出的仅有1000个样本的...……更多
摒弃人工标注,AutoAlign方法基于大模型让知识图谱对齐全自动化
..., Jianzhong Qi 等学者团队联合完成。该团队专注于大模型、知识图谱、推荐搜索、自然语言处理、大数据等方向的研究。知识图谱作为结构化知识的重要载体,广泛应用于信息检索、电商、决策推理等众多领域。然而,由于不同机...……更多
3天把Llama训成Mamba,性能不降,推理更快!
...(8B)。不过世界上有那么多成功的Transformer大模型,而知识就包含在这些模型参数里。如果能够锁住知识,同时把Transformer微调成Mamba,不就解决问题了?在本文中,研究人员结合渐进式蒸馏、监督微调(SFT)和定向偏好优化(D...……更多
百度神器!读英文论文 真的跟读中文没两样了
...之下,中国的科研力量越来越受到全世界的关注。图灵奖得主LeCun就在最新访谈中,肯定了来自中国团队的创新成果,并表示“世界上的任何地区都无法垄断好的创意”。那么,当语言的门槛进一步被技术所抹平,科研也将更加...……更多
CybotStar——大模型一站式应用开发平台
...型、创造复杂任务的Agent(智能体)、以及打造企业专属知识库。大模型一站式应用开发平台技术架构四大核心能力,助力拥抱生成式AI时代CybotStar的基础层由CPU、GPU、TPU等算力系统组成,为整个体系提供强悍的算力支撑,支撑...……更多
一文看懂AI结果优化(AIRO)和生成引擎优化(GEO)的区别
...nerativeEngineOptimization》,旨在通过优化内容的语义相关性、知识权威性及结构化呈现,提升其在生成式AI(如ChatGPT、Midjourney)中的可见性和引用权重,例如,优化后的内容更易被AI生成答案时引用,或在生成图片时关联品牌视觉元素。目标...……更多
鄂维南院士领衔新作:大模型不止有RAG、参数存储,还有第3种记忆
...记忆格式)来降低这一成本。从概念上讲,由于其大部分知识都外化为显式记忆,因而 LLM 可以享受更少的参数大小、训练成本和推理成本。论文地址:https://arxiv.org/pdf/2407.01178论文标题:Memory3 : Language Modeling with Explici……更多
青大附中、新世纪学校对接DeepSeek 跻身国内教育人工智能应用第一梯队
...方面,也将给学生更个性化的体验。比如,大模型可以对知识易错点、难点进行解析,针对每个学生的情况提出学习改进建议,并推荐符合目前状态的例题和范文;包含闯关游戏、双语对话等在内的思维发展模块,可以让学生在...……更多
2023世界成都科幻大会“当科技与科幻相遇”华为主题沙龙圆满落幕 
...果奖获得者Nnedi Okorafor,青年科幻作家、银河奖、星云奖得主分形橙子,华为昇思Mindspore开源生态总监胡晓曼等参与活动,并就未来科技,科幻和想象力等话题进行讨论。活动吸引了线上线下科幻迷和科技受众参与。当前,人类...……更多
类人神经网络再进一步!DeepMind最新50页论文提出AligNet框架:用层次化视觉概念「对齐」人类
...个可能导致AI模型与人类表现存在差异的原因:人类概念知识是从精细到粗尺度进行分层组织的,而深度学习模型表征无法捕捉到人类感知的多层次概念结构。论文链接:https://arxiv.org/pdf/2409.06509虽然说模型表征在一定程度上可...……更多
容联云QCon全球软件大会分享:大模型引领“营销服”创新实践
...机器人、智能客服机器人、客服坐席助手以及金融/产品知识问答领域,先落地偏工具化的产品,再结合容联云行业的knowhow以及实际业务场景,训练出具有行业属性的专业大模型助手。 大模型实践案例分享1、金融客服助手:提...……更多
中科大联合华为诺亚Entropy Law,揭秘大模型性能、数据压缩率
...基于质量的子集由所有三个优质样本组成,但它们编码的知识实际上是冗余和冲突的。相比之下,另一个由几个相对较低质量但多样化的样本组成的数据子集在教授 LLM 方面可能传达更多信息。因此,基于质量的数据选择并未完...……更多
洞见AI未来,图灵奖得主、王兴兴等发声!|直击2025外滩大会
...类数据红利正逼近极限 AI进入“经验时代”2024年图灵奖得主、“强化学习之父”理查德·萨顿(Richard Sutton)在会上表示, 人类数据红利正逼近极限,人工智能正在进入以持续学习为核心的“经验时代”,潜力将远超以往。萨顿...……更多
广西电网申请基于知识图谱的JointBERT模型电力营销数据查询专利,提高相关工作人员进行企业信息查询的效率
金融界2025年3月25日消息,国家知识产权局信息显示,广西电网有限责任公司申请一项名为“一种基于知识图谱的JointBERT模型的电力营销数据查询方法及系统”的专利,公开号CN 119669479 A,申请日期为2024年11月。专利摘要显示,...……更多
首个多模态连续学习综述,港中文、清华、UIC联合发布
...模态数据流,同时还要在连续学习中设法保留以前获得的知识。尽管传统的单模态 CL 与多模态 CL 之间存在联系,但多模态 CL 所面临的挑战并不仅仅是简单地将 CL 方法用于多模态数据。这种直接的尝试已被证明会产生次优性能...……更多
帝都、魔都双双押宝 年底了AI圈居然还有高手
...的人才圈儿,可能比差评君的朋友圈还小。就拿今年诺奖得主乔弗里辛顿来说,他这个深度学习之父的实验室,一向就是各大公司眼中的顶级宗门。像什么 OpenAI 联合创始人伊利亚,就是他的博士;谷歌 DeepMind 的大佬阿列克谢,...……更多
【数智化人物展】白鲸开源CEO郭炜:大模型助力企业大数据治理“数智化”升级
...关联,从而加速企业产生数据到数据产生信息最终转化成知识的效率,实现企业在数据管理方面全面数智化升级。智能化数据治理的目标是让数据自发现,最终实现业务部门的自服务,这个目标很美好,但是技术落地实践非常复...……更多
菲尔兹奖得主亲测GPT-4o,经典过河难题破解失败!最强Claude 3.5回答离谱,LeCun嘲讽LLM
...解决「狼-山羊-卷心菜」经典过河难题?最近,菲尔兹奖得主Timothy Gowers分享了实测GPT-4o的过程,模型在最简单的题目上竟然做错了,甚至网友们发现,就连Claude 3.5也无法幸免。在经典的「狼-山羊-卷心菜」过河问题上,如今所...……更多
更多关于科技的资讯:
基于“祖冲之2号” 中国科大首次实现量子体系高阶非平衡拓扑相
大皖新闻讯 11月28日,大皖新闻记者从中国科学技术大学获悉,该校潘建伟、朱晓波、彭承志、龚明等学者牵头合作,基于可编程超导量子处理器“祖冲之2号”
2025-11-28 12:52:00
摘要:品牌战略对于企业品牌形成和竞争力的提升有着不可替代的作用,随着市场竞争越来越激烈,品牌战略成为企业争夺市场的一个有力武器
2025-11-28 06:49:00
坚定信心 勇挑大梁·产业新亮点丨河北特色产业集群共享智造故事(二):技术创新共享给安平丝网带来了什么
技术创新共享给安平丝网带来了什么——河北特色产业集群共享智造故事(二)11月21日,安平县高新区绿色产业园区,河北丝筘金属制品有限公司车间里
2025-11-27 08:12:00
海底捞、阿嬷手作等品牌接入,顺丰同城“独享专送”餐饮品类单量同比激增3倍
随着即时零售市场的持续扩张和竞争深化,消费者对即时配送的需求正从“送达”向“送好”升级,推动即时配送加速服务分层,以准时
2025-11-27 08:16:00
风格各异的手作店、静谧雅致的咖啡馆、独具韵味的民宿……如今,在河北很多城市的街头巷尾,小店经济快速发展,在促进消费、扩大就业
2025-11-27 09:02:00
济南海尔第九届感恩月重磅启幕 以真心回馈亿万用户信赖
鲁网11月27日讯11月26日,济南海尔感恩月启动会拉开帷幕。以更加诚挚的福利、更具力度的优惠,回馈用户多年来的信赖与支持
2025-11-27 11:05:00
伽利略智能仿生四足防爆机器人EX-1重磅亮相2025中国国际应急管理展览会 开创高危环境智能作业新纪元
2025年11月18日至20日,以"新质赋能 智慧应急"为主题的2025中国国际应急管理展览会在北京国家会议中心隆重举办
2025-11-27 11:47:00
2026中国特许加盟展全年档期正式发布:两展三会贯通全年,全球特许盛宴即将启幕
由全国性行业组织中国连锁经营协会主办的中国特许加盟展公布2026全年展会规划,将继续采取全国巡展模式,以"两展三会"的形式贯通全年
2025-11-27 11:47:00
中新经纬11月27日电 题:机器人去景点“上班”,游客的快乐从哪里来?作者 周慎 中国科学技术大学科技传播系副研究员、徽州人工智能研究院院长近日
2025-11-27 12:15:00
执“碳”为尺 绘就绿色物流新图景
鲁网11月26日讯冬日清晨的泰山脚下,山东省泰安市烟草专卖局(公司)送货员刘婷正用扫码枪轻触循环周转箱上的智能芯片,“您瞧
2025-11-27 12:15:00
中新经纬11月27日电 国务院新闻办公室27日举行国务院政策例行吹风会,介绍增强消费品供需适配性进一步促进消费政策措施有关情况
2025-11-27 12:20:00
海外科技媒体Tech Times:AI助手“灵光”让难题处理“如清风拂面般轻松”
蚂蚁集团11月18日推出的全模态通用AI助手“灵光”在国内迅速出圈后,引发海外科技媒体和社交平台的关注。美国知名科技媒体《科技时代》(Tech Times)报道称
2025-11-27 14:32:00
华为新品发布会藏惊喜!来华为浏览器解锁资讯获取新方式
2025年11月25日,华为Mate 80系列|Mate X7及全场景新品发布会如期而至,这场科技盛宴备受瞩目。在首发搭载的HarmonyOS 6操作系统与Mate 80新机的双重赋能下
2025-11-27 14:41:00
胜者智选:全人成长新范式 锚定教育变革核心
从体质强健到能力培养,从AI融合到成本理性化,教育行业正迈向健康底色、核心能力、创新素养的全人培养新阶段。在此背景下,胜者教育旗下核心品牌“胜者智选”以生态化布局回应时代需求
2025-11-27 14:43:00
网易云音乐“AI写歌”功能上线测试 普通人也能“玩”音乐
近日,网易云音乐旗下网易天音“AI写歌”趣味功能上线测试,旨在用AI降低音乐创作门槛,帮助音乐人更好捕捉灵感创意的同时
2025-11-27 14:44:00