• 我的订阅
  • 头条热搜
鄂维南院士领衔新作:大模型不止有RAG、参数存储,还有第3种记忆
...记忆格式)来降低这一成本。从概念上讲,由于其大部分知识都外化为显式记忆,因而 LLM 可以享受更少的参数大小、训练成本和推理成本。论文地址:https://arxiv.org/pdf/2407.01178论文标题:Memory3 : Language Modeling with Explici……更多
人类和AI在推理任务中的表现相似,Google DeepMind研究揭示AI局限性
...中存在两种系统:“直觉系统”和“理性系统”,而已有知识和经验常常影响推理结果。研究表明,当面对合乎逻辑但不合常理的命题时,人们往往会错误地判定其无效。Google DeepMind的研究进一步揭示,大型语言模型也表现出类...……更多
...它根据网球运动员在比赛中的肢体语言识别其情感状态,准确率可达到人类观察者水平。德国卡尔斯鲁厄理工学院和杜伊斯堡-埃森大学研究人员在新一期人工智能领域学术期刊《知识系统》上发表论文说,他们使用真实的比赛...……更多
...国内现状是,人工智能技术已经覆盖语言、视觉、声音和知识图谱等领域,但存在基础技术积累不足、数据质量不高等诸多问题。随着图形处理和AI加速计算需求的不断涌现,国内AI芯片市场已呈现出“百花齐放”的发展态势,...……更多
大江东|亮点提前看,探营2024世界人工智能大会
...工智能大会上亮相。它可同时支持企业级千亿模型加速和知识检索硬件加速,实现本地化部署,即买即用,降低企业应用大模型的门槛。相比行业同类产品,其推理成本节约80%,检索大大加速,CPU工作负载50%。“简单而言,商汤...……更多
蚂蚁百宝箱智能体平台推出企业版,将向超1000家行业客户开放合作
...一键克隆复用;另一方面,平台通过低代码工作流、RAG 知识库、可视化评测中心,支持企业将私域知识与大模型快速结合,最快 1 天即可上线专属智能体。据透露,平台自去年启动行业智能体标准化战略以来,已在文旅行业率...……更多
“3D视频版Sora”来了!
...,用户可任意指定摄像机角度。目前,SV4D可以通过一次推理,在约40秒内生成8个视图的各5帧视频,整个4D优化需要20-25分钟。该模型已在Hugging Face上开源,适用于游戏开发、视频编辑、虚拟现实(VR)等场景的应用,可免费用于...……更多
遗憾不?百度早研究过Scaling Law,Anthropic CEO灵感都来自百度
...而且,「只需使用更多数据来训练更大的模型,就能提高准确率」已经成为一个共识。不过,百度想更进一步,分析训练集规模、计算规模和模型准确性提高之间的关系。他们认为,准确预测泛化误差随训练集规模扩大的变化规...……更多
3天把Llama训成Mamba,性能不降,推理更快!
...(8B)。不过世界上有那么多成功的Transformer大模型,而知识就包含在这些模型参数里。如果能够锁住知识,同时把Transformer微调成Mamba,不就解决问题了?在本文中,研究人员结合渐进式蒸馏、监督微调(SFT)和定向偏好优化(D...……更多
科学家推出大模型数据集,涵盖奥赛数学题,有望让AI辅导数学课程
...对 TriMaster100 这一数据集,该团队还绘制出一幅三角函数知识图(knowledge graph)。实验中,他们发现通过搜索知识图来提供相关的知识信息,可以有效提高大模型的推理水平。 即在解答一个数学问题时,如果可以提供一些高级...……更多
...算资源等成本只需几十美元。s1的核心创新在于采用了“知识蒸馏”技术和“预算强制”方法。“知识蒸馏”好比把别人酿好的酒进一步提纯。该模型训练数据是基于谷歌Gemini Thinking Experimental模型“蒸馏”出的仅有1000个样本的...……更多
突破遥感基础模型关键技术!我国科研人员研发出遥感智能训推一体机
...然而,遥感单幅影像幅宽大、基础模型参数规模大,导致推理速度与应用场景较为受限。近日,中国科学院空天信息创新研究院(空天院)科研团队基于自主研制的遥感智能解译基础模型,联合国内相关研发机构,共同研发出“...……更多
英伟达最新技术分享:手把手教你用Llama 3.1合成数据改进模型!附代码
...言模型要通过合成数据来微调模型,大致有两种方法——知识蒸馏(knowledge distillation)和自我改进(self-improvement)。知识蒸馏是将大模型的能力转移到较小模型的过程,但不是简单地在同一个数据集上训练两个模型,因为较小...……更多
...关影像辅助诊断信息,以提升阅片医生的工作效率和诊断准确率,减少漏诊和误诊。临床使用来看,肺结节良恶性AI预测评估判定准确率可达88.3%,能够帮助医生提高肺小结节、磨玻璃结节等检出。该院引入的冠状动脉计算机断...……更多
让大模型能听会说,国内机构开源首个端到端语音对话模型Mini-Omni
...交互能力的核心是模型能够直接在语音模态上进行理解和推理,这与传统的语音对话功能有本质的不同。现有的语音对话系统中主要包含 3 个过程:首先将输入语音内容转换为文本,其次利用大语言模型进行文本推理,最后利用...……更多
大江东|金融科技,服务创新——2024外滩大会观察(下)
...AI工程、数据、大语言模型、多模态大模型、具身智能、知识图谱、智能体、数字人、脑机接口、AI安全、图计算、绿色计算、密态计算等领域。观察2024外滩大会,有个感受很强烈:“蚂蚁”正在蜕变,“蚂蚁”们则越来越科技...……更多
DeepSeek“点燃”国产芯片 FP8能否引领行业新标准?
...然没有资本市场那么高亢。技术派更关注FP8在模型训练、推理及生态标准化上的实际价值与挑战。▍FP8是什么,有哪些提升?在AI训练与推理过程中,为提升计算效率,数值精度的降低是一个常见的技术路径。摩尔线程AI Infra总...……更多
科大讯飞申请推理方法相关装置及推理系统专利,具有较高的推理速度
金融界2025年5月6日消息,国家知识产权局信息显示,科大讯飞股份有限公司申请一项名为“一种推理方法、相关装置及推理系统”的专利,公开号CN119918679A,申请日期为2025年4月。专利摘要显示,本申请公开了一种推理方法、相...……更多
空天信息+人工智能 中国科研团队成功研发遥感智能训推一体机
...发成功一款命名为“空天·灵犀”的遥感智能训(训练)推(推理)一体机。“空天·灵犀”遥感智能训推一体机。中国科学院空天院 供图“空天·灵犀”遥感智能训推一体机搭载的高精度、高时效轻量化基础模型,能够在自然资源、...……更多
响应香港数字资产发展政策宣言 蚂蚁数科在港开放四大核心技术
6月30日,蚂蚁数科宣布面向香港市场开放四大自研技术——Layer2 网络、大模型开发工具、“区块链+IoT”可信架构、机构级 Web3 钱包技术,为香港建设全球数字资产创新中心提供全栈技术服务。这被看作蚂蚁数科对香港数字资产...……更多
独家专访Gary Marcus:Sora很神奇,但很多视频违背物理定律
...白地在互联网上抓取数据来训练模型的做法侵犯了他们的知识产权。版权问题是马库斯最关心的问题。他曾让主流人工智能图像生成工具制作出漫威电影的场景或著名角色,如小黄人,索尼克和《星球大战》的天行者达斯·维德...……更多
化学:强化归类研究 明确命题追求
...应速率与化学平衡、物质分离与提纯、绿色化学与环保等知识内容的考查情况,并提炼“浏览题干信息→关注转化阶段→明确小题设问→调用知识解答→规范准确做到”的解题流程等。高考试题的研究,还需结合课程标准、立足...……更多
全网最低价!百度智能云上线DeepSeek-R1/V3:还有限时免费
...限。此次上线的DeepSeek-R1和DeepSeek-V3模型已全面融合千帆推理链路,并集成百度独家内容安全算子,实现了模型的安全增强与企业级高可用保障。同时,平台支持完善的BLS日志分析和BCM告警功能,助力用户安全、稳定地构建智能...……更多
始于安全,不止安全丨迪普科技AI基座解决方案发布
...过可视化流程编排引擎实现零代码工作流配置,集成动态知识图谱实现上下文智能增强,并采用模块化插件架构支持外部工具的无缝接入,形成从业务逻辑抽象到系统落地的自动化闭环的智能体基座。同时创新性地采用“预训练...……更多
让大模型“外挂硬盘”,百川智能发布新API系列,企业定制成本大大降低
...段信息放在一段长文本中的任意位置,检测大模型的回答准确率如何。△“大海捞针”压力测试图目前,对于192k token以内的请求,百川智能可以实现100%回答精度。“我们的长窗口能够做到全绿,相当于能完全不遗漏地把192k里的...……更多
OpenAI 超强 o1 智商超 120 遥遥领先于其他模型:1 小时写出 NASA 博士 1 年代码,最新编程赛超越 99.8% 选手
...的 agent,是关键的一步。而这篇论文就重点研究了扩展「推理期计算」(inference-time computation)这个问题。研究团队分析了扩展测试时计算的两种主要机制:(1)针对密集的、基于过程的验证器奖励模型进行搜索;(2)根据测...……更多
山东移动全面接入DeepSeek,加速产业数智升级
...,山东移动基于DeepSeek构建了智能化办公矩阵,结合内部知识库及私域数据,实现PPT生成、AI绘图、视频创作、公文撰写等服务,显著提升员工工作效能。未来,山东移动将持续发挥自身优势,深化推动移动云、AI大模型与各类场...……更多
如何让大模型输出更精准、更可靠的结果?
...逻辑带来的天然缺陷,大模型的技术机理是,通过大量的知识训练,基于概率最大的原则生成答案。那么这就带来了几个问题,公开的数据库中往往缺乏真正有用的知识,大模型能学习到只是“皮毛”,由此生成的答案只能是泛...……更多
...与测试来看,检测缺陷等级可达专业人员识别水平,综合准确率98%以上,在未来有着广阔的应用前景。将“智能算法”进行到底类似的创新产品还有多项,公司cVector向量计算一体机通过算法+CPU代替GPU实现基于硬件加速的向量计...……更多
让港口更智能!山东港口发布《人工智能(大模型)总体建设规划》
...世界级海洋港口群。截至目前,山东港口已形成“基于‘知识+数据’混合驱动的全自动化集装箱码头智能管控系统”等十大人工智能创新成果,构建了阶段性创新优势。此次山东港口发布《规划》,把人工智能纳入港口发展战...……更多
更多关于科技的资讯:
鲁网12月17日讯(记者 杜方奇)在工业互联网与安全生产深度融合的背景下,枣庄联通积极响应国家推动制造业智能化、绿色化发展的号召
2025-12-18 10:08:00
dynabook效能之选TECRA A45-M:AMD锐龙芯赋能办公精英
在商务办公的疆场中,一台兼具稳定性能、可靠品质与高效体验的笔记本,是精英们破局攻坚的核心装备。dynabook作为深耕商务领域数十年的专业品牌
2025-12-18 10:08:00
厦门网讯(厦门日报记者 李晓平)昨日,市工信局党组成员、副局长上官峰做客市政府网在线访谈,深入介绍了我市人工智能产业的发展态势
2025-12-18 08:58:00
固安加速“屏”实力出圈
12月10日,固安县汉旗电子科技有限公司员工进行生产数据传输作业。固安县推动显示产业做强做精通过“龙头引领+全链配套+区域协同”三维驱动实现产业向生态集群跨越式发展为县域经济高质量发展注入强劲动能12月10日
2025-12-18 07:56:00
吴俊邑 海南师范大学体育学院摘要:随着素质教育的深入推进,高校体育教学面临着提升教学质量、激发学生运动兴趣的重要任务。趣味化教学模式作为打破传统体育教学枯燥性的有效手段
2025-12-18 06:38:00
崔福荣摘要:进度控制在国际工程项目管理中具有至关重要的作用,直接影响项目的工期、成本和合同履行效率。随着全球化和国际项目的增多
2025-12-18 06:38:00
云路协同杭州日报讯 钱塘区的清晨,吉利钱塘基地焊装车间里数百台机械臂精准舞动,不到两分钟就有一台智能新车下线;桐庐的乡村道路上
2025-12-18 06:53:00
“一人独角兽” 不再遥远!3个月,500份申请,27位“超级个体”入驻杭州日报讯 胡政涛带着一台电脑和他的项目,走进了杭州东站旁的融信中心13层
2025-12-18 06:53:00
发展新质生产力 推进新型工业化中国煤科太原研究院12月17日发布消息,该院自主研发的智能矿用干式除尘系统在宁夏煤业10余个矿井投用
2025-12-18 07:16:00
近日,在江苏常州220千伏淦西变电站与220千伏永和变电站,国网常州供电公司二次检修人员利用自主研发的“变电站站间电流互感器一次通流同步测试仪”
2025-12-17 23:18:00
AI 工具赋能品牌:开启全新增长引擎
因为Deepseek的流行,2025年被称作中国AI智能体元年。在这股AI浪潮之下,许多品牌建设者是既兴奋又焦虑,兴奋的是新变革意味着新机遇
2025-12-17 08:09:00
2025“平安财萌杯”全国总决赛在深落幕,携手11万大学生共赴财商成长之约
近日,2025“平安财萌杯”大学生财经素养大赛全国总决赛在深圳平安金融中心圆满举行。本届大赛自8月启动以来,共吸引了来自清华大学
2025-12-17 08:39:00
鲁网12月16日讯近日,经过数月的精心筹备,建行泰安分行营业部成功举办首场“商叶云贷”专题直播推介会。本次活动精准覆盖全市19000户烟草零售商户
2025-12-17 09:24:00
东南网12月17日报道(福建日报记者 黄星榕)买了乐高等大型积木却没有时间和耐心拼装,想吃家常菜却苦于时间不够、厨艺不精
2025-12-17 14:02:00
《威图可再生能源行业解决方案》发布:严苛环境下的设备应用指南
从零下45℃的严寒到零上50℃的炙烤,从沙漠风沙到海上盐雾……在能源转型的浪潮席卷全球之际,中国可再生能源产业正以令人瞩目的速度发展
2025-12-17 14:11:00