• 我的订阅
  • 头条热搜
...需要结合快思考的‘黑盒’预测和慢思考的‘白盒’逻辑推理,打造‘灰盒’可信大模型。具体而言,通过融合科学规律、观测数据和合成数据,开发理解物理世界的垂直领域科学大模型。”作为本届大赛评委会主席,上智院院...……更多
重磅!TeleAI 完成首个全国产化万卡万参大模型训练
...型有效训练时长占比达到 98% 以上。TeleChat-52B在OpenCampass推理榜单排名第一在今年5月的 OpenCampass 测试榜单中,TeleChat 系列模型的逻辑推理能力名列开源大模型榜单第一。作为新一代版本,TeleChat2-115B 在9月最新公布的 C-Eval ……更多
位列第一梯队,腾讯混元再度领跑国内大模型
...维度的综合性测评基准,由十大基础任务组成,包括逻辑推理、代码、语言理解、长文本、角色扮演等。本次报告选取了国内外具有代表性的32个大模型4月份的版本,通过多维度综合性测评,真实准确地反映了国内外大模型在中...……更多
大模型“翻车”小学题?
...相关性,使得AI在文字创作上达到人类平均水平,而数学推理更需要的是因果性,数学是高度抽象和逻辑驱动的,与语言模型处理的语言数据在本质上有所不同。这意味着大模型要学好数学,除了学习世界知识外,还应该有思维...……更多
全面开源 浪潮信息发布千亿参数基础大模型“源2.0”
...51B(518亿)、2B(21亿)三种参数规模的模型,在编程、推理、逻辑等方面展示出了先进的能力。基础大模型的关键能力是大模型行业和应用落地能力表现的核心支撑。在算法、数据和算力等方面,“源2.0”提出了新的改进方法...……更多
“技术故障”背刺巴菲特,金融大模型到底靠不靠谱?
...市场瞬息万变,需要实时数据处理和决策支持,大模型的推理涉及到大量的矩阵乘法计算,对硬件的矩阵乘法计算能力提出较高要求,计算复杂性可能导致响应时间延迟,不利于实时应用。加之大模型训练和推理过程需要大量的...……更多
...AI)系统在编码、战略规划和机器人科学三个领域执行复杂推理任务。聊天生成预训练转换器(ChatGPT)和“克劳德3-奥普斯”(Claude 3 Opus)等大语言模型(LLM),根据人类输入“提示词”处理和生成文本。研究人员说,过去18个月,这些技...……更多
...大模型的超低价格引发行业震动。据悉,豆包主力模型的推理输入价格只有0.0008元/千Tokens,比行业便宜99.3%。对此,谭待坦言,“降价是用技术优化成本来实现的。如果只是补贴,用亏损换收入是不可持续的,火山引擎不会走这...……更多
整合长期记忆,AI实现自我进化,探索大模型这一可能性
...也能让模型在处理长期、分散和个性化的数据时逐步提升推理和学习能力。用 LTM 数据提升模型能力,使其能够自我进化在传统 LLM 中,更新模型通常需要调整所有参数,而如果目的是处理个体数据,那这种操作明显不切实际。...……更多
o1带火的CoT到底行不行?新论文引发了论战
...To CoT or not to CoT?OpenAI ο1 的诞生极大地提升了人们对 LLM 推理能力和思维链(CoT)的兴趣。一时之间,似乎思维链很快就会成为所有 LLM 的标配,但思维链并非万能,就连 OpenAI 自己也提到 o1 在某些任务上的表现并不比 GPT-4o 强...……更多
AI投资时间|绿洲资本张津剑:相比GPT技术本身,创业者更应该关注其对社会的影响
...烈烈的工业革命。也许国内的大模型和OpenAI 还差很远,推理成本还太高,芯片算力有不足,但对于绝大多数AI创业者来说,当前的这一切困难都是只是噪声。当下摩尔定律仍未失效,这些问题可以留给专业人士,18个月后这些成...……更多
清华团队提出大模型“密度定律”;足球领域首个视觉语言基础模型
...交视觉-语言-动作建模框架RevThink:使用逆向思维增强 LLM 推理想要第一时间获取每日最新大模型热门论文? 点击阅读原文,查看「2024必读大模型论文」合集,以及申请加入「大模型技术分享群」。SwiftEdit:50 倍速文本引导图像...……更多
英伟达最新技术分享:手把手教你用Llama 3.1合成数据改进模型!附代码
...05B开源巨兽Llama 3.1最近正式上线,既可用于批处理和在线推理,也可以作为基座模型,进行特定领域的专门预训练或微调。尤其是考虑到Llama 3.1有如此大的参数规模,加上丰富的15.6T token训练数据,非常适合用于数据生成。这篇...……更多
智能体不够聪明怎么办?清华&蚂蚁团队:让它像学徒一样持续学习
...出的巨大潜力,而这种潜力的核心基石正是智能体的复杂推理能力。与当下广受关注的 OpenAI-o1 及其追随者略有不同,大多数实用的 AI Agent 往往需要在特定场景下发挥作用。这种情况类似于普通人类:虽然不是每个人都需要具备...……更多
中国首个音乐SOTA模型「天工音乐大模型」今日公测
...全球最大的开源MoE大模型。「天工3.0」在语义理解、逻辑推理、通用性、泛化性、不确定性知识、学习能力等领域拥有突破性的性能提升,数学/推理/代码/文创能力提升超过30%。 (天工3.0模型参数超越Grok-1,成全球最大开源MoE...……更多
国产大模型真正角逐时刻:从钉钉智能客服开始谈起
...被设定了几个高频关键词,但一旦遇到稍难或者带些逻辑推理的问题时便无计可施。这是横亘在过去企业数字化最普遍同时也是最棘手的问题。一般来说,以往的智能客服的聪明程度往往取决于它背后有多少人工,你标记的关键...……更多
推理性能直逼o1,DeepSeek再次出手,重点:即将开源
...出手了,这次又是重磅炸弹。昨晚,DeepSeek 上线了全新的推理模型 DeepSeek-R1-Lite-Preview,直接冲击 OpenAI o1 保持了两个多月的大模型霸主地位。在美国数学竞赛(AMC)中难度等级最高的 AIME 以及全球顶级编程竞赛(codeforces)等权...……更多
腾讯开源最大MoE大语言模型!3D大模型同时支持文/图生成,晒混元模型及应用全家桶
...型,MoE模型在相同成本下效果更优,在相同规模下训练/推理成本更低,而且容量大,可训练更多数据。当前MoE的挑战有训练稳定性差、专家负载不均衡等。 一些应对方案包括:1)Scaling Law探索,设计基于中小模型簇的MoE Scaling ...……更多
云计算一哥终于搞多模态了:一口气6个大模型,还有个3nm芯片!
...mazon Nova Premier:亚马逊最强多模态大模型,可处理复杂的推理任务,也可用于蒸馏客户定制化的模型。在现场,Andy也晒出了Amazon Nova在CRAG、BFCL、VisualWebBench和Mind2Web等Benchmarks上取得的分数。从成绩中不难看出,其在检索增强……更多
依托数据、平台、知识增强等优势 夸克大模型降低问答幻觉率
...夸克大模型具备较好的语义理解、知识掌握与应用、逻辑推理能力。在大模型技术落地层面,夸克大模型的能力体现在四个方面,可以帮助用户提升工作、学习效率。知识能力,拥有广泛的知识覆盖、信息搜集和多语言支持等,...……更多
GPT-4o的识图能力有多牛?四大维度深度体验
...,准确率高达100%。图片来源:GPT-4o四、手写指令和逻辑推理最后,记者上了点难度,用手写的逻辑推理题来测试了GPT-4o的识图和逻辑推理能力。GPT-4o的回答堪称完美,不仅准确识别了手写体文字并遵照指示,且答题逻辑完全合...……更多
昆仑万维宣布开源2千亿稀疏大模型Skywork-MoE
...万维宣布开源2千亿稀疏大模型Skywork-MoE,性能强劲,同时推理成本更低。Skywork-MoE基于之前昆仑万维开源的Skywork-13B模型中间checkpoint扩展而来,是首个完整将MoE Upcycling技术应用并落地的开源千亿MoE大模型,也是首个支持用单台409...……更多
Llama3.1根本卖不动!业内人士:开源模型成本反而更高
...闭源的商业模型会配套相应的工具链,包括训练工具链、推理工具链,这些工具链的性能要比开源的好,对于客户来说,训练就能省大概10~20%的硬件成本,推理的时候省得更多,业务规模越大,省得越多。第二层,看模型带来的...……更多
突破时间序列组合推理难题!南加大发布一站式多步推理框架TS-Reasoner
【新智元导读】TS-Reasoner是一个创新的多步推理框架,结合了大型语言模型的上下文学习和推理能力,通过程序化多步推理、模块化设计、自定义模块生成和多领域数据集评估,有效提高了复杂时间序列任务的推理能力和准确性...……更多
语言≠思维,大模型学不了推理:一篇Nature让AI社区炸锅了
...到,人类大脑生成和解析语言的神经网络并不负责形式化推理,而且提出推理并不需要语言作为媒介。这篇论文声称「语言主要是用于交流的工具,而不是思考的工具,对于任何经过测试的思维形式都不是必需的」,引发了科技...……更多
算子开发到推理加速,一位00后开发者的“升级打怪”之旅
...框架降低了大模型训练的门槛,目前正在做大模型分布式推理加速,希望可以帮助其他开发者在生产环境中高效部署在线推理服务。在昇腾AI的生态里,像郑辉这样为大模型浪潮默默贡献自己力量的开发者不胜枚举。他们还不是...……更多
AI推理速度提升超10倍,Groq LPU能否取代英伟达GPU?
...美国人工智能初创公司Groq最新推出的面向云端大模型的推理芯片引发了业内的广泛关注。其最具特色之处在于,采用了全新的Tensor Streaming Architecture (TSA) 架构,以及拥有超高带宽的SRAM,从而使得其对于大模型的推理速度提高了1...……更多
清华团队提出新型光计算架构,光训练速度提升1个数量级
...了大规模智能计算的整个生命周期,开启了智能光计算的新时代。本次研究的完成,让人们看到了包括太极系列光芯片在内的智能光算力船帆的不懈航行,智能光计算平台终以解决 AI 算力所面临的问题为目标,将驶向 AI 算力的...……更多
Sora刷屏视频出现多处失误 模拟真实世界仍需闯关
...。中科深智创始人兼CEO成维忠表示,Sora因其并非严格的推理模型,目前还存在因果关系推理问题,但这个问题不是Sora自身的问题,而是目前所有类似模型均存在的问题,类似于大模型普遍存在的幻觉问题。未来会随着训练的加...……更多
黄仁勋对话Transformer七子:我们被困在原始模型里,还需要更强大的新架构
...其不断交互才能变得聪明,待在实验室里并不会造福世界推理是下一个重要的进步节点,能提升数据训练效率,产生更有价值的结果对话实录部分要点整理Transformer因何横空出世?Illia Polosukhin:如果要做出能真正读取搜索结果的...……更多
更多关于社会的资讯:
成功拦截!三明建宁公安为民止损16万元
民警迅速上门,开展拦截劝阻工作。东南网9月27日讯(通讯员 刘佳伟文/图)近日,建宁县公安局刑侦大队民警通过快速反应、深入研判
2025-09-27 10:22:00
甘肃定西市陇西县发生5.6级地震 震源深度10千米
中国网9月27日讯 据中国地震台网微博消息,经中国地震台网正式测定:9月27日05时49分在甘肃定西市陇西县(北纬34.91度,东经104.58度)发生5.6级地震,震源深度10
2025-09-27 06:44:00
第15届宋庄文化艺术季9月28日启幕 从“节”到“季”打造全域艺术盛宴
9月25日上午,秋季“运河上的通州”文旅专场新闻发布会在城市副中心召开,发布会集中推介了副中心文商旅体活动,在展示副中心秋季文旅新业态
2025-09-26 15:56:00
大皖新闻讯 9月26日,黄山风景区管委会发布公告称,为提高旅游舒适度与体验感,方便游客合理安排行程,将黄山风景区“十一”期间(10月1日—10月8日)开放运营时间对外公告
2025-09-26 16:02:00
光明乳业亮相WDCC2025,引领时尚生活与产业创新新风向
26日,由上海市人民政府主办、联合国教科文组织联合主办的2025世界设计之都大会(以下简称WDCC2025)在上海盛大开幕
2025-09-26 16:11:00
让真相传遍世界!电影《731》已开启全球上映
电影《731》自上映以来,总票房已突破13.8亿,累计观影人次3778万。这段黑暗历史不仅是中国人的伤痛,更是全人类文明的伤疤
2025-09-26 16:12:00
“胸闷、憋气、心慌症状有了明显好转,吃饭也香了,多亏了德广医院的医生护士!”近日,在德州德广医院住院已一周多的89岁患者王桂珍(化名)
2025-09-26 16:12:00
细微处见真情,平凡中显不凡——招商银行聊城分行服务纪实
在数字浪潮席卷的今天,我们常常谈论效率与便捷。然而,招商银行始终坚信,金融服务的本质,是人与人的连接,是心与心的沟通。它不应是冰冷的数字与流程
2025-09-26 16:12:00
近年来,随着我国社会经济全面绿色转型,有机固废热解技术成为推动"无废城市"建设、降低碳排放的关键支撑技术。恒誉环保作为该领域的领军企业
2025-09-26 16:26:00
大皖新闻讯 9月26日,大皖新闻记者从阜阳市有关部门获悉,为助力中秋国庆假期出行消费,阜阳市颍州区决定开展2025年“徽动消费 乐享阜阳”颍州区9月油品普惠性消费券发放活动
2025-09-26 16:39:00
济南市第七人民医院十佳青年医师崔志才:坚守在生命的最后防线
在重症监护病房里,时间常以秒计算,生命常以毫厘之差被挽回。凌晨两点,济南市第七人民医院重症监护室主治医师崔志才正参与又一场紧急抢救——患者意识丧失
2025-09-26 16:44:00
济南市五院大孔径CT导航技术守护双眼失明患者脊柱健康
齐鲁晚报·齐鲁壹点记者 郭蕊 通讯员 胡琪 王莹近日,一位52岁的双眼失明患者因“腰痛伴左下肢疼痛、麻木2月余”来到山东第二医科大学附属济南市第五人民医院骨一科求诊
2025-09-26 16:44:00
济南市第七人民医院十佳青年医师张红珠:内镜下的生命守护者
一头利落的短发,一张对待患者微笑的脸庞、一双紧紧盯着显示屏的双眸,正在细微的黏膜变化中,敏锐捕捉疾病的蛛丝马迹,十二年来始终坚守在消化道疾病诊治最前沿
2025-09-26 16:44:00
填补空白!植入式发音管在山东省第二人民医院成功应用
2025年9月21日,山东省第二人民医院(山东省耳鼻喉医院)完成了一台特殊的手术——山东省首例Provox植入式发音管植入术
2025-09-26 16:46:00
济南市七院十佳青年医师杨宁宁:十载医路守初心,青春笃行护安康
在神经医学的诊疗一线,有这样一位青年医师:她以精湛医术破解病痛难题,以温暖初心抚慰患者心灵,以十年坚守诠释医者担当。她就是“十佳医师”获得者
2025-09-26 16:46:00