• 我的订阅
  • 头条热搜
京东云发布八大领先智算产品,助力企业火速用上大模型
...云DeepSeek大模型一体机,通过自研的算力池化能力、智能推理加速引擎,充分融合软硬件,实现了性能的全面提升,推理速度提升50%,企业可以根据自己的需求灵活选择不同版本,开箱即用。目前,在河南鹤壁、江苏宿迁、山东...……更多
对标OpenAI o1!Kimi发布新一代推理模型:中考高考考研全第一
...的Kimi国产大模型正式发布k0-math。k0-math是Kimi推出的首款推理能力强化模型,采用全新强化学习和思维链推理技术,通过模拟人脑的思考和反思过程,大幅提升解决数学难题的能力。据了解,在多项数学基准能力测试中,k0-math的...……更多
AI出图更快、更懂你心意,高美感文生图模型修炼了哪些技术秘籍?
...等工具如何为部署模型提供支持,助力大模型更加高效地推理。赵一嘉首先分享了 Stable Diffusion 背后模型的原理详解,细致地阐述了 Clip、VAE 和 Unet 等关键组件的工作原理。随着 Sora 爆火,也带火了背后的 DiT(扩散 Transformer)...……更多
加码“AI+编程教育”!商汤科技与编程猫达成战略合作
...。人工智能时代,编程已成为未来世界的通用语言、培养下一代创新者的关键工具。作为点猫科技旗下人工智能和编程教育品牌,编程猫面向全球青少年提供覆盖全年龄段和多种编程语言的线上课程、线下学习、赛事等考等服务...……更多
DeepSeek/o3的弱点找到了!三心二意 明明对了又改错了
DeepSeek和o1/o3一类推理大模型持续带来震撼之际,有人开始研究他们的弱点了。最新研究揭示:在遇到高难度问题时,推理大模型可能像“三心二意的学生”一样频繁切换解题思路,却因缺乏深入探索而失败——这种现象被研究...……更多
清华团队提出大模型“密度定律”;足球领域首个视觉语言基础模型
...交视觉-语言-动作建模框架RevThink:使用逆向思维增强 LLM 推理想要第一时间获取每日最新大模型热门论文? 点击阅读原文,查看「2024必读大模型论文」合集,以及申请加入「大模型技术分享群」。SwiftEdit:50 倍速文本引导图像...……更多
openai计划推出新型人工智能模型
...TadaoNagasaki)指出,尽管GPT-3与GPT-4的性能相差不大,但是下一代模型GPTNext预计将实现质的飞跃,其性能预计将提升100倍。 ……更多
阿里推出全新推理模型:仅1/21参数媲美DeepSeek R1
...况下,用强化学习实现了性能上的跨越。此外,阿里还在推理模型中集成了与Agent相关的能力,使其能够在使用工具的同时进行批判性思考,并根据环境反馈调整推理过程。QwQ-32B 在一系列基准测试中进行了评估,测试了数学推...……更多
文 | 周鑫雨编辑 | 邓咏仪36氪获悉,AI推理部署解决方案厂商“清昴智能”近日完成了数千万元Pre-A+轮融资,启赋资本、达晨财智领投,老股东奇绩创坛跟投。此前,清昴智能已获得某世界500强科技巨头公司的千万元战略投资。...……更多
对标o1,Kimi放出了最能打的国产模型
...历新一轮技术范式的变化,预训练 Scaling Law 放缓之后,推理时间计算成为了新的性能提升关键。两个月前,OpenAI o1 的诞生再次引领了大模型技术的突破。从后训练阶段入手,通过更多的强化学习、原生的思维链和更长的推理时...……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
新智元报道编辑:乔杨【新智元导读】LLM的数学推理能力缺陷得到了很多研究的关注,但最近浙大、中科院等机构的学者们提出,先进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准,并设计了一种...……更多
3天把Llama训成Mamba,性能不降,推理更快!
...Mamba模型,并且设计了新的推测解码算法,加速了模型的推理。先来看一张其乐融融的图片(一眼AI):右边的小羊驼代表Llama,而左边的蛇(Mamba)也是我们的老熟人了。至于到底能不能其乐融融,咱就不管了,之所以有此场景...……更多
英伟达没有慌,黄仁勋再谈DeepSeek:“推理”的计算需求可能增加上百万倍
...于DeepSeek、Grok、OpenAl等冲击,AI正在从感知和生成式AI向推理和逻辑推理领域发展。而推理AI又增加了一条扩展规律——增加训练的计算能力能让模型变得更智能,而增加深度思考的计算能力则能让答案更精准,与一次性推理相比...……更多
微软开源爆火1bit大模型推理框架!千亿参数模型量化后单CPU可跑
微软开源1bit大模型推理框架!现在1000亿参数大模型量化后单CPU可跑,速度可达每秒5-7个token。就是今年爆火论文The Era of 1-bit LLMs的官方代码实现,开源不到一周GitHub已揽获7.9k Star。传统大模型参数以16位浮点数(如FP16或BF16)形...……更多
...算效率和算力开销两大问题成为新的行业焦点。对大模型推理成本的优化,可通过很多技术手段实现。首先是模型本身,模型结构、训练方法都可以持续改进,包括业界很关注的MoE(混合专家模型),就是优化推理成本很好的解决...……更多
中兴通讯引领算力时代:投资智能计算基础设施与大模型训练推理
...于算力领域,并致力于智能计算基础设施、大模型的训练推理算法以及工程优化的研究和开发。#中兴通讯绿色算力主力军#在算力领域,大模型的技术和应用已经成为一个趋势。大模型是一种基于深度学习技术的自然语言处理模...……更多
唯一全国产算力训练!讯飞星火深度推理模型X1正式发布:多项指标国内第一
...天的新品发布会上,科大讯飞正式发布了具备深度思考和推理能力的星火深度推理模型X1,这也是目前唯一一个全国产算力上训练的深度推理模型。据介绍,与通用大模型相比,X1的解题过程更接近人类的“慢思考”方式,并且...……更多
谷歌最新自然语言推理算法
谷歌发布全新反向推理算法LAMBADA,无惧搜索空间爆炸!自动推理绝对算是自然语言处理领域的一大难题,模型需要根据给定的前提和知识推导出有效且正确的结论。尽管近年来NLP领域借着大规模预训练语言模型在各种「自然语...……更多
ChatGPT o1满血版上线!实测中它竟然败给了国产AI?
...特曼用一个简单的柱状图给出了对比:可以看到o1在数学推理和编程领域的表现要明显优于o1-preview,提升幅度在50%左右,而在科研领域的测试里,o1相对于o1-preview的表现就提升有限了。图源:OpenAI考虑到o1模型不需要额外加钱就...……更多
Hugging Face发布SmolVLM开源 AI 模型:20 亿参数,用于端侧推理
...lVLM AI 视觉语言模型(VLM),仅有 20 亿参数,用于设备端推理,凭借其极低的内存占用在同类模型中脱颖而出。官方表示 SmolVLM AI 模型的优点在于体积小、速度快、内存高效,并且完全开源,所有模型检查点、VLM 数据集、训练...……更多
联想AI PC明年9月上市,黄仁勋苏姿丰同台宣布拓展AI合作
...各行各业的智能化转型,探讨如何设计、推动和重新定义下一代人工智能设备、基础设施、解决方案和服务,以加速为企业和消费者带来真正的人工智能驱动成果。联想Tech World 2023推出AI PC,明年9月上市,定位高端市场人工智能...……更多
国产GPU万卡集群终于来了!摩尔线程CEO张建中:做难而正确的事
...换机芯片来搭建集群,后期也会考虑与合作伙伴共同研发下一代大规模交换机,持续发展卡间通信。 在框架和算法层面,夸娥万卡集群支持多种自适应混合并行策略与高效显存优化,可根据应用负载选择并自动配置最优的并行...……更多
...“小驰”的“聊天”将更加天马行空。“DeepSeek擅长逻辑推理,我们的DFM-2大模型具备跨多个专业垂直领域的综合大模型集合能力,能够学习和利用DeepSeek的逻辑推理能力,并基于在各个垂直领域的应用经验,多维度提升DFM大模型...……更多
DeepSeek V3小版本大升级:推理、前端开发加强 这些能力超越GPT-4.5
...级带来的性能提升却相当显著,特别是在前端开发、数学推理和上下文理解方面有了明显进步。据了解,新版V3模型借鉴DeepSeek-R1模型训练过程中所使用的强化学习技术,大幅提高了在推理类任务上的表现水平,在数学、代码类...……更多
语言≠思维,大模型学不了推理:一篇Nature让AI社区炸锅了
...到,人类大脑生成和解析语言的神经网络并不负责形式化推理,而且提出推理并不需要语言作为媒介。这篇论文声称「语言主要是用于交流的工具,而不是思考的工具,对于任何经过测试的思维形式都不是必需的」,引发了科技...……更多
Intel三条线优化阿里云通义千问2模型:720亿参数轻松拿捏
...。Intel还采用KV Caching、PagedAttention机制和张量并行,提高推理效率。Intel的硬件也可利用软件框架和工具包进行加速,并获得出色的大模型推理性能,包括PyTorch以及Intel PyTorch扩展包、OpenVINO工具包、DeepSpeed、Hugging F……更多
...基座大模型基础上,仅耗费数十美元就开发出相对成熟的推理模型。尽管其整体性能尚无法比肩美国开放人工智能研究中心(OpenAI)开发的o1、中国深度求索公司的DeepSeek-R1等,但此类尝试意味着企业可以较低成本研发出适合自...……更多
对着3个中国AI大模型,两个美国科技界大佬深聊了半小时
...前AI行业快速发展,竞争也越来越激烈,特别是各种高级推理模型之间的竞争。过去一段时间,中国科技公司陆续发布了3款自研的AI模型,分别是DeepSeek(深度求索)的Deepseek R1、阿里巴巴的Marco-1以及香港中文大学与商汤科技的...……更多
本文转自:人民网-安徽频道4月20日,科大讯飞深度推理大模型——讯飞星火X1迎来全新升级。作为当前业界唯一基于全国产算力训练的深度推理大模型,升级后的星火X1在数学、代码、逻辑推理、文本生成、语言理解、知识问答...……更多
首发!优刻得云平台上新DeepSeek-V3-0324模型
... 不仅将模型参数量由原版的671B提升至685B,编程、数学等推理思考能力大幅提升,性能表现可以与Claude3.5/3.7Sonnet相媲美。同时,模型的开源协议升级为更宽松的MIT许可,进一步降低了商业应用门槛。 优刻得云平台始终密切关注A...……更多
更多关于社会的资讯:
替主人还债的宠物猫二拍降至3600元起拍
大皖新闻讯 12月6日,大皖新闻记者从阿里资产平台看到,替主人还债的缅因猫二拍上架了,起拍价下降了900元,调至3600元起拍
2025-12-06 12:51:00
贵医大二院:医生仅用10秒钟,胎儿从“臀位”变成“头位”
多彩贵州网讯 12月4日,一位慕名而来的准妈妈,在贵州医科大学第二附属医院翁义院区妇产儿科,邂逅了一段短暂却满是暖意的奇妙体验
2025-12-06 12:02:00
河北沧州一小区被指向农地排水致树苗死亡
近日,河北沧州沧县纸房头镇南小营村村民何先生向海报新闻记者反映,其于9月29日至30日发现,当地碧桂园凤凰城项目私自将积水排放至相邻的农用地
2025-12-06 10:57:00
时政微纪录丨中法两国元首在成都进行友好交流
12月5日,国家主席习近平在四川省成都市都江堰同法国总统马克龙进行友好交流。初冬的都江堰,苍山掩翠。马克龙夫妇抵达时,受到习近平和彭丽媛热情迎接
2025-12-06 09:50:00
停课通知,杭州一个班18名孩子确诊!紧急提醒:高峰或将到来,95%以上是H3N2
每年秋冬都是流感高发季,近期,全国流感患病人数持续上升。中国疾控中心专家表示,预计全国流感在12月上中旬达峰的可能性较大
2025-12-06 09:19:00
长白时评评论员 唐小兰冰天雪地、粉雪飞扬,是吉林刻在大众心中的鲜明标识。当各地文旅项目陷入同质化竞争的内卷,当网红热度如流星般转瞬即逝
2025-12-06 06:07:00
在最近的复查中,46岁的王女士(化名)拿到了腹部CT和骨髓检查的正常报告,曾经缠身多年的乏力、反复发热、腹痛等不适彻底消失
2025-12-06 07:16:00
近日,王阿姨来到拱宸桥街道社区卫生服务中心拱北院区,将一面印有“医德高尚医术精,关爱病患暖人心”的锦旗送到她的签约医生中医师贾春霞的手中
2025-12-06 07:17:00
新华社杭州12月5日电 “10秒钟,让你画的小人儿在屏幕上动起来!”杭州市春晖小学的课堂上,授课教师齐传鹏话音刚落,学生们就迅速拿笔埋头创作
2025-12-06 07:17:00
广州43岁男子驾车时突发疾病失控,致4人受伤
12月5日,广州市公安局花都分局发布警情通报:12月5日17时47分,花都区花城北路发生一起交通事故,致4人受伤。接报后
2025-12-06 07:47:00
“外卖诗歌”架起中意文化桥梁 《下午三点》在罗马引共鸣
中国青年报客户端讯(中青报·中青网记者 谭思静 李超)12月3日,意大利时间12月2日19点30分,《“下午三点”——一首“外卖诗歌”的世界回响》分享会在意大利罗马9号中意经济文化交流中心举行
2025-12-06 05:53:00
灵隐飞来峰免票后 首个周末预约已满
记者 陈中秋 摄灵隐飞来峰景区从12月1日开始实行“实名预约、分时游览”免票预约制以来,每天都迎来大批市民和游客参观游览
2025-12-06 07:47:00
当代中国画作品展郑州启幕,高兰女士盛赞跨域艺术交融
2025年11月19日,“在东方丨画里中国——当代中国画作品展”在郑州美术馆(新馆)正式开幕。这场由广东省中国画学会、广东省美术家协会中国画艺委会
2025-12-05 15:55:00
散货船“华德858”轮航经台湾海峡途中触礁断裂
微信公众号“福州海事”消息,12月3日18时40分,福州市海上搜救中心接报,一艘散货船“华德858”轮在航经台湾海峡途中
2025-12-05 15:57:00
中国疾控中心:预计全国流感在12月上中旬达峰可能性较大
中国疾控中心病毒病所研究员王大燕12月5日在国家卫生健康委新闻发布会上表示,目前,全国共有17个省份流感处于高流行水平
2025-12-05 15:58:00