• 我的订阅
  • 头条热搜
京东云发布八大领先智算产品,助力企业火速用上大模型
...云DeepSeek大模型一体机,通过自研的算力池化能力、智能推理加速引擎,充分融合软硬件,实现了性能的全面提升,推理速度提升50%,企业可以根据自己的需求灵活选择不同版本,开箱即用。目前,在河南鹤壁、江苏宿迁、山东...……更多
对标OpenAI o1!Kimi发布新一代推理模型:中考高考考研全第一
...的Kimi国产大模型正式发布k0-math。k0-math是Kimi推出的首款推理能力强化模型,采用全新强化学习和思维链推理技术,通过模拟人脑的思考和反思过程,大幅提升解决数学难题的能力。据了解,在多项数学基准能力测试中,k0-math的...……更多
AI出图更快、更懂你心意,高美感文生图模型修炼了哪些技术秘籍?
...等工具如何为部署模型提供支持,助力大模型更加高效地推理。赵一嘉首先分享了 Stable Diffusion 背后模型的原理详解,细致地阐述了 Clip、VAE 和 Unet 等关键组件的工作原理。随着 Sora 爆火,也带火了背后的 DiT(扩散 Transformer)...……更多
加码“AI+编程教育”!商汤科技与编程猫达成战略合作
...。人工智能时代,编程已成为未来世界的通用语言、培养下一代创新者的关键工具。作为点猫科技旗下人工智能和编程教育品牌,编程猫面向全球青少年提供覆盖全年龄段和多种编程语言的线上课程、线下学习、赛事等考等服务...……更多
DeepSeek/o3的弱点找到了!三心二意 明明对了又改错了
DeepSeek和o1/o3一类推理大模型持续带来震撼之际,有人开始研究他们的弱点了。最新研究揭示:在遇到高难度问题时,推理大模型可能像“三心二意的学生”一样频繁切换解题思路,却因缺乏深入探索而失败——这种现象被研究...……更多
清华团队提出大模型“密度定律”;足球领域首个视觉语言基础模型
...交视觉-语言-动作建模框架RevThink:使用逆向思维增强 LLM 推理想要第一时间获取每日最新大模型热门论文? 点击阅读原文,查看「2024必读大模型论文」合集,以及申请加入「大模型技术分享群」。SwiftEdit:50 倍速文本引导图像...……更多
openai计划推出新型人工智能模型
...TadaoNagasaki)指出,尽管GPT-3与GPT-4的性能相差不大,但是下一代模型GPTNext预计将实现质的飞跃,其性能预计将提升100倍。 ……更多
阿里推出全新推理模型:仅1/21参数媲美DeepSeek R1
...况下,用强化学习实现了性能上的跨越。此外,阿里还在推理模型中集成了与Agent相关的能力,使其能够在使用工具的同时进行批判性思考,并根据环境反馈调整推理过程。QwQ-32B 在一系列基准测试中进行了评估,测试了数学推...……更多
文 | 周鑫雨编辑 | 邓咏仪36氪获悉,AI推理部署解决方案厂商“清昴智能”近日完成了数千万元Pre-A+轮融资,启赋资本、达晨财智领投,老股东奇绩创坛跟投。此前,清昴智能已获得某世界500强科技巨头公司的千万元战略投资。...……更多
对标o1,Kimi放出了最能打的国产模型
...历新一轮技术范式的变化,预训练 Scaling Law 放缓之后,推理时间计算成为了新的性能提升关键。两个月前,OpenAI o1 的诞生再次引领了大模型技术的突破。从后训练阶段入手,通过更多的强化学习、原生的思维链和更长的推理时...……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
新智元报道编辑:乔杨【新智元导读】LLM的数学推理能力缺陷得到了很多研究的关注,但最近浙大、中科院等机构的学者们提出,先进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准,并设计了一种...……更多
3天把Llama训成Mamba,性能不降,推理更快!
...Mamba模型,并且设计了新的推测解码算法,加速了模型的推理。先来看一张其乐融融的图片(一眼AI):右边的小羊驼代表Llama,而左边的蛇(Mamba)也是我们的老熟人了。至于到底能不能其乐融融,咱就不管了,之所以有此场景...……更多
英伟达没有慌,黄仁勋再谈DeepSeek:“推理”的计算需求可能增加上百万倍
...于DeepSeek、Grok、OpenAl等冲击,AI正在从感知和生成式AI向推理和逻辑推理领域发展。而推理AI又增加了一条扩展规律——增加训练的计算能力能让模型变得更智能,而增加深度思考的计算能力则能让答案更精准,与一次性推理相比...……更多
微软开源爆火1bit大模型推理框架!千亿参数模型量化后单CPU可跑
微软开源1bit大模型推理框架!现在1000亿参数大模型量化后单CPU可跑,速度可达每秒5-7个token。就是今年爆火论文The Era of 1-bit LLMs的官方代码实现,开源不到一周GitHub已揽获7.9k Star。传统大模型参数以16位浮点数(如FP16或BF16)形...……更多
...算效率和算力开销两大问题成为新的行业焦点。对大模型推理成本的优化,可通过很多技术手段实现。首先是模型本身,模型结构、训练方法都可以持续改进,包括业界很关注的MoE(混合专家模型),就是优化推理成本很好的解决...……更多
中兴通讯引领算力时代:投资智能计算基础设施与大模型训练推理
...于算力领域,并致力于智能计算基础设施、大模型的训练推理算法以及工程优化的研究和开发。#中兴通讯绿色算力主力军#在算力领域,大模型的技术和应用已经成为一个趋势。大模型是一种基于深度学习技术的自然语言处理模...……更多
唯一全国产算力训练!讯飞星火深度推理模型X1正式发布:多项指标国内第一
...天的新品发布会上,科大讯飞正式发布了具备深度思考和推理能力的星火深度推理模型X1,这也是目前唯一一个全国产算力上训练的深度推理模型。据介绍,与通用大模型相比,X1的解题过程更接近人类的“慢思考”方式,并且...……更多
谷歌最新自然语言推理算法
谷歌发布全新反向推理算法LAMBADA,无惧搜索空间爆炸!自动推理绝对算是自然语言处理领域的一大难题,模型需要根据给定的前提和知识推导出有效且正确的结论。尽管近年来NLP领域借着大规模预训练语言模型在各种「自然语...……更多
ChatGPT o1满血版上线!实测中它竟然败给了国产AI?
...特曼用一个简单的柱状图给出了对比:可以看到o1在数学推理和编程领域的表现要明显优于o1-preview,提升幅度在50%左右,而在科研领域的测试里,o1相对于o1-preview的表现就提升有限了。图源:OpenAI考虑到o1模型不需要额外加钱就...……更多
联想AI PC明年9月上市,黄仁勋苏姿丰同台宣布拓展AI合作
...各行各业的智能化转型,探讨如何设计、推动和重新定义下一代人工智能设备、基础设施、解决方案和服务,以加速为企业和消费者带来真正的人工智能驱动成果。联想Tech World 2023推出AI PC,明年9月上市,定位高端市场人工智能...……更多
Hugging Face发布SmolVLM开源 AI 模型:20 亿参数,用于端侧推理
...lVLM AI 视觉语言模型(VLM),仅有 20 亿参数,用于设备端推理,凭借其极低的内存占用在同类模型中脱颖而出。官方表示 SmolVLM AI 模型的优点在于体积小、速度快、内存高效,并且完全开源,所有模型检查点、VLM 数据集、训练...……更多
国产GPU万卡集群终于来了!摩尔线程CEO张建中:做难而正确的事
...换机芯片来搭建集群,后期也会考虑与合作伙伴共同研发下一代大规模交换机,持续发展卡间通信。 在框架和算法层面,夸娥万卡集群支持多种自适应混合并行策略与高效显存优化,可根据应用负载选择并自动配置最优的并行...……更多
...“小驰”的“聊天”将更加天马行空。“DeepSeek擅长逻辑推理,我们的DFM-2大模型具备跨多个专业垂直领域的综合大模型集合能力,能够学习和利用DeepSeek的逻辑推理能力,并基于在各个垂直领域的应用经验,多维度提升DFM大模型...……更多
DeepSeek V3小版本大升级:推理、前端开发加强 这些能力超越GPT-4.5
...级带来的性能提升却相当显著,特别是在前端开发、数学推理和上下文理解方面有了明显进步。据了解,新版V3模型借鉴DeepSeek-R1模型训练过程中所使用的强化学习技术,大幅提高了在推理类任务上的表现水平,在数学、代码类...……更多
语言≠思维,大模型学不了推理:一篇Nature让AI社区炸锅了
...到,人类大脑生成和解析语言的神经网络并不负责形式化推理,而且提出推理并不需要语言作为媒介。这篇论文声称「语言主要是用于交流的工具,而不是思考的工具,对于任何经过测试的思维形式都不是必需的」,引发了科技...……更多
Intel三条线优化阿里云通义千问2模型:720亿参数轻松拿捏
...。Intel还采用KV Caching、PagedAttention机制和张量并行,提高推理效率。Intel的硬件也可利用软件框架和工具包进行加速,并获得出色的大模型推理性能,包括PyTorch以及Intel PyTorch扩展包、OpenVINO工具包、DeepSpeed、Hugging F……更多
...基座大模型基础上,仅耗费数十美元就开发出相对成熟的推理模型。尽管其整体性能尚无法比肩美国开放人工智能研究中心(OpenAI)开发的o1、中国深度求索公司的DeepSeek-R1等,但此类尝试意味着企业可以较低成本研发出适合自...……更多
对着3个中国AI大模型,两个美国科技界大佬深聊了半小时
...前AI行业快速发展,竞争也越来越激烈,特别是各种高级推理模型之间的竞争。过去一段时间,中国科技公司陆续发布了3款自研的AI模型,分别是DeepSeek(深度求索)的Deepseek R1、阿里巴巴的Marco-1以及香港中文大学与商汤科技的...……更多
本文转自:人民网-安徽频道4月20日,科大讯飞深度推理大模型——讯飞星火X1迎来全新升级。作为当前业界唯一基于全国产算力训练的深度推理大模型,升级后的星火X1在数学、代码、逻辑推理、文本生成、语言理解、知识问答...……更多
首发!优刻得云平台上新DeepSeek-V3-0324模型
... 不仅将模型参数量由原版的671B提升至685B,编程、数学等推理思考能力大幅提升,性能表现可以与Claude3.5/3.7Sonnet相媲美。同时,模型的开源协议升级为更宽松的MIT许可,进一步降低了商业应用门槛。 优刻得云平台始终密切关注A...……更多
更多关于社会的资讯:
66岁的卢女士,20多年前左耳就“聋”了,当地医生说是慢性胆脂瘤型中耳炎反复发病导致的。不仅如此,卢女士的左耳还反复疼痛
2025-12-13 07:05:00
随着流感高发期的到来,发热、咳嗽、咽痛等症状人群显著增多。排队耗时漫长、交叉感染风险增加,成为许多患者就医时的困扰。杭州多家省市级医院纷纷推出便民举措
2025-12-13 07:36:00
当前流感活动上升明显,流感疫苗接种迎来高峰。近日,在上城区采荷街道社区卫生服务中心,接种市民明显增多,“家庭组团”前来接种的现象较突出
2025-12-13 07:36:00
12日,“浙江女性”英文网页上线,这是浙江省妇联继“浙里媒丽圈”后,向世界讲好浙里她故事的又一新平台,也是全国首个上线的地方妇联官方英文网站
2025-12-13 07:36:00
12日,“群星闪耀时 嘉兴醉江南——全国媒体名家大V嘉兴行”活动启幕。由人民日报、新华社、浙江日报、解放日报等中央和省市主流媒体记者
2025-12-13 07:36:00
吉网调查|高层楼道“堵堵堵”,“生命通道”如何畅通?
“我们家的楼道快被杂物堵死了,万一发生火灾,后果不堪设想!”近日,家住长春市二道区青阳华府高层的居民王先生向中国吉林网反映
2025-12-13 07:24:00
当今世界,文化软实力已成为国家综合实力的重要组成部分。“文化兴国运兴,文化强民族强。没有高度的文化自信,没有文化的繁荣兴盛
2025-12-12 16:20:00
在故事中听见医学回响 上海医生侯英勇分享从医之路
近日,中山医院女医师协会“品味云端·书香乐韵·叙事医学”特别活动,在上海朵云书院启幕。第一篇章“叙事的温度・在故事中听见医学的回响”
2025-12-12 16:22:00
当地政府回应“村支书卖小米被投诉” :已关注此事,正在调查;当事人多平台账号视频已清空
大皖新闻讯 近日,自称山东威海荣成市一村支书冯玉宽网上卖谷物小米,被小米公司法务“关联雷氏营销”投诉下架视频一事引发热议
2025-12-12 16:39:00
莒南二小开展“国家公祭日”主题班会活动
鲁网12月12日讯为传承和弘扬以爱国主义为核心的伟大民族精神,在第十二个国家公祭日来临之际,近日,莒南县第二小学组织各班级开展“国家公祭日”主题班会活动
2025-12-12 16:39:00
“一起遇见威海”2025年网络话题挑战赛颁奖活动举行
鲁网12月12日讯12月11日,“一起遇见威海”2025年网络话题挑战赛颁奖活动在威海市群众艺术馆举行。活动以“见热度”“见共鸣”“见温度”“见影响”“见未来”“见浪潮”六个篇章串联
2025-12-12 16:39:00
邯郸成安县老人上网遭多个平台“幽灵扣款” 银行成功追回
近日,邯郸市成安县一位老人名下账户莫名其妙被多个网络平台扣款,建行成安支行员工根据转账记录等相关证据,凭借专业知识和丰富经验
2025-12-12 16:40:00
大皖新闻讯 人工智能技术的快速发展,特别是以Deepseek为代表的国产大模型的广泛使用,已开始悄然改变我们的工作、生活
2025-12-12 16:42:00
暖心致谢!遵医附院神经外科二病区为患者拆除“颅内隐形炸弹”
多彩贵州网讯 “太感谢你们了!是你们延续了我母亲的生命!”12月12日,遵义医科大学附属医院神经外科二病区的医生办公室内暖意融融
2025-12-12 16:58:00
文化为媒聚合力,金融赋能启新程。12月10日,邮储银行张家港市支行应邀参与张家港市文化艺术业商会“志者恒进——迎新年文化雅集活动”
2025-12-12 17:11:00