• 我的订阅
  • 头条热搜
最快的N卡和最快的A卡跑DeepSeek谁更快:RTX 5090比RX 7900 XTX快一倍
快科技2月2日消息,最快的N卡和最快的A卡跑DeepSeek谁更快?最新消息显示,RTX 5090在DeepSeek R上的推理性能比AMD的 RX 7900 XTX快得多,性能至少翻了一倍。测试显示,在多个DeepSeek R1型号中,RTX 5090明显领先于RX 7900 XTX,也比RTX……更多
腾讯元宝重磅更新:同时上线混元T1正式版+DeepSeek V3最新版
...T1正式版是腾讯自研的深度思考模型,主打的就是“推理更快,思维超强”。相比此前的T1 Preview,T1正式版更快了:能秒回、吐字速度更快,同时效果也更好了,推理能力进一步提升。长文处理方面,T1的进步也很大,面对几十...……更多
3天把Llama训成Mamba,性能不降,推理更快!
...实现方式在H100 GPU上不太好使,主要是因为GEMM操作的速度更快了,使得缓存和重新计算产生的开销更加明显。所以,作者通过融合内核以及调整实现方式来优化算法。对于验证模型,首先从缓存中重新计算之前的步骤,然后对新...……更多
真香!智谱大模型,有了首个免费的API
...。与此同时,GLM-4 支持了更长的上下文、更强的多模态、更快的推理速度,以及更多并发请求,大大降低了推理成本。在此基础上发展出的 GLM-4-Flash,则带来了一系列技术优势:数据预训练:引入大语言模型进入数据筛选流程,...……更多
苹果让大模型学会偷懒:更快吐出第一个token,准确度还保住了
... 需要大量计算。因此,即使 Prompt Compression 能让推理速度更快,但其实际的 TTFT 却比标准 LLM 还长。对总体生成速度的影响为了评估新方法对总体生成速度的影响,该团队分析了计算使用的 prompt token 百分比和生成加速情况,见...……更多
AI出图更快、更懂你心意,高美感文生图模型修炼了哪些技术秘籍?
...架构师赵一嘉,为我们深入剖析了文生图模型出图更美、更快、更懂用户心意背后的技术链路。直播开始,李亮首先详细拆解了近期国产大模型「顶流」—— 字节跳动豆包大模型在文生图模型方面的技术升级。李亮表示,豆包...……更多
英伟达展示blackwell平台,否认推迟上市
...发送给每一层的其他GPU,这就需要高带宽的GPU对GPU通信。更快的NVLINK交换机通过Blackwell,NVIDIA推出了速度更快的NVLINK交换机,将结构带宽提高了一倍,达到1.8TB/s。NVLINK交换机本身是基于台积电4NP节点的800mm2芯片,可将NVLINK扩展...……更多
商汤 AI 办公小程序“Raccoon 智能助手”上线:提炼文章重点
...4 日消息,商汤科技宣布,基于商汤“日日新 SenseNova”大模型能力开发的数据分析产品“办公小浣熊”今天正式上线小程序版 ——“Raccoon 智能助手”。官方表示,可在小程序中,直接插入微信聊天中的文件(xls / xlsx / csv / txt /...……更多
AI PC是噱头还是更快的马车?
...tra5125H包含7个。而且,这一代核显还支持AV1硬编码,可以更快速地输出高质量、高压缩率的视频。凭借领先的编解码能力,ArcGPU确实在视频剪辑行业积累的良好的口碑。随着矢量引擎能力的大幅度提升,大量内容创作ISV的演示了...……更多
DeepSeek/o3的弱点找到了!三心二意 明明对了又改错了
...IME2024测试上能提高6%-7%的准确率,比Consensus Decoding更好也更快。论文地址:https://arxiv.org/abs/2501.18585参考链接:[1]https://x.com/tuzhaopeng/status/1885179412163027406[2]https://x……更多
字节发布豆包1.5深度思考模型:“实拍级”图像生成
...火山引擎总裁谭待正式发布了备受瞩目的豆包1.5深度思考模型。谭待指出,豆包1.5深度思考模型在多个关键领域展现出卓越性能。在数学、编程、科学推理这类专业领域中,它能够精准高效地处理复杂问题;在创意写作等通用任...……更多
AI新时代揭幕!会“思考解题逻辑”的OpenAI推理大模型登场
...I o1-预览版外,OpenAI也同步推出了o1-mini模型。后者是一个更快、更便宜的模型,定价也会便宜80%,适用于需要推理但不需要广泛世界知识的场景。而且从OpenAI“抠抠索索”的举动来看,这个推理模型恐怕非常消耗算力。公司宣布...……更多
抽卡效率提升4.8倍!东北大学等开源优化版Stable-Diffusion.cpp:分辨率越高越快,生成质量更好
...及并行处理(动态分配计算任务并且提高运算并行度)。更快的速度,不仅节省时间,更让创作更自由!实例展示:更真实的生成效果下图展示了使用 SDXL-Turbo 模型,原版Sdcpp以及我们优化的Sdcpp使用5步采样,所生成的图像对比...……更多
成都人形机器人创新中心全国首发 R-DDIRM 高速推理模型
...型的 10 倍以上,这意味着人形机器人在执行任务时能够更快做出决策和反应,从而更有效地完成任务。据IT之家此前报道,今年 10 月底,成都人形机器人创新中心研发的人形机器人“贡嘎一号”(Konka-1)发布,该产品整机重量...……更多
更快、更强、更可控:智谱“起舞弄清影”,视频生成卷出新高度!
...也进一步推动AI普惠风。 一、智谱“清影”上线:速度更快、更为可控、画面更连贯速度上,智谱生成式视频模型的推理速度提升了6倍,生成6s视频只需花费30s,这意味着更快的创作周期、更高的实时性、更流畅的生成,以及...……更多
业界首款!中国联通发布元景思维链大模型:性能比肩OpenAI
...联通宣布,联通数据智能有限公司日前发布元景思维链大模型。目前,元景思维链模型已在GitHub、魔搭、始智等社区全面开源。作为央企首个开源的通用思维链大模型,元景思维链大模型既拥有强大慢思考能力,又具备不限于数...……更多
DeepSeek V3小版本大升级:推理、前端开发加强 这些能力超越GPT-4.5
快科技3月25日消息,今晚,DeepSeek官宣,DeepSeek V3模型已完成小版本升级。目前版本号为DeepSeek-V3-0324,用户登录官方网页、App、小程序进入对话界面后,关闭深度思考即可体验,API 接口和使用方式保持不变。虽然是小版本更新...……更多
文心大模型4.0 Turbo来了!百度推出文心快码2.5,已覆盖内部80%程序员
...成效果对比,在相同的提示词下,4.0 Turbo的生成速度明显更快,生成内容也更具条理性。在基础模型升级上,百度进一步研发了智能体(Agent)机制,包括理解、规划、反思和进化,使其能够可靠执行、自我进化,并一定程度上...……更多
黄仁勋:我从不在乎市场份额、英伟达唯一目标是创造新市场
...计方面有什么不同的策略?A:Intel的优势在于制造和设计更快的x86串行处理芯片,而Nvidia采取不同策略:在并行处理中,不需要每个晶体管都很出色我们更倾向于使用更多但较慢的晶体管,而不是更少但更快的晶体管宁愿有10倍...……更多
StableDiffusion原班人马新公司官宣!连发新模型刷新AI绘画格局
...是我们的最弱型号schnell,生成质量也更好,生成速度也更快。 主打一个我成立新公司超越我自己SD主要作者组团打造介绍完模型相关资料,是时候正式来认识一下这家新公司了。黑森林实验室,今天刚刚宣布成立。公司官网上...……更多
英伟达、微软、亚马逊三家美国巨头同日接入DeepSeek 网友实测:这是要成精!
...ce Microservices,是一种云原生微服务技术,可简化生成式AI模型在云端、数据中心及GPU加速工作站上的部署流程。英伟达官网发布文章指出,DeepSeek-R1是具备最先进推理能力的开放模型,比起直接提供响应,像DeepSeek-R1这样的推理...……更多
NeurIPS 2024|水印与高效推理如何两全其美?最新理论:这做不到
...这些草稿进行验证和修正。草稿模型规模较小,生成速度更快但质量较低;目标模型并行进行验证,接受符合条件的部分。这种方法可以在保持生成质量的同时,显著提升推理效率,降低计算成本,已成为大规模应用中不可或缺...……更多
广汽宣布加入DeepSeek!覆盖昊铂、传祺、埃安三大品牌
...2月8日,广汽集团宣布其自主研发的ADiGO SENSE端云一体大模型已与DeepSeek-R1大模型完成深度融合。这一融合预计将在今年上半年上线,并逐步覆盖昊铂、传祺、埃安三大品牌的系列车型,为车主提供创新的智能化服务。ADiGO SENSE通...……更多
NeurIPS 2024 | 数学推理场景下,首个分布外检测研究成果来了
...上海交通大学计算机系的二年级博士生,研究方向为语言模型生成、推理,以及可解释、可信大模型。该工作由上海交通大学和阿里巴巴通义实验室共同完成。论文题目:Embedding Trajectory for Out-of-Distribution Detection in Mathematical R……更多
硅谷大模型“价格战”上演,一味“卷”价格会有未来吗?
5月以来,国内大模型打响了“价格战”。从每百万个Token只要1块钱,到只要8毛钱、5毛钱……国内大厂如字节跳动、百度、智谱AI、科大讯飞等不断接力,有厂商甚至直接打出了“免费”的口号,震惊整个科技圈子。实际上,硅...……更多
联想发布端侧AI新技术 PC本地推理能力媲美 OpenAI-mini
...擎”对算力的提升,让设备的预填充更为迅速、解码速度更快、推理时间更短,同时占用内存更少,能耗更低,设备上的 AI 能力得到了大幅提升。联想集团董事长兼CEO杨元庆表示,很快大家就会在即将发布的下一代 AI PC 上体验...……更多
阿里发布全球最强开源模型千问3 通义App第一时间已上线
快科技4月29日消息,阿里新一代通义千问开源模型Qwen3(简称千问3),现已在通义App与通义网页版(tongyi.com)全面上线。用户可以第一时间在通义App和网页版中的专属智能体“千问大模型”,以及主对话页面,体验到全球最强...……更多
亚马逊连甩6款大模型!推出3nm AI训练芯片,最强AI服务器算力爆表
...,将4台Trn2服务器连接在一起,形成1台巨型服务器,实现更快的大模型训练和推理。单个Trn2实例结合了16颗Trainium2芯片,可提供20.8PFLOPS,适合训练和部署有数十亿个参数的大语言模型。全新EC2产品Trn2 UltraServer则将64颗Trainium2芯...……更多
阶跃星辰李璟:多模态是AGI的必经之路,视觉模型可按语言模型路线实现大一统
...璟发表主题演讲《迎接视觉领域的GPT-4时刻》,分享了大模型技术和应用层面的思考。他表示,今年以来大模型厂商密集的模型发布,意味着追求智能的上限仍然是当下最重要的事情。“我们始终认为多模态对AGI的实现非常重要...……更多
重磅!OpenAI o1模型还没有实现真正的逻辑推理能力
...-preview具有较强的推理能力和广阔的世界知识,o1-mini速度更快、比o1-preview便宜80%的推理模型,在编程方面尤其高效。但o1系列模型在关于世界的事实知识方面总体表现不佳,甚至不如GPT-4o等之前模型,需要更长时间、更高成本来...……更多
更多关于科技的资讯:
12月10日,公测仅23天月活突破3000万后,千问APP正以周为单位快速迭代,意在打造全能“办事”助手,即日起向所有用户首批开放AI PPT
2025-12-10 15:04:00
存量博弈下,潍柴如何用服务增值让客户体验与企业增长双向奔赴?
鲁网12月10日讯当发动机及装备制造业迈入存量竞争深水区,新能源与智能化技术加速迭代,客户需求越来越高,后市场服务早已超越了简单“售后服务”的范畴
2025-12-10 11:25:00
杭州造火箭了!最快明年首飞,“半小时全球直达”
火箭不仅可以向太空发射卫星,还可以送洲际快递,甚至可以建造太空城实现“太空旅居”?这个听起来充满未来感的愿景,正在杭州迈出第一步
2025-12-10 12:19:00
望海康信荣膺国家级专精特新“小巨人”企业称号
近日,望海康信(北京)科技股份公司成功入选北京市第七批专精特新“小巨人”企业名单,荣获由工业和信息化部认定的国家级专精特新“小巨人”企业称号
2025-12-10 12:05:00
图达通港股上市,黄山市深度投资,助力汽车产业升级发展
大皖新闻讯 2025年12月10日,全球顶尖激光雷达制造商图达通正式在香港联合交易所挂牌上市,截至上午10点30分,涨幅50%
2025-12-10 11:32:00
大皖新闻讯 屏幕,作为用户感知数字世界的核心窗口,其进化正迈向关键阶段。随着AMOLED技术加速向笔记本电脑、车载等中大尺寸应用渗透
2025-12-10 10:20:00
100天倒计时|于变化中锚定成长,来京宠展驭见2026
十二年为一纪,自2014年破土而生,北京万耀雄鹰国际展览有限公司举办的京宠展已悄然走过它的第一轮春秋,我们看着行业从青涩走向成熟
2025-12-10 10:43:00
杭州日报讯 还没毕业就带队创业,把密码学原理变成孩子爱玩的闯关游戏。日前,在第十一届杭州市大学生科技创新大赛决赛现场,杭州电子科技大学在校生唐萌团队带来的“秘密传递小特工”项目
2025-12-10 06:43:00
智能穿戴产品打开千亿市场空间
从运动健康到生活全场景︐智能穿戴设备以技术融合重塑消费生态︐开启市场新增长极腕间智能手表实时监测心率,耳畔智能耳机同步语音控制
2025-12-10 07:13:00
病理诊断准确率可达到90%以上,AI破局病理诊断痛点每日商报讯 12月4日-6日,第四届中国智能肿瘤学大会在杭州举行。作为大会核心专题板块之一
2025-12-10 07:44:00
从“卖布料”到“卖创意”杭州日报讯 眼下,绍兴未远品牌管理有限公司负责人周凯正为其一手打造的品牌“GUYUANDAI”筹备新系列的作品
2025-12-10 06:44:00
原佳星摘要:互联网行业的迅速发展使数据成为企业核心资源,统计学专业的重要性随之提升。企业在产品运营、用户分析和商业预测中高度依赖统计能力
2025-12-09 05:45:00
近年来,商品过度包装问题引发社会广泛关注。部分商家为提升商品附加值,通过增加包装层数、扩大空隙率、使用高成本材料等方式制造“包装溢价”
2025-12-09 07:18:00
在杭州,两位潜心科研的博士后,不约而同地将目光投向了地球上空数百公里处的低轨卫星。来自西安电子科技大学杭州研究院的孙冉冉博士
2025-12-09 07:49:00
我省交通行业首个自主创新研发的交通数智大模型太行交通数智大模型发布河北日报讯(曹智、谭磊)12月6日,河北交投集团发布太行交通数智大模型
2025-12-09 08:00:00