更快,模型,推理,文章,生成,消息头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

最快的N卡和最快的A卡跑DeepSeek谁更快：RTX 5090比RX 7900 XTX快一倍

快科技2月2日消息，最快的N卡和最快的A卡跑DeepSeek谁更快？最新消息显示，RTX 5090在DeepSeek R上的推理性能比AMD的 RX 7900 XTX快得多，性能至少翻了一倍。测试显示，在多个DeepSeek R1型号中，RTX 5090明显领先于RX 7900 XTX，也比RTX……更多

2025-02-02 15:10:00更快,模型,推理,文章,生成,消息

腾讯元宝重磅更新：同时上线混元T1正式版+DeepSeek

...T1正式版是腾讯自研的深度思考模型，主打的就是“推理更快，思维超强”。相比此前的T1 Preview，T1正式版更快了：能秒回、吐字速度更快，同时效果也更好了，推理能力进一步提升。长文处理方面，T1的进步也很大，面对几十...……更多

2025-03-26 07:33:00腾讯,重磅,元宝,最新版,正式版,同时

3天把Llama训成Mamba，性能不降，推理更快！

...实现方式在H100 GPU上不太好使，主要是因为GEMM操作的速度更快了，使得缓存和重新计算产生的开销更加明显。所以，作者通过融合内核以及调整实现方式来优化算法。对于验证模型，首先从缓存中重新计算之前的步骤，然后对新...……更多

2024-09-06 10:01:00推理,更快,性能,模型,输出,训练

真香！智谱大模型，有了首个免费的API

...。与此同时，GLM-4 支持了更长的上下文、更强的多模态、更快的推理速度，以及更多并发请求，大大降低了推理成本。在此基础上发展出的 GLM-4-Flash，则带来了一系列技术优势：数据预训练：引入大语言模型进入数据筛选流程，...……更多

2024-08-28 09:43:00真香,模型,模型,能力,应用,开发

苹果让大模型学会偷懒：更快吐出第一个token，准确度还保住

... 需要大量计算。因此，即使 Prompt Compression 能让推理速度更快，但其实际的 TTFT 却比标准 LLM 还长。对总体生成速度的影响为了评估新方法对总体生成速度的影响，该团队分析了计算使用的 prompt token 百分比和生成加速情况，见...……更多

2024-08-05 09:35:00准确度,更快,模型,苹果,缓存,模型

AI出图更快、更懂你心意，高美感文生图模型修炼了哪些技术秘籍

...架构师赵一嘉，为我们深入剖析了文生图模型出图更美、更快、更懂用户心意背后的技术链路。直播开始，李亮首先详细拆解了近期国产大模型「顶流」—— 字节跳动豆包大模型在文生图模型方面的技术升级。李亮表示，豆包...……更多

2024-08-13 09:39:00文生,出图,美感,秘籍,心意,更快

英伟达展示blackwell平台，否认推迟上市

...发送给每一层的其他GPU，这就需要高带宽的GPU对GPU通信。更快的NVLINK交换机通过Blackwell，NVIDIA推出了速度更快的NVLINK交换机，将结构带宽提高了一倍，达到1.8TB/s。NVLINK交换机本身是基于台积电4NP节点的800mm2芯片，可将NVLINK扩展...……更多

2024-08-25 06:58:00英伟,平台,英伟,数据中心,桥架,吹风会

商汤 AI 办公小程序“Raccoon 智能助手”上线：提炼

...4 日消息，商汤科技宣布，基于商汤“日日新 SenseNova”大模型能力开发的数据分析产品“办公小浣熊”今天正式上线小程序版 ——“Raccoon 智能助手”。官方表示，可在小程序中，直接插入微信聊天中的文件（xls / xlsx / csv / txt /...……更多

2024-06-25 09:43:00商汤,助手,重点,智能,办公,程序

AI PC是噱头还是更快的马车？

...tra5125H包含7个。而且，这一代核显还支持AV1硬编码，可以更快速地输出高质量、高压缩率的视频。凭借领先的编解码能力，ArcGPU确实在视频剪辑行业积累的良好的口碑。随着矢量引擎能力的大幅度提升，大量内容创作ISV的演示了...……更多

2024-03-28 13:00:00噱头,马车,更快,还是,模型,处理

DeepSeek/o3的弱点找到了！三心二意明明对了又改错

...IME2024测试上能提高6%-7%的准确率，比Consensus Decoding更好也更快。论文地址：https://arxiv.org/abs/2501.18585参考链接：[1]https://x.com/tuzhaopeng/status/1885179412163027406[2]https://x……更多

2025-02-04 19:41:00弱点,模型,推理,答案,思路,准确率

字节发布豆包1.5深度思考模型：“实拍级”图像生成

...火山引擎总裁谭待正式发布了备受瞩目的豆包1.5深度思考模型。谭待指出，豆包1.5深度思考模型在多个关键领域展现出卓越性能。在数学、编程、科学推理这类专业领域中，它能够精准高效地处理复杂问题；在创意写作等通用任...……更多

2025-04-17 11:54:00豆包,字节,深度,生成,模型,图像

AI新时代揭幕！会“思考解题逻辑”的OpenAI推理大模型登

...I o1-预览版外，OpenAI也同步推出了o1-mini模型。后者是一个更快、更便宜的模型，定价也会便宜80%，适用于需要推理但不需要广泛世界知识的场景。而且从OpenAI“抠抠索索”的举动来看，这个推理模型恐怕非常消耗算力。公司宣布...……更多

2024-09-13 13:34:00新时代,推理,逻辑,模型,模型,问题

抽卡效率提升4.8倍！东北大学等开源优化版Stable-Di

...及并行处理（动态分配计算任务并且提高运算并行度）。更快的速度，不仅节省时间，更让创作更自由！实例展示：更真实的生成效果下图展示了使用 SDXL-Turbo 模型，原版Sdcpp以及我们优化的Sdcpp使用5步采样，所生成的图像对比...……更多

2024-12-21 09:14:00东北大学,生成,分辨率,效率,质量,大学

成都人形机器人创新中心全国首发 R-DDIRM 高速推理模型

...型的 10 倍以上，这意味着人形机器人在执行任务时能够更快做出决策和反应，从而更有效地完成任务。据IT之家此前报道，今年 10 月底，成都人形机器人创新中心研发的人形机器人“贡嘎一号”（Konka-1）发布，该产品整机重量...……更多

2024-11-25 09:49:00成都,人形,机器人,推理,模型,机器

更快、更强、更可控：智谱“起舞弄清影”，视频生成卷出新高度！

...也进一步推动AI普惠风。一、智谱“清影”上线：速度更快、更为可控、画面更连贯速度上，智谱生成式视频模型的推理速度提升了6倍，生成6s视频只需花费30s，这意味着更快的创作周期、更高的实时性、更流畅的生成，以及...……更多

2024-07-27 10:00:00更快,生成,高度,视频,清影,视频

业界首款！中国联通发布元景思维链大模型：性能比肩OpenAI

...联通宣布，联通数据智能有限公司日前发布元景思维链大模型。目前，元景思维链模型已在GitHub、魔搭、始智等社区全面开源。作为央企首个开源的通用思维链大模型，元景思维链大模型既拥有强大慢思考能力，又具备不限于数...……更多

2025-01-24 12:33:00中国联通,中国,模型,思维,业界,性能

DeepSeek V3小版本大升级：推理、前端开发加强这些

快科技3月25日消息，今晚，DeepSeek官宣，DeepSeek V3模型已完成小版本升级。目前版本号为DeepSeek-V3-0324，用户登录官方网页、App、小程序进入对话界面后，关闭深度思考即可体验，API 接口和使用方式保持不变。虽然是小版本更新...……更多

2025-03-25 23:03:00前端,推理,能力,版本,升级,开发

文心大模型4.0 Turbo来了！百度推出文心快码2.5，已

...成效果对比，在相同的提示词下，4.0 Turbo的生成速度明显更快，生成内容也更具条理性。在基础模型升级上，百度进一步研发了智能体（Agent）机制，包括理解、规划、反思和进化，使其能够可靠执行、自我进化，并一定程度上...……更多

2024-07-01 09:21:00文心,快码,程序员,模型,程序,文心

黄仁勋：我从不在乎市场份额、英伟达唯一目标是创造新市场

...计方面有什么不同的策略？A：Intel的优势在于制造和设计更快的x86串行处理芯片，而Nvidia采取不同策略：在并行处理中，不需要每个晶体管都很出色我们更倾向于使用更多但较慢的晶体管，而不是更少但更快的晶体管宁愿有10倍...……更多

2024-10-23 12:25:00新市,英伟,份额,从不,目标,市场

StableDiffusion原班人马新公司官宣！连发新模型

...是我们的最弱型号schnell，生成质量也更好，生成速度也更快。主打一个我成立新公司超越我自己SD主要作者组团打造介绍完模型相关资料，是时候正式来认识一下这家新公司了。黑森林实验室，今天刚刚宣布成立。公司官网上...……更多

2024-08-05 09:38:00人马,绘画,格局,模型,公司,黑森林

英伟达、微软、亚马逊三家美国巨头同日接入DeepSeek 网

...ce Microservices，是一种云原生微服务技术，可简化生成式AI模型在云端、数据中心及GPU加速工作站上的部署流程。英伟达官网发布文章指出，DeepSeek-R1是具备最先进推理能力的开放模型，比起直接提供响应，像DeepSeek-R1这样的推理...……更多

2025-02-02 11:40:00亚马,亚马逊,三家,英伟,微软,实测

NeurIPS 2024|水印与高效推理如何两全其美？最新理

...这些草稿进行验证和修正。草稿模型规模较小，生成速度更快但质量较低；目标模型并行进行验证，接受符合条件的部分。这种方法可以在保持生成质量的同时，显著提升推理效率，降低计算成本，已成为大规模应用中不可或缺...……更多

2024-11-22 09:49:00水印,推理,理论,水印,方法,投机

广汽宣布加入DeepSeek！覆盖昊铂、传祺、埃安三大品牌

...2月8日，广汽集团宣布其自主研发的ADiGO SENSE端云一体大模型已与DeepSeek-R1大模型完成深度融合。这一融合预计将在今年上半年上线，并逐步覆盖昊铂、传祺、埃安三大品牌的系列车型，为车主提供创新的智能化服务。ADiGO SENSE通...……更多

2025-02-09 14:46:00三大,品牌,模型,智能,用户,服务

NeurIPS 2024 | 数学推理场景下，首个分布外检测

...上海交通大学计算机系的二年级博士生，研究方向为语言模型生成、推理，以及可解释、可信大模型。该工作由上海交通大学和阿里巴巴通义实验室共同完成。论文题目：Embedding Trajectory for Out-of-Distribution Detection in Mathematical R……更多

2024-12-03 13:33:00研究成果,推理,场景,成果,检测,数学

硅谷大模型“价格战”上演，一味“卷”价格会有未来吗？

5月以来，国内大模型打响了“价格战”。从每百万个Token只要1块钱，到只要8毛钱、5毛钱……国内大厂如字节跳动、百度、智谱AI、科大讯飞等不断接力，有厂商甚至直接打出了“免费”的口号，震惊整个科技圈子。实际上，硅...……更多

2024-05-27 15:27:00硅谷,价格,价格战,一味,模型,模型

联想发布端侧AI新技术 PC本地推理能力媲美 OpenAI-

...擎”对算力的提升，让设备的预填充更为迅速、解码速度更快、推理时间更短，同时占用内存更少，能耗更低，设备上的 AI 能力得到了大幅提升。联想集团董事长兼CEO杨元庆表示，很快大家就会在即将发布的下一代 AI PC 上体验...……更多

2025-05-07 11:10:00新技,推理,新技术,能力,推理,模型

阿里发布全球最强开源模型千问3 通义App第一时间已上线

快科技4月29日消息，阿里新一代通义千问开源模型Qwen3（简称千问3），现已在通义App与通义网页版（tongyi.com）全面上线。用户可以第一时间在通义App和网页版中的专属智能体“千问大模型”，以及主对话页面，体验到全球最强...……更多

2025-04-29 11:35:00通义,阿里,模型,全球,通义,模型

亚马逊连甩6款大模型！推出3nm AI训练芯片，最强AI服务

...，将4台Trn2服务器连接在一起，形成1台巨型服务器，实现更快的大模型训练和推理。单个Trn2实例结合了16颗Trainium2芯片，可提供20.8PFLOPS，适合训练和部署有数十亿个参数的大语言模型。全新EC2产品Trn2 UltraServer则将64颗Trainium2芯...……更多

2024-12-05 09:47:00亚马,亚马逊,芯片,模型,训练,服务器