腾讯,权重,推理,模型,参数,代码头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...用混合专家架构，超10TB tokens训练，覆盖大量合成数据，推理时上下文窗口达200K左右。云、端、边全栈大模型产品矩阵中，用于终端设备的“商汤端侧大模型”可满足各类终端用户对大模型技术的应用需求。“日日新5.0”和GPT-4...……更多

2024-04-24 09:32:00商汤,模型,升级,商汤,模型,推理

依托数据、平台、知识增强等优势夸克大模型降低问答幻觉率

...夸克大模型具备较好的语义理解、知识掌握与应用、逻辑推理能力。在大模型技术落地层面，夸克大模型的能力体现在四个方面，可以帮助用户提升工作、学习效率。知识能力，拥有广泛的知识覆盖、信息搜集和多语言支持等，...……更多

2023-11-23 11:11:00夸克,幻觉,模型,问答,优势,知识

科大讯飞申请推理方法相关装置及推理系统专利，具有较高的推理速

...局信息显示，科大讯飞股份有限公司申请一项名为“一种推理方法、相关装置及推理系统”的专利，公开号CN119918679A，申请日期为2025年4月。专利摘要显示，本申请公开了一种推理方法、相关装置及推理系统，应用于推理加速技...……更多

2025-05-06 13:30:00推理,讯飞,装置,速度,专利,方法

OPPO：用AndesGPT迎接下一个十年

...打法：在AndesGPT的定义中，“对话”是GPT记忆能力、逻辑推理能力、模糊意图理解能力、生成能力等等的一个集合，作为大模型与用户沟通的桥梁，“对话”的重要性不言而喻。面对这座大山，坚持长期主义的OPPO做出了与“愚公...……更多

2023-11-17 09:41:00模型,用户,能力,体验,技术,生态

手机上能跑的「GPT-4V」来啦！多图、视频理解首次上端！面

...类模型低 75%。端侧友好：量化后端侧内存仅占 6 GB；端侧推理速度高达 18 tokens/s，相比上代模型快 33%。并且发布即支持 llama.cpp、ollama、vllm 推理；且支持多种语言。统一高清框架，高效能力一拖三：小钢炮的传统优势 OCR 能力延...……更多

2024-08-07 09:42:00多图,小钢炮,模态,上端,手机,视频

16家头部大模型公司上海神秘碰头，现场人挤人人人

...最为关键的三大层面，即：算力层：用于基础模型训练和推理的基础设施模型层：使用基础模型加速生成式AI应用构建应用层：开箱即用的生成式AI应用至于能力如何，我们直接来看下最为直观的效果。在生成式AI应用方面，...……更多

2024-05-30 17:18:00上海,头部,模型,人人,公司,亚马

AI大模型有望再扩1000倍！剑桥耶鲁康奈尔：PNN是变革关

... network， ANN）相区分。和ANN类似，PNN系统同样使用可训练权重处理输入数据，但不同之处在于，系统中至少有一部分是模拟的而非数字的。这意味着部分或者全部的输入/输出数据被连续编码为物理参数，权重也可以是物理参数...……更多

2024-07-15 09:33:00康奈尔,康奈,耶鲁,剑桥,变革,模型

AI 已死？不，AIGC 给我们带来了新的希望 | 氪记 2

...首先，“打败 Google 的，只可能是 Google”。就像社交帝国腾讯用微信“打败”了 QQ 一样，Google 几十年来在搜索引擎领域的绝对话语权，使其在对话式 AI 在搜索领域的应用上，也具有不可撼动的优势。目前，Google 在搜索引擎中...……更多

2023-01-05 09:26:00模型,生成,用户,技术,应用,图像

进迭时空宣布开源RISC-V芯片的AI核心技术

...为ARM的20%左右，AI性能得到极大提升。目前，世界主流AI推理生态主要包括英伟达的GPU推理生态和X86的CPU推理生态。K1芯片通过复用X86成熟的AI推理软件栈，把底层核心算子改用RISC-VVector和AI指令，其余部分复用CPU推理软件栈，从...……更多

2024-04-29 15:06:00芯片,核心,时空,技术,芯片,志坚

国产GPU力挺！摩尔线程宣布支持满血Deepseek-V3-

...然采用混合专家(MoE)架构，每个token激活约370亿参数，在推理、编程、数学、中文处理等多个领域达到行业领先水平。根据DeepSeek官方发布的测试报告，DeepSeek-V3-0324在各项能力评测中表现出色。DeepSeek-V3-0324不仅全面超越Claude-3.7-So...……更多

2025-03-28 00:35:00摩尔,线程,国产,支持,模型,摩尔

DeepSeek/o3的弱点找到了！三心二意明明对了又改错

...现象被研究者称为Underthinking（欠思考）。研究团队来自腾讯AI实验室、苏州大学和上海交通大学，主要研究对象是开源的DeepSeek-R1和Qwen QwQ系列模型。通过分析AI的错误答案，他们发现当前的推理大模型经常在思考早期就走上了正...……更多

2025-02-04 19:41:00弱点,模型,推理,答案,思路,准确率

DeepSeek：开源破垄断，中国AI定义科技博弈新规则

...术壁垒的消解，更催生了全球开发者的共创生态。从模型权重到推理框架，开发者均可基于DeepSeek快速构建定制化应用，甚至通过模型蒸馏培育垂直领域的小型AI系统。这种开放性与包容性，与西方科技巨头“闭源垄断+高额订阅...……更多

2025-02-25 11:06:00中国,规则,科技,技术,中国,模型

OpenAI发布最新技术研究，AI“黑盒”不再是难题！

...出了正确回答。大部分大模型都在给出答案的同时呈现了推理过程。智谱清言给出的推理过程显示，在比较13.11%和13.8%时，13.11%是更大的数值。这是因为当比较两个百分数时，我们首先比较整数部分，如果它们相同，则比较小数...……更多

2024-07-18 09:47:00最新技术,难题,研究,技术,模型,小数

百度发布两款大模型，对标DeepSeek、聚焦多模态

...百度外，近期包括阿里旗下AI应用夸克、字节旗下豆包、腾讯混元等都陆续上线了“深度思考”功能。这也意味着生成式AI的竞争已从早期的信息整合、简单逻辑推导转向“认知重构”，试图让AI突破表层语义匹配，建立因果推理...……更多

2025-03-16 14:03:00模态,模型,文心,模型,哪吒,模态

Intel三条线优化阿里云通义千问2模型：720亿参数轻松拿

...。Intel还采用KV Caching、PagedAttention机制和张量并行，提高推理效率。Intel的硬件也可利用软件框架和工具包进行加速，并获得出色的大模型推理性能，包括PyTorch以及Intel PyTorch扩展包、OpenVINO工具包、DeepSpeed、Hugging F……更多

2024-07-18 14:57:00三条,通义,阿里,模型,参数,通义