腾讯,权重,推理,模型,参数,代码头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

87.8%准确率赶超GPT-4o登顶！谷歌DeepMind发

...话、推理和安全性；FLAMe-Opt-RM，使用奖励模型优化的混合权重进行训练，并使用尾部补丁微调策略（tail-patch fine-tuning）。FLAMe从基准训练方法开始，使用监督多任务训练的方式，对PaLM-2-24B模型进行指令微调，进行固定数量的30K...……更多

2024-08-05 09:37:00准确率,模型,评估,评估,模型,数据

中国电信何忠江发布千亿参数大模型

...表示，星辰语义拥有超12亿风格数据、训练显存降低50%、推理提速4.5倍；中文意象理解生成能力提升30%，语义细粒度生成效果提升25%。在创意提效方面，星辰语义生产时间较此前生产工具减少92%，设计成本下降了95%。"总体而言，...……更多

2023-11-11 16:50:00中国电信,中国,模型,参数,电信,模型

高能技巧！60 行 NumPy 代码从头实现一个 GPT

...总将用 60 行 NumPy 代码从头实现一个 GPT。并把 GPT-2 模型权重加载到实现中，从而生成文本。原文链接：https://jaykmody.com/blog/gpt-from-scratch/作者 |Jay Mody译者| 禾木木出品 | CSDN（ID：CSDNnews）在本篇……更多

2023-02-15 11:00:00从头,代码,技巧,模型,矩阵,输入

科大讯飞大模型新升级：20秒制作PPT，拟人语音能力超越Ch

...台训练的全民开放大模型。升级后的讯飞星火V3.5在逻辑推理、语言理解、文本生成、数学答题、代码、多模态等七大能力上均有提升。升级之后，讯飞星火的文本生成能力和数理运算能力都有提升，可以轻松回答初三的数学物...……更多

2024-01-31 07:32:00讯飞,拟人,语音,模型,能力,升级

模型即服务，卓世科技MaaS平台 2.0 正式上线

...。本次新上线了包括：模型训练新基座，支持模型训练、推理、量化、评测等功能。卓世科技MaaS平台是一款基于知识增强大模型的一站式行业模型训练开发平台。面向开发者和企业提供从基础算力服务、数据服务、模型训练服...……更多

2024-08-07 09:45:00模型,服务,平台,科技,模型,数据

DeepSeek的一次小更新堪比发布新模型

...。根据官方更新的版本说明， DeepSeek -V3-0324 主要是针对推理能力和前端开发能力进行了加强，写作风格实现了跟 R1 对齐，另外还有一些其他方面的小优化。现在打开 DeepSeek 官网，把深度思考模式关掉就能直接用上 V3-0324 。不过...……更多

2025-03-26 07:33:00堪比,模型,更新,模型,版本,生成

“混元”迭代，大模型App腾讯元宝正式上线

本文转自：人民日报客户端5月30日，腾讯宣布旗下混元大模型全面升级，基于混元大模型的App“腾讯元宝”正式上线。腾讯元宝提供了AI搜索、AI总结、AI写作等核心能力；面向日常生活场景，元宝的玩法也更加丰富，提供了多...……更多

2024-05-30 18:23:00迭代,腾讯,元宝,模型,腾讯,模型

DeepSeek R2没等来，R1“小升级”发布：思考时间更

...其结合更加智能的门控网络层(Gating Network)以优化高负载推理任务的性能。不过，当时有内部人士向记者坦言，该传言真实度不高。从目前的情况分析，DeepSeek或许将用此次R1版本的升级，取代R2版本的推出。尽管网友评测得出的...……更多

2025-05-29 15:55:00效果,升级,时间,模型,升级,版本

推动大模型自我进化，北理工推出「流星雨计划」

...我进化的方式，解决代码模型在处理复杂问题时缺少中间推理过程。核心观点：自我进化的力量跟随上述自我进化的思想，在 SRA-MCTS（Self-guided MCTS-based data generation for Reasoning Augmentation）方法中，作者无需借助额外的任何监……更多

2024-12-06 09:52:00流星雨,进化,理工,流星,模型,模型

真香！智谱大模型，有了首个免费的API

... 2000 位，先到先得。智谱还将开放 GLM-4-Flash 模型的微调权重下载，很快人们将可以自由选择部署平台。这一系列行动，展示了国内大模型公司在应用层面的独特优势。在大模型技术对标国际先进水平的同时，国内 AI 的先头部队...……更多

2024-08-28 09:43:00真香,模型,模型,能力,应用,开发

李彦宏：没有应用，基础模型将一文不值

...模型想要追平闭源模型的能力，需要有更大的参数，那么推理成本会更高，反应速度会更慢。一个激烈竞争的市场环境中，比拼的是业务效率和更低的成本，对此，“商业化的闭源模型是最能打的”。此前4月中旬，李彦宏的一...……更多

2024-07-04 17:33:00一文,李彦,模型,基础,应用,模型

东湖评论：从DeepSeek爆火看中国科技

...码编织的“中国结”，让全球开发者看见：在参数规模与推理能力的平衡木上，在算力消耗与应用场景的天平间，中国工程师正在书写新的游戏规则。就像用苏州园林的借景手法重构摩天大楼，他们用1/20的激活参数实现对标国...……更多

2025-02-06 10:49:00东湖,评论,科技,中国,科技,国运

不要小看「实而不华」的腾讯 AI

「早早开始拿 AI 赚钱的腾讯，是怎么做AI的？」作者 | 连冉编辑| 郑玄上周 AI 领域最热闹的莫过于大洋彼岸 OpenAI 与谷歌的「掐架」，前者前脚刚发新一代旗舰模型 GPT-4o，把语音助手带到了新高度，后者就也在提到 121 次 AI 的...……更多

2024-05-21 21:25:00腾讯,腾讯,模型,能力,广告,视频

Figure AI发布人形机器人通用大模型：能识别陌生物品，

...见过的物品。与之前的方法不同，Helix使用一组神经网络权重来学习所有行为——拾取和放置物品、使用抽屉和冰箱以及跨机器人交互——而无需针对具体任务进行微调。Figure AI Helix演示视频。(02:33)此外，Helix还能够完全在嵌入...……更多

2025-02-21 12:11:00机器人,机器,人形,模型,运行,物品

一文看尽Meta开源大礼包！全面覆盖图像分割、语音、文本、表

...的影响。本次Meta更新了Meta Segment Anything Model 2.1 (SAM 2.1)权重，性能更强。开源链接：https://github.com/facebookresearch/sam2相比SAM2，研究人员引入了额外的数据增强技术来模拟视觉相似物体和小物体，并……更多

2024-11-28 12:02:00一文,大礼包,大礼,安全性,语音,图像

全模态对齐框架align-anything来啦：实现跨模态指

...-Vision-11B 既准确地识别出了餐厅，还提供了细致的思考与推理过程。在 Meta 并未披露 Llama-3.2-11B-Vision-Instruct 对齐技术细节情况下，北大对齐小组愿开源数据、训练、模型、评估的全流程，为全模态对齐研究贡献力量。对齐框架...……更多

2024-10-18 09:47:00模态,指令,框架,模态,模型,数据

搜论文、学代码…多所高校接入的DeepSeek“满血版”有哪

...特点就是他的“思维链”技术，通过拆解复杂问题并逐步推理，显著提升了对数学证明、逻辑推演等高难度任务的解决能力，这使得AI对教学科研的应用价值显著。再举个例子，我们学校数学系的同学就发现通过DeepSeek使用，它...……更多

2025-03-03 09:34:00接入,神奇,代码,论文,大学,智能

协同发展，生态聚合丨1024程序员节暨「源聚一堂」开源技术沙

...台上优化GenAI开源工具》，如英特尔在基于量化加速的LLM推理部署中，基于CPU指令集，为大语言模型的量化以及高效推理设计的代码库BigDL-LLM优化方案。优化部署 AI 推理的开源工具包OpenVINO，在非量化加速中提供键值缓存、算子...……更多

2023-10-25 13:02:00北京站,一堂,北京,程序员,沙龙,生态

英伟达最新技术分享：手把手教你用Llama 3.1合成数据改

...05B开源巨兽Llama 3.1最近正式上线，既可用于批处理和在线推理，也可以作为基座模型，进行特定领域的专门预训练或微调。尤其是考虑到Llama 3.1有如此大的参数规模，加上丰富的15.6T token训练数据，非常适合用于数据生成。这篇...……更多

2024-07-30 09:38:00手把,英伟,最新技术,模型,代码,数据

大模型价格战谁会受益

...价值联系在一起，在他看来，大模型商业模式建立在用于推理的算力显著超过训练的算力，C（用户）端的推理成本显著低于获客成本，那时可能会产生新的商业模式，不会像现在在B（企业）端打价格战。创业公司和大公司、大...……更多

2024-07-08 00:43:00价格战,模型,价格,模型,价格,价格战

多模态LLM视觉推理能力堪忧，浙大领衔用GPT-4合成数据构

新智元报道编辑：乔杨【新智元导读】LLM的数学推理能力缺陷得到了很多研究的关注，但最近浙大、中科院等机构的学者们提出，先进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准，并设计了一种...……更多

2024-08-08 16:23:00模态,领衔,基准,推理,视觉,能力

苹果开源7B模型，训练过程数据集一口气全给了，网友：很不像苹

...CLM-Baseline取得了更高的平均分，且在ARC（小学生科学问题推理）、HellaSwag（常识推理）、MMLU等任务上表现更好。 “小”模型成新趋势回到开头，“小”模型最近已成新趋势。先是HuggingFace推出了小模型家族“SmolLM”，其中包含1...……更多

2024-07-23 09:33:00苹果,一口,模型,一口气,训练,过程

一周复盘国元证券本周累计下跌2.84%，证券板块下跌2.2

...2，Meta发布开源AI模型Llama3.3；国内模型端也在持续迭代，腾讯混元大模型上线并开源文生视频能力，Kimi发布视觉思考模型k1，国产大模型DeepSeek-V3开源。【同行业公司股价表现——证券】代码名称最新价周涨跌幅10日涨跌幅月涨...……更多

2025-01-12 09:46:00证券,板块,证券,模型,医药,业绩

苹果AI登场，与OpenAI合作，Siri将采用GPT-4o

...达A100 AI GPU达20%，缩小了与英伟达 A100 的差。除此之外，腾讯控股和百度等中国领先企业也购买了Ascend 910B芯片，主要用于会议任务。华为将把小艺打造成超级助手，融合5.5G、AI能力：华为公司高级副总裁、中国区总裁曹既斌表...……更多

2024-06-11 09:00:00情报局,独角兽,情报,芯片,进展,苹果

百度All in的大模型何时能赚钱？

...个顶个都是顶尖的互联网企业。无论是阿里的通义千问，腾讯的混元，还是华为的盘古，都有着与百度文心一争的实力。同时，这些大厂的通用大模型依托企业自身本就拥有的业务场景，将形成很大的竞争压力。对于大模型的收...……更多

2023-10-27 18:02:00时能,模型,模型,应用,企业,场景

不同量级参数模型性能同样优秀夸克大模型再登行业评测榜首

...夸克大模型具备较好的语义理解、知识掌握与应用、逻辑推理能力，整体水平达到行业一流水平。另外，在最新的百亿参数测试集中，夸克同样在法律、医疗、问答等多个领域中排名第一，夸克大模型在不同参数量级的对比中均...……更多

2023-11-24 13:53:00夸克,模型,量级,榜首,评测,性能

零一万物Yi-1.5来了，国产开源大模型排行榜再次刷新

... Yi-1.0 的持续预训练版本，使用 500B 个 token 来提高编码、推理和指令执行能力，并在 300 万个指令调优样本上进行了精细调整。刚一发布，就已经有开发者跃跃欲试：并收获了好评：与前序模型相比，Yi-1.5 系列模型进一步提升...……更多

2024-05-14 09:56:00万物,模型,国产,再次,排行榜,模型

沙特主权基金旗下人工智能企业推动OpenAI开源模型落地Gr

...限。gpt-oss-120b和gpt-oss-20b是OpenAI在8月6日发布的两款开源权重AI推理模型。模型性能上，GPT-OSS大致位于开源模型的第一梯队，但整体略逊于自家的gpt-o3和o4-mini。 Codeforces对OpenAI不同模型的编程测试该产品现已上线，由HUMA……更多

2025-08-07 17:29:00沙特,人工智能,主权,落地,人工,旗下