• 我的订阅
  • 头条热搜
腾讯元宝重磅更新:同时上线混元T1正式版+DeepSeek V3最新版
快科技3月26日消息,腾讯今天凌晨正式宣布,元宝迎来重大更新,两大模型同时上新:深度思考模型混元T1正式版、DeepSeek V3-0324最新版。腾讯表示,不论是深度思考、还是秒出答案,元宝一次给足。其中,混元T1正式版是腾讯自...……更多
阿里云重磅升级全栈AI体系,一文看懂云栖大会技术发布
...训练耗时降低28.1%;在推理层,通过大规模EP、PD/AF分离、权重优化、LLM智能路由在内的全链路优化,实现推理效率显著提升:推理吞吐TPS增加71%,时延TPOT降低70.6%,扩容时长降低97.6%。“阿里云正在全力打造一台全新的AI超级计...……更多
微调大模型,AMD MI300X就够了!跟着这篇博客微调Llama 3.1 405B
...PU 上训练 LLaMA 405B 模型。我们使用 LoRA 微调,将所有模型权重和 LoRA 参数都设为 bfloat16,LoRA rank 设为 8,LoRA alpha 设为 16: 模型大小:LLaMA 模型的权重占用了约 800GB 的显存。 LoRA 权重 + 优化器状态:大……更多
开源大模型杀疯了!Mistral新模型三分之一参数卷爆Llama 3.1
...设定了一个新的前沿”。Mistral Large 2尤其擅长代码和数学推理,上下文窗口128k,支持数十种自然语言以及80+编程语言。特别在MMLU上,其预训练版本更是达到了84.0%的准确率。消息一出,Mistral AI联创兼首席科学家第一时间转发,...……更多
腾讯钟学丹:人工智能成为汽车行业新质生产力 推动数智化升级
...中国电动汽车百人会论坛(2024)新质生产力分论坛上,腾讯智慧出行副总裁钟学丹发表了题为《AI驱动汽车“新智能”》的主题演讲,分享了腾讯AI大模型等新技术在汽车产业的创新应用成果。 腾讯智慧出行副总裁钟学丹钟学丹...……更多
挑战Scaling Law,Meta发布移动端350M小模型MobileLLM,性能比肩7B LLaMA-v2
...高门槛。不仅用2-bit和4-bit混合精度压缩模型(平均每个权重3.5-bit),而且要有至少8G内存和M1芯片才能运行。Meta最近发表的一篇论文就表明,参数量可以进一步收缩,最新提出的MobileLLM模型参数量小于1B,但性能依旧可观。 论...……更多
昆仑万维:“天工大模型3.0”将于4月17日正式发布 同步开源4000亿参数MoE超级模型
...“天工2.0”MoE大模型,“天工3.0”在模型语义理解、逻辑推理、以及通用性、泛化性、不确定性知识、学习能力等领域拥有惊人的性能提升,其模型技术知识能力提升超过20%,数学/推理/代码/文创能力提升超过30%。同时,“天工...……更多
惊掉下巴!被字节起诉800万实习生,拿下NeurIPS 2024最佳论文
...以通过修改或注入恶意代码,使模型在加载时被篡改模型权重、修改训练参数或截取模型数据。根据大V「Jack Cui」猜测,这位实习生所用的大概就是这个方法,注入代码动态修改别人的optimer,修改参数梯度的方向,以及在各种...……更多
Llama版o1来了,来自上海AI Lab,强化学习代码已开源,
复刻OpenAI o1推理大模型,开源界传来最新进展:LLaMA版o1项目刚刚发布,来自上海AI Lab团队。简介中明确:使用了蒙特卡洛树搜索,Self-Play强化学习,PPO,以及AlphaGo Zero的双重策略范式(先验策略+价值评估)。在2024年6月,o1发...……更多
阿里国际发布最新开源多模态模型Ovis,多模态能力再升级
...全部开源,可复现。Ovis1.6系列中的Ovis1.6-Gemma2-9B也已开源权重。在AI领域,多模态大模型的应用场景非常广泛,包括但不限于自动驾驶、医疗诊断、视频内容理解、图像描述生成、视觉问答等。例如,在自动驾驶领域,多模态大...……更多
开放模型权重被指将导致AI失控,Meta遭举牌抗议
...。与之相反,Meta 的 LLaMA 系列开源模型向公众提供了模型权重,使得任何拥有合适硬件和专业知识的人都可以自行复制和调整模型。一旦发布了模型权重,发布公司就不再有任何手段来控制 AI 的使用方式了。在 Holly Elmore 看来,...……更多
...在的诸多挑战。他表示,尽管随着通义千问、文心一言、腾讯混元等系列大模型纷纷降价免费,生成式人工智能(AIGC)的应用门槛进一步降低。但要让大模型更好地服务于企业应用场景,仍存在不少障碍。比如技术执行、实施...……更多
腾讯推出新一代快思考模型混元 Turbo S,将在腾讯元宝逐步灰度上线
大模型领域竞争日趋激烈,腾讯又放出大招!2月27日,腾讯混元Turbo S模型在腾讯云官网上架,开发者和企业用户可以通过API调用,即日起一周内免费试用,同时将逐步在腾讯元宝灰度上线,供用户使用和体验。据介绍,此次升...……更多
本周硅谷发生了什么?|苹果Vision Pro正式开售;Neuralink完成人类脑机接口植入;字节Coze国内版上线;
...布了论文,提出一个名为SliceGPT的方法。SliceGPT通过删除权重矩阵中的行和列来降低网络的嵌入维数,有效降低大模型所需资源,同时保持较高的模型性能。这也意味着SliceGPT可以运行在更少的GPU上,同时运行速度更快。△SliceGPT...……更多
腾讯大模型混元Turbo:御气升昺云,梓桐金鼎开
9月5日,腾讯正式推出其新一代旗舰大模型——混元Turbo。相比前代模型,腾讯混元Turbo性能有显著提升,训练效率提升108%,推理效率提升 100%,推理成本降低 50%,解码速度提升 20%,效果在多个基准测试上对标GPT-4o。最新第三方...……更多
DeepSeek致谢腾讯技术团队:这是一次“巨大的加速”代码贡献!
快科技5月7日消息,DeepSeek致谢腾讯技术团队,这是一次“巨大的加速”代码贡献。据新浪报道,腾讯技术团队针对DeepSeek开源的DeepEP通信框架进行深度优化,使其在多种网络环境下均实现显著性能提升。经测试,优化后的通信...……更多
...整batch size可以影响模型的训练速度、内存消耗以及模型权重的更新方式。在更低的延迟方面,大规模跨节点专家并行使得专家分散在不同的GPU上,每个GPU只需要计算很少的专家(因此更少的访存需求),从而降低延迟。但是,...……更多
大皖新闻讯 3月20日,腾讯发布2023年第四季度及全年业绩报告,财报指出:“腾讯混元已经发展成为领先的基础模型,在数学推导、逻辑推理以及多轮对话中性能卓越。”并首度披露腾讯混元采用混合专家模型结构,已扩展为...……更多
阿里推出全新推理模型:仅1/21参数媲美DeepSeek R1
...况下,用强化学习实现了性能上的跨越。此外,阿里还在推理模型中集成了与Agent相关的能力,使其能够在使用工具的同时进行批判性思考,并根据环境反馈调整推理过程。QwQ-32B 在一系列基准测试中进行了评估,测试了数学推...……更多
小米开源首个推理大模型Xiaomi MiMo:7B参数就超越OpenAI o1-mini
...快科技4月30日消息,小米官方今天正式宣布,开源首个为推理(Reasoning)而生的大模型——Xiaomi MiMo。据介绍,Xiaomi MiMo在数学推理(AIME 24-25)和代码竞赛(LiveCodeBench v5)公开测评集上,MiMo仅用7B的参数规模,超越了OpenAI的闭……更多
Llama 4训练已开启!Meta科学家最新采访,揭秘Llama 3.1是如何炼成的
...caling Law我们所熟知的Scaling Law主要关注两个维度,即模型权重和训练量,包括训练时的step、epoch和token总量等等。基本上,论文的发现就是,模型规模是重要因素。因此,GPT-3犯了一个错误——模型参数量远远超出了token总量的要...……更多
全面开源 浪潮信息发布千亿参数基础大模型“源2.0”
...51B(518亿)、2B(21亿)三种参数规模的模型,在编程、推理、逻辑等方面展示出了先进的能力。基础大模型的关键能力是大模型行业和应用落地能力表现的核心支撑。在算法、数据和算力等方面,“源2.0”提出了新的改进方法...……更多
「世界开源新王」跌落神坛?重测跑分暴跌实锤造假,2人团队光速「滑跪」
...过一个月的漫长等待,团队终于放出了Reflection 70B的模型权重、训练数据、训练脚本和评估代码。模型权重: https://huggingface.co/glaiveai/Reflection-Llama-3.1-70B训练数据: https://huggingface……更多
字节“扣子”加入AI战场,2024大模型能搞到钱吗?
...巴的“通义千问”大模型、科大讯飞的星火大模型,再到腾讯的混元大模型,国内传统的三大互联网巨头“BAT”悉数下场。此外,华为、京东、商汤科技、网易有道、昆仑万维(300418.SZ)等等都陆续推出了大模型产品,甚至连移...……更多
阿里最新开源推理模型发布:性能比肩DeepSeek-R1
阿里通义发布最新开源推理模型,称其性能比肩DeepSeek-R1。3月6日凌晨,阿里巴巴正式发布最新的开源推理模型通义千问QwQ-32B。据介绍,通过大规模强化学习,千问QwQ-32B在数学、代码及通用能力上实现质的飞跃,整体性能比肩De...……更多
NVIDIA RTX显卡AI推理提速5倍!
...得更好的加速和应用。其中,TensorRT-LLM是一款用于加速LLM推理的库,可大大提升AI推理性能,还在不断更以支持越来越多的语言模型,而且它还是开源的。就在10月份,NVIDIA也发布了面向Windows平台的TensorRT-LLM,在配备RTX30/40系列GP...……更多
全球最强开源大模型Llama 3发布:使用15T数据预训练,最大模型参数将超4000亿
...业基准测试中达到了 SOTA,并提供了新的功能,如改进的推理能力。最强开源 LLM 来了Meta 官方博客写道,“得益于预训练和后训练的改进,我们的预训练和指令微调模型是目前 8B 和 70B 参数尺度下最好的模型。”他们表示,后期...……更多
这才是真开源模型!公开后训练一切,性能超越Llama 3.1 Instruct
...有任何一个模型发布了其后训练数据。即使是主要的开放权重模型也不会发布任何数据或用于实现这种后训练的配方细节。于是,Ai2 似乎看不下去了,决定开源一切!Tülu 3 模型之外,Ai2 还发布了所有的数据、数据混合方法、...……更多
汽车新智能图谱里:理解腾讯的AI TO B路径
...具体的需求痛点,一起打磨对应的行业AI模型。这也恰是腾讯“实用”标签背后的AI产业路径。作者|皮爷出品|产业家成本、性价比——这是2023年腾讯CSIG事业群CEO汤道生在客户现场听到最多的一个词。有同样感觉的还有腾讯智慧...……更多
大模型降价背后,国产大模型的竞争逻辑变了
...将大模型的使用价格,调低至“厘”时代,百度、阿里、腾讯等巨头纷纷跟进,迅速将大模型推至免费时代。大模型免费时代加速到来5月15日,火山引擎云服务平台,发布了国内首批通过算法备案的“豆包大模型”,主力模型,...……更多
更多关于科技的资讯:
丰台怡海中学无人驾驶实训教学项目落地
11月28日,AI驭见未来——怡海教育&加州伯克利大学机器人自动驾驶大赛ROAR实训基地揭牌仪式在北京市丰台区怡海中学(北校区)举行
2025-12-02 12:04:00
●杨炯上周末,在珠海的亚洲通航展上,奥捷龙航空科技有限公司格外引人注目。虽然已多次到珠海参展,但这次它“来自厦门”。这一全球市场份额第一的德国旋翼机品牌
2025-12-02 08:18:00
博物馆进入“沉浸时代”,感官残障观众如何“入场”
视障文化博物馆“触摸文明”展厅。中青报·中青网记者 李怡蒙/摄如今,许多博物馆将视觉、听觉、触觉等多种感知方式融合,创造出多层次
2025-12-02 05:43:00
烟台联通举办客服人员心理健康专题讲座
胶东在线12月1日讯为加强对一线客服员工的人文关怀,帮助员工有效应对工作压力,提升情绪管理与自我调适能力,11月26日
2025-12-02 06:42:00
摘要:本文分析现代物流网络布局与供应链弹性提升的内在关联,探讨节点布局合理性、线路连接多样性、资源整合协同性对供应链冗余能力
2025-12-02 07:09:00
摘要:本文聚焦管理会计在企业战略决策中的应用,首先解析其与战略决策的内在关联,即通过整合财务与非财务信息,为战略制定提供系统性支持
2025-12-02 07:10:00
中国网12月2日讯 据国家安全部官微消息,国家安全部提示,SDK(软件开发工具包)是一套为特定软件框架、硬件平台或操作系统提供的开发工具集合
2025-12-02 07:26:00
全球首创全动压空气轴承产业化成果发布,开启高端制造新纪元
北京讯—— 2025年11月28日,“全球首创全动压空气轴承产业化成果发布会”在北京首钢园香格里拉酒店圆满落幕。此次盛会标志着我国在超精密制造领域取得了重大突破
2025-12-02 07:32:00
联通超清电视狂欢双十一,临沂IPTV用户喜获iPhone17豪礼
鲁网12月1日讯一年一度的双十一购物狂欢盛宴圆满收官,在这场全民消费热潮中,山东联通精心策划的“双十一福利再升级”活动脱颖而出
2025-12-01 11:12:00
千里运荔藏巧思 现代加盟终端拓新局
“就算失败,我也想知道,自己倒在距离终点多远的地方。”电视剧《长安的荔枝》中这句掷地有声的台词,精准道出了当下创业者选择加盟之路时的执着与忐忑
2025-12-01 12:23:00
赛事总奖金160万元!WCI国际冠军赛苏州完美收官
2025年坦克世界国际冠军赛(WCI)11月30日在苏州阳澄国际电竞馆落下帷幕。来自中国、欧洲、北美和亚太地区的八支顶尖战队经过激烈角逐
2025-12-01 13:58:00
2025年北京市中小学生电子与信息创意实践活动圆满举行
当AI小球听懂指令,当智能车驰骋赛场,当电路在指尖点亮创意……孩子们像科学家一样思考,像工程师一样实践。11月30日,2025年北京市中小学生电子与信息创意实践活动在北京市第十四中学(畿辅校区)火热开幕
2025-12-01 14:26:00
烟台联通创新应用高压直流供电技术 破解高铁5G基站供电瓶颈
胶东在线12月1日讯在青烟威荣高铁5G覆盖扩容工程建设中,烟台联通成功应用高压直流供电技术创新方案,有效解决了牟平北山隧道西口
2025-12-02 05:00:00
海尔智慧家庭成立创新实验室布局好房子住居生态
海尔智慧家庭战略持续强化、开放和加速布局,又交出新成果。11 月 28日,以“AI 新纪元 共筑智慧家”为主题的海尔智慧家庭生态创新研讨会在北京召开
2025-12-01 14:51:00
海尔智慧家庭新成果:2025物联网大会斩获两项大奖
海尔智慧家庭持续强化、开放并加速智慧居住领域战略布局,如今再添重磅新成果。11 月 29 日,在首届全球万物智联数字经济可持续发展大会暨2025(第十届)世界物联网大会上
2025-12-01 14:51:00