• 我的订阅
  • 头条热搜
腾讯元宝重磅更新:同时上线混元T1正式版+DeepSeek V3最新版
快科技3月26日消息,腾讯今天凌晨正式宣布,元宝迎来重大更新,两大模型同时上新:深度思考模型混元T1正式版、DeepSeek V3-0324最新版。腾讯表示,不论是深度思考、还是秒出答案,元宝一次给足。其中,混元T1正式版是腾讯自...……更多
阿里云重磅升级全栈AI体系,一文看懂云栖大会技术发布
...训练耗时降低28.1%;在推理层,通过大规模EP、PD/AF分离、权重优化、LLM智能路由在内的全链路优化,实现推理效率显著提升:推理吞吐TPS增加71%,时延TPOT降低70.6%,扩容时长降低97.6%。“阿里云正在全力打造一台全新的AI超级计...……更多
微调大模型,AMD MI300X就够了!跟着这篇博客微调Llama 3.1 405B
...PU 上训练 LLaMA 405B 模型。我们使用 LoRA 微调,将所有模型权重和 LoRA 参数都设为 bfloat16,LoRA rank 设为 8,LoRA alpha 设为 16: 模型大小:LLaMA 模型的权重占用了约 800GB 的显存。 LoRA 权重 + 优化器状态:大……更多
开源大模型杀疯了!Mistral新模型三分之一参数卷爆Llama 3.1
...设定了一个新的前沿”。Mistral Large 2尤其擅长代码和数学推理,上下文窗口128k,支持数十种自然语言以及80+编程语言。特别在MMLU上,其预训练版本更是达到了84.0%的准确率。消息一出,Mistral AI联创兼首席科学家第一时间转发,...……更多
腾讯钟学丹:人工智能成为汽车行业新质生产力 推动数智化升级
...中国电动汽车百人会论坛(2024)新质生产力分论坛上,腾讯智慧出行副总裁钟学丹发表了题为《AI驱动汽车“新智能”》的主题演讲,分享了腾讯AI大模型等新技术在汽车产业的创新应用成果。 腾讯智慧出行副总裁钟学丹钟学丹...……更多
挑战Scaling Law,Meta发布移动端350M小模型MobileLLM,性能比肩7B LLaMA-v2
...高门槛。不仅用2-bit和4-bit混合精度压缩模型(平均每个权重3.5-bit),而且要有至少8G内存和M1芯片才能运行。Meta最近发表的一篇论文就表明,参数量可以进一步收缩,最新提出的MobileLLM模型参数量小于1B,但性能依旧可观。 论...……更多
昆仑万维:“天工大模型3.0”将于4月17日正式发布 同步开源4000亿参数MoE超级模型
...“天工2.0”MoE大模型,“天工3.0”在模型语义理解、逻辑推理、以及通用性、泛化性、不确定性知识、学习能力等领域拥有惊人的性能提升,其模型技术知识能力提升超过20%,数学/推理/代码/文创能力提升超过30%。同时,“天工...……更多
惊掉下巴!被字节起诉800万实习生,拿下NeurIPS 2024最佳论文
...以通过修改或注入恶意代码,使模型在加载时被篡改模型权重、修改训练参数或截取模型数据。根据大V「Jack Cui」猜测,这位实习生所用的大概就是这个方法,注入代码动态修改别人的optimer,修改参数梯度的方向,以及在各种...……更多
Llama版o1来了,来自上海AI Lab,强化学习代码已开源,
复刻OpenAI o1推理大模型,开源界传来最新进展:LLaMA版o1项目刚刚发布,来自上海AI Lab团队。简介中明确:使用了蒙特卡洛树搜索,Self-Play强化学习,PPO,以及AlphaGo Zero的双重策略范式(先验策略+价值评估)。在2024年6月,o1发...……更多
阿里国际发布最新开源多模态模型Ovis,多模态能力再升级
...全部开源,可复现。Ovis1.6系列中的Ovis1.6-Gemma2-9B也已开源权重。在AI领域,多模态大模型的应用场景非常广泛,包括但不限于自动驾驶、医疗诊断、视频内容理解、图像描述生成、视觉问答等。例如,在自动驾驶领域,多模态大...……更多
开放模型权重被指将导致AI失控,Meta遭举牌抗议
...。与之相反,Meta 的 LLaMA 系列开源模型向公众提供了模型权重,使得任何拥有合适硬件和专业知识的人都可以自行复制和调整模型。一旦发布了模型权重,发布公司就不再有任何手段来控制 AI 的使用方式了。在 Holly Elmore 看来,...……更多
...在的诸多挑战。他表示,尽管随着通义千问、文心一言、腾讯混元等系列大模型纷纷降价免费,生成式人工智能(AIGC)的应用门槛进一步降低。但要让大模型更好地服务于企业应用场景,仍存在不少障碍。比如技术执行、实施...……更多
腾讯推出新一代快思考模型混元 Turbo S,将在腾讯元宝逐步灰度上线
大模型领域竞争日趋激烈,腾讯又放出大招!2月27日,腾讯混元Turbo S模型在腾讯云官网上架,开发者和企业用户可以通过API调用,即日起一周内免费试用,同时将逐步在腾讯元宝灰度上线,供用户使用和体验。据介绍,此次升...……更多
本周硅谷发生了什么?|苹果Vision Pro正式开售;Neuralink完成人类脑机接口植入;字节Coze国内版上线;
...布了论文,提出一个名为SliceGPT的方法。SliceGPT通过删除权重矩阵中的行和列来降低网络的嵌入维数,有效降低大模型所需资源,同时保持较高的模型性能。这也意味着SliceGPT可以运行在更少的GPU上,同时运行速度更快。△SliceGPT...……更多
腾讯大模型混元Turbo:御气升昺云,梓桐金鼎开
9月5日,腾讯正式推出其新一代旗舰大模型——混元Turbo。相比前代模型,腾讯混元Turbo性能有显著提升,训练效率提升108%,推理效率提升 100%,推理成本降低 50%,解码速度提升 20%,效果在多个基准测试上对标GPT-4o。最新第三方...……更多
DeepSeek致谢腾讯技术团队:这是一次“巨大的加速”代码贡献!
快科技5月7日消息,DeepSeek致谢腾讯技术团队,这是一次“巨大的加速”代码贡献。据新浪报道,腾讯技术团队针对DeepSeek开源的DeepEP通信框架进行深度优化,使其在多种网络环境下均实现显著性能提升。经测试,优化后的通信...……更多
大皖新闻讯 3月20日,腾讯发布2023年第四季度及全年业绩报告,财报指出:“腾讯混元已经发展成为领先的基础模型,在数学推导、逻辑推理以及多轮对话中性能卓越。”并首度披露腾讯混元采用混合专家模型结构,已扩展为...……更多
...整batch size可以影响模型的训练速度、内存消耗以及模型权重的更新方式。在更低的延迟方面,大规模跨节点专家并行使得专家分散在不同的GPU上,每个GPU只需要计算很少的专家(因此更少的访存需求),从而降低延迟。但是,...……更多
阿里推出全新推理模型:仅1/21参数媲美DeepSeek R1
...况下,用强化学习实现了性能上的跨越。此外,阿里还在推理模型中集成了与Agent相关的能力,使其能够在使用工具的同时进行批判性思考,并根据环境反馈调整推理过程。QwQ-32B 在一系列基准测试中进行了评估,测试了数学推...……更多
小米开源首个推理大模型Xiaomi MiMo:7B参数就超越OpenAI o1-mini
...快科技4月30日消息,小米官方今天正式宣布,开源首个为推理(Reasoning)而生的大模型——Xiaomi MiMo。据介绍,Xiaomi MiMo在数学推理(AIME 24-25)和代码竞赛(LiveCodeBench v5)公开测评集上,MiMo仅用7B的参数规模,超越了OpenAI的闭……更多
Llama 4训练已开启!Meta科学家最新采访,揭秘Llama 3.1是如何炼成的
...caling Law我们所熟知的Scaling Law主要关注两个维度,即模型权重和训练量,包括训练时的step、epoch和token总量等等。基本上,论文的发现就是,模型规模是重要因素。因此,GPT-3犯了一个错误——模型参数量远远超出了token总量的要...……更多
全面开源 浪潮信息发布千亿参数基础大模型“源2.0”
...51B(518亿)、2B(21亿)三种参数规模的模型,在编程、推理、逻辑等方面展示出了先进的能力。基础大模型的关键能力是大模型行业和应用落地能力表现的核心支撑。在算法、数据和算力等方面,“源2.0”提出了新的改进方法...……更多
「世界开源新王」跌落神坛?重测跑分暴跌实锤造假,2人团队光速「滑跪」
...过一个月的漫长等待,团队终于放出了Reflection 70B的模型权重、训练数据、训练脚本和评估代码。模型权重: https://huggingface.co/glaiveai/Reflection-Llama-3.1-70B训练数据: https://huggingface……更多
字节“扣子”加入AI战场,2024大模型能搞到钱吗?
...巴的“通义千问”大模型、科大讯飞的星火大模型,再到腾讯的混元大模型,国内传统的三大互联网巨头“BAT”悉数下场。此外,华为、京东、商汤科技、网易有道、昆仑万维(300418.SZ)等等都陆续推出了大模型产品,甚至连移...……更多
阿里最新开源推理模型发布:性能比肩DeepSeek-R1
阿里通义发布最新开源推理模型,称其性能比肩DeepSeek-R1。3月6日凌晨,阿里巴巴正式发布最新的开源推理模型通义千问QwQ-32B。据介绍,通过大规模强化学习,千问QwQ-32B在数学、代码及通用能力上实现质的飞跃,整体性能比肩De...……更多
NVIDIA RTX显卡AI推理提速5倍!
...得更好的加速和应用。其中,TensorRT-LLM是一款用于加速LLM推理的库,可大大提升AI推理性能,还在不断更以支持越来越多的语言模型,而且它还是开源的。就在10月份,NVIDIA也发布了面向Windows平台的TensorRT-LLM,在配备RTX30/40系列GP...……更多
全球最强开源大模型Llama 3发布:使用15T数据预训练,最大模型参数将超4000亿
...业基准测试中达到了 SOTA,并提供了新的功能,如改进的推理能力。最强开源 LLM 来了Meta 官方博客写道,“得益于预训练和后训练的改进,我们的预训练和指令微调模型是目前 8B 和 70B 参数尺度下最好的模型。”他们表示,后期...……更多
这才是真开源模型!公开后训练一切,性能超越Llama 3.1 Instruct
...有任何一个模型发布了其后训练数据。即使是主要的开放权重模型也不会发布任何数据或用于实现这种后训练的配方细节。于是,Ai2 似乎看不下去了,决定开源一切!Tülu 3 模型之外,Ai2 还发布了所有的数据、数据混合方法、...……更多
汽车新智能图谱里:理解腾讯的AI TO B路径
...具体的需求痛点,一起打磨对应的行业AI模型。这也恰是腾讯“实用”标签背后的AI产业路径。作者|皮爷出品|产业家成本、性价比——这是2023年腾讯CSIG事业群CEO汤道生在客户现场听到最多的一个词。有同样感觉的还有腾讯智慧...……更多
大模型降价背后,国产大模型的竞争逻辑变了
...将大模型的使用价格,调低至“厘”时代,百度、阿里、腾讯等巨头纷纷跟进,迅速将大模型推至免费时代。大模型免费时代加速到来5月15日,火山引擎云服务平台,发布了国内首批通过算法备案的“豆包大模型”,主力模型,...……更多
更多关于科技的资讯:
11月17日从中北高新区获悉,山西中北测控科技有限公司自主研制生产的加装测量存储系统圆满完成航空航天领域使用场景验证,各项性能指标均达到行业领先水平
2025-11-18 08:20:00
烟台工程职业技术学院成功入选国家级“IITC工信人才AI实训云平台”首批应用院校
鲁网11月18日讯近日,工业和信息化部人才交流中心公布了“IITC工信人才AI实训云平台”首批应用院校名单,烟台工程职业技术学院凭借在数字化基础设施与产教融合方面的深厚积淀
2025-11-18 15:49:00
OPPO Reno15 系列正式发布,潮流实况玩法“超出圈”
2025年11月17日,成都——OPPO正式发布全新一代Reno15系列手机。作为潮流与实况照片引领者,Reno15系列行业首发全息光刻工艺
2025-11-18 15:54:00
中国工程院院士邬贺铨、郑纬民点赞阿里千问APP:坚持走专业严谨的路线 期待中国AI走向世界舞台中心
11月18日消息,阿里巴巴千问APP近日开启公测,接入全球性能第一的开源模型Qwen3并免费开放。两位中国工程院院士就此分别接受了媒体采访
2025-11-18 16:57:00
摘要:数字化浪潮为以“身体体悟”为核心的太极拳传承带来了范式性变革。本研究采用质性研究方法,以“虚”与“实”这一对源自太极拳本身的核心哲学概念为理论透镜
2025-11-18 17:40:00
【宅男财经|专家面对面】据央视财经综合多家外媒报道,美国苹果公司首席执行官蒂姆·库克有可能最早于明年卸任,现任公司硬件工程高级副总裁特努斯被普遍视为最有可能的继任者
2025-11-18 17:48:00
埃尔韦·朗斯兰:杨佴旻,多彩水墨的艺术大师
杨佴旻是一位能够把千年传统与炫目现代性对比共存的画家。作为多彩水墨绘画的领军人物,他将古老技法转化为一种极具现代感的绘画语言
2025-11-18 17:51:00
河北新闻网讯(杨自立、田海颖)近日,廊坊市科技局公布2025年度市级科技企业孵化器认定和众创空间备案名单,廊坊开发区润泽人工智能产业孵化器
2025-11-18 18:43:00
11月18日,记者从尖草坪区了解到,在尖草坪区科技局的“牵线”下,中北大学的专家教授组团走进太原响臻云信息工程有限公司
2025-11-18 19:28:00
破解“AI+智造”人才难题,燕京理工学院这场论坛汇聚产学智慧
河北新闻网讯(杜啸飞)11月7日至8日,燕京理工学院举办第六届智能制造技术发展论坛暨“AI+智造”创新融合与人才培养主题论坛
2025-11-18 18:40:00
2025年“福满榕城 奋勇争先”短视频征集展播——《苍霞变形记丨“人民之城”的“幸福密码”》。
2025-11-18 21:37:00
2025青岛虚拟现实创新大会要来:北航青岛研究院以科创助推产业跃升2.0时代
鲁网11月18日讯一副简约的框架眼镜,镜片后可能隐藏着快速滚动的信息流;一间平平无奇的房间,戴上头显后,就能摇身变为绚丽仙境……当科幻电影中的沉浸式场景逐渐成为现实
2025-11-18 15:45:00
大皖新闻讯 11月18日,记者从合肥市政府新闻办召开的新闻发布会获悉,近年来,合肥市围绕科技创新与产业升级需求,大胆改革科技金融政策机制
2025-11-18 15:44:00
AI赋能千行百业一线故事(十六):数智驱动,唤醒高校“沉睡”的专利
数智驱动,唤醒高校“沉睡”的专利——AI赋能千行百业一线故事(十六)10月24日,邯郸职业技术学院知识产权学院工作人员演示AI+专利转化运用生态服务平台
2025-11-18 08:42:00