• 我的订阅
  • 头条热搜
腾讯大模型混元Turbo:御气升昺云,梓桐金鼎开
...模型,腾讯混元Turbo性能有显著提升,训练效率提升108%,推理效率提升 100%,推理成本降低 50%,解码速度提升 20%,效果在多个基准测试上对标GPT-4o。最新第三方测评在国内位居第一。腾讯混云大模型已经落地腾讯700+个业务场景...……更多
从线性注意力视角揭秘视觉Mamba,清华、阿里合作提出全新MILA模型
...模型的精度,同时保持了线性注意力优越的并行计算与高推理速度。论文链接:https://arxiv.org/abs/2405.16605 代码链接:https://github.com/LeapLabTHU/MLLA 视频讲解:https://www.bilibili……更多
腾讯版Sora发布即开源!130亿参数,模型权重、推理代码全开放
...,成为目前参数量最大的开源视频生成模型。模型权重、推理代码、模型算法等全部上传GitHub与Hugging Face,一点没藏着。实际效果如何呢?目前该模型已上线腾讯元宝APP,用户可在AI应用中的“AI视频”板块申请试用。API同步开...……更多
...能设备或家庭服务器上,使用存储在本地的个人数据进行推理和学习的人工智能基础模型。它不仅可以像公共大模型那样通过对话提供答案、创作内容,而且更精准、贴切,甚至根据用户的思维模式预测任务,并自主寻找解决方...……更多
首个o1复现开源RL框架OpenR来了,UCL、上交等高校联合团队发布
...湖大学工学院助理教授(研究)杨林易。o1 作为 OpenAI 在推理领域的最新模型,大幅度提升了 GPT-4o 在推理任务上的表现,甚至超过了平均人类水平。o1 背后的技术到底是什么?OpenAI 技术报告中所强调的强化学习和推断阶段的 Sca...……更多
OpenAI o1强推理能提升安全性?长对话诱导干翻o1
最近,以 OpenAI o1 为代表的 AI 大模型的推理能力得到了极大提升,在代码、数学的评估上取得了令人惊讶的效果。OpenAI 声称,推理可以让模型更好的遵守安全政策,是提升模型安全的新路径。然而,推理能力的提升真的能解决...……更多
全球最强开源大模型Llama 3发布:使用15T数据预训练,最大模型参数将超4000亿
...业基准测试中达到了 SOTA,并提供了新的功能,如改进的推理能力。最强开源 LLM 来了Meta 官方博客写道,“得益于预训练和后训练的改进,我们的预训练和指令微调模型是目前 8B 和 70B 参数尺度下最好的模型。”他们表示,后期...……更多
小模型越级挑战14倍参数大模型,谷歌Test-Time端新的Scaling Law
...发布的新模型草莓所用的方法。研究团队探究了在大模型推理时进行计算优化的方法,根据给定的prompt难度,动态地分配测试时(Test-Time)的计算资源。结果发现这种方法在一些情况下比单纯扩展模型参数更经济有效。换句话说...……更多
国内首个!百度文心大模型X1 Turbo斩获信通院最高评级证书
...息,在5月20日的百度AI Day 上,中国信通院公布了大模型推理能力评估结果。百度文心大模型X1 Turbo在24项能力评估中,16项达5分,综合评级获当前最高级“4+级”,成为国内首款通过该测评的大模型。其中,文心X1 Turbo在逻辑推理...……更多
李开复:现在卖AI大模型的方式行不通,需考虑技术和业务成本、要有客户买单
...标化、定制重、交付重的商业模式;另一方面则是要考虑推理成本,能够帮助企业客户核算 ROI,在不赔钱的前提下做规模增长,是模型能力在 ToB 方向落地的基础。当前,中国大模型初创公司的应用生态和融资环境与美国有着一...……更多
NVIDIA RTX显卡AI推理提速5倍!
...得更好的加速和应用。其中,TensorRT-LLM是一款用于加速LLM推理的库,可大大提升AI推理性能,还在不断更以支持越来越多的语言模型,而且它还是开源的。就在10月份,NVIDIA也发布了面向Windows平台的TensorRT-LLM,在配备RTX30/40系列GP...……更多
阿里发布全球最强开源模型千问3 通义App第一时间已上线
...布的千问3开源模型包含8款不同尺寸,均为全新的“混合推理模型”,智能水平大幅提升的同时也更省算力。其中,千问3旗舰模型Qwen3-235B-A22B是一款混合专家(MoE)模型,该模型创下所有国产模型及全球开源模型的性能新高;而...……更多
LLM仍然不能规划,刷屏的OpenAI o1远未达到饱和
...模型,一举创造了很多历史记录。o1 模型拥有真正的通用推理能力。在一系列高难基准测试中展现出了超强实力,相比 GPT-4o 有巨大提升,让大模型的上限从「没法看」直接上升到优秀水平,不专门训练直接数学奥赛金牌,甚至...……更多
苹果让大模型学会偷懒:更快吐出第一个token,准确度还保住了
...小的 8B 版本可能也依然会有明显延迟。为了提升模型的推理效率,研究者想出了多种多样的方法,但其中很多都会让模型牺牲一些准确度。近日,苹果和 Meta AI 的一个研究团队提出了一种新方法,可在保证准确度不明显下降的...……更多
字节猛踩油门
...型3.0、视觉理解模型,并推出OS Agent解决方案及AI云原生推理套件,用于企业客户构建与部署Agent应用。其中,豆包1.5深度思考模型作为字节首款推理模型,具备“边想边搜”能力,同时借助视觉推理能力,可以综合理解图片中的...……更多
Anthropic再反击!发布Claude 3.5吊打GPT-4o,视觉、逻辑推理等方面表现更强
...本Claude 3.5 Sonnet。从官方披露的测试数据来看,其在逻辑推理、编程、数学等方面中的表现性能均超越GPT-4o。网友直言,“太卷了,现在AI竞争是要以周为单位了吗?” 从官方介绍来看,Claude 3.5全家桶仍会有3款系列模型,分别...……更多
真香!智谱大模型,有了首个免费的API
...同时,GLM-4 支持了更长的上下文、更强的多模态、更快的推理速度,以及更多并发请求,大大降低了推理成本。在此基础上发展出的 GLM-4-Flash,则带来了一系列技术优势:数据预训练:引入大语言模型进入数据筛选流程,使用 10...……更多
OpenAI-o1思考替代法火了!焦剑涛高徒一作提出思考偏好优化
...,大模型能根据任务复杂度进行不同时间的思考。不限于推理性的逻辑或数学任务,一般问答也能思考的那种。最近畅销书《Python机器学习》作者Sebastian Raschka推荐了一项新研究,被网友们齐刷刷码住了。论文一作为华人学者Tian...……更多
o1 基石论文火爆传阅:Ilya 仍是关键先生,核心项目清北校友闪光
...后的贡献者。Ilya 在 o1 的作用 OpenAI o1 主打进行通用复杂推理,在输出回答之前,会在产生一个很长的思维链,以此增强模型能力。而 Ilya 此前合著的这篇论文主要就是探讨了提高大语言模型多步推理能力的方法。他们主要比较...……更多
英特尔推出新款AI芯片:推理性能比英伟达H100快50%
...加速器将为寻求大规模部署生成式AI的企业带来AI训练和推理方面的重大飞跃。英特尔Gaudi 3预计可大幅缩短70亿和130亿参数Llama2模型,以及1750亿参数GPT-3模型的训练时间。英特尔表示,Gaudi 3能够比英伟达上一代H100处理器训练特定...……更多
大模型新趋势之MoE:现状、挑战及研究方向
...,MoE在训练过程通过门控模型实现“因材施教”,进而在推理过程实现专家模型之间的“博采众长”。 图1MoE架构原理示意图1MoE的特征优势是专家化、动态化、稀疏化,在模型研发成本、训练/推理效率和整体性能之间实现最佳...……更多
第一个100%开源的MoE大模型,7B的参数,1B的推理成本
...语言模型 (LM) 在各种任务上取得了重大进展,但在训练和推理方面,性能和成本之间仍然需要权衡。对于许多学者和开发人员来说,高性能的 LM 是无法访问的,因为它们的构建和部署成本过高。改善成本 - 性能的一种方法是使...……更多
李飞飞团队“50美元”复现DeepSeek R1?真相是…
...0美元的云计算费用,成功训练出了一个名为s1的人工智能推理模型。该模型在数学和编码能力测试中的表现,据称与OpenAI的O1和DeepSeek的R1等尖端推理模型不相上下。这一消息无疑在AI界投下了一颗重磅炸弹,真相究竟如何?《科...……更多
DeepSeek第二炸:开源首个用于 MoE 模型训练通信库
...码库DeepEP王炸。据了解,DeepEP是首个用于 MoE 模型训练和推理的开源 EP 通信库,它填补了MoE模型专用通信工具的空白,为大规模分布式AI训练和实时推理场景提供了更高效的底层支持。在这里,简单介绍一下DeepEP的技术性能特点...……更多
推理成本直降99%!百川智能「1+3」矩阵揭秘,两张4090玩转旗舰新模型
...」。模型升级:Baichuan4-Turbo两张4090即可部署,Baichuan4-Air推理成本下降99%接下来,如何将Baichuan4-Turbo、Baichuan4-Air应用在实际场景中?从名字中不难看出,它们都是Baichuan 4系列基础模型的升级。对于企业来说,在不同场景阶段……更多
通义App全面上线千问3 第一时间体验全球最强开源模型
...布的千问3开源模型包含8款不同尺寸,均为全新的“混合推理模型”,智能水平大幅提升的同时也更省算力。其中,千问3旗舰模型Qwen3-235B-A22B是一款混合专家(MoE)模型,该模型创下所有国产模型及全球开源模型的性能新高;Qwe...……更多
...相对低配的GPU和显卡内存,就能让办公智能体获得很好的推理效果。DeepSeek-V3发布后,这家上海人工智能企业立即成为它的用户。“这个大模型有6710亿参数,激活参数为370亿,在14.8万亿token(词元)上进行了预训练,生成速度比...……更多
...版本升级,当前版本为DeepSeek-R1-0528,模型的思维深度与推理能力显著提升。更新后的R1模型针对议论文、小说、散文等文体进行了进一步优化,能够输出篇幅更长、结构内容更完整的长篇作品,同时呈现出更加贴近人类偏好的写...……更多
...达1000AITOPS处理能力和128GB统一内存,实现无缝模型开发和推理先进架构:NVIDIA?GB10GraceBlackwell超级芯片配备BlackwellGPU、20核ArmCPU和NVLink-C2C?技术,可有效提升AI工作负载扩展互联:配置为独立或私有云系统,以在桌面上驱动AI……更多
...这个思路,我们开始思考:视觉模型是否也能实现类似的推理能力?”与传统大模型训练的 SFT(Supervised Fine-Tuning)方法不同,R1方法的突破在于其路径创新。SFT依赖海量标注数据进行“填鸭式”教学,而R1方法则通过强化学习,...……更多
更多关于财经的资讯:
· 今年前10个月 我国农产品出口近6000亿元
据海关统计,今年前10个月我国农产品出口近6000亿元,出口品类达838种,出口至223个国家和地区。出口规模、品类丰富度和市场覆盖面同步提升
2025-12-05 07:42:00
奋进的河北·“十四五”答卷丨货币政策工具协同发力 精准滴灌实体经济
文字整理/王巍 制图/孙涛12月4日,在“十四五”高质量发展河北答卷系列主题新闻发布会金融专场上,中国人民银行河北省分行
2025-12-05 07:48:00
朗玛信息“39AI医生”斩获首届“AI领航杯”全国总决赛最高荣誉
12月2日,首届“AI领航杯”“人工智能 ”应用与技能大赛全国总决赛颁奖仪式在北京举行,贵阳朗玛信息技术股份有限公司自主研发的“39AI医生”医学大模型斩获大赛最高荣誉——“AI领航星光金奖”
2025-12-04 14:11:00
【多彩新论】大抓产业激荡贵州活力
“十四五”以来,贵州大抓产业、主攻工业的共识全面形成,工业“挑大梁”作用日益增强,工业对全省经济增长贡献率从17.1%提升至36
2025-12-04 14:11:00
大批游客打卡“广德三件套”,今年文旅相关企业已注册超1.8万家
近日,安徽广德“三件套”在网络上爆火,吸引不少沪苏浙地区游客涌入,掀起了跨省消费热潮。广德市位于安徽省东南部。近日,“广德炖锅
2025-12-04 14:24:00
姜凌波:短期继续保持谨慎等待重要节点
周三,沪深两市开盘后窄幅震荡,随后深市指数表现偏弱跌幅逐步走阔。午后两市小幅反弹后开始加速下探,深成指和创业板指一度跌超1%
2025-12-04 14:41:00
陕西中越保险代理因多项违规被罚2.8万元
12月3日,国家金融监督管理总局陕西监管局行政处罚信息公示表显示,陕西中越保险代理有限公司因聘任不具有任职资格的人员、未按规定托管注册资本
2025-12-04 14:43:00
熊凌获批担任四川天府银行贵阳分行副行长
12月3日,国家金融监督管理总局贵州监管局发布关于熊凌四川天府银行贵阳分行副行长任职资格的批复,核准熊凌四川天府银行股份有限公司贵阳分行副行长的任职资格。
2025-12-04 14:44:00
李海峰获批担任平安人寿贵州分公司副总经理
12月3日,国家金融监督管理总局贵州监管局发布关于李海峰中国平安人寿保险股份有限公司贵州分公司副总经理任职资格的批复,核准李海峰中国平安人寿保险股份有限公司贵州分公司副总经理的任
2025-12-04 14:45:00
戴婉姝获批担任广发银行贵阳分行副行长
12月3日,国家金融监督管理总局贵州监管局发布关于戴婉姝广发银行贵阳分行副行长任职资格的批复,核准戴婉姝广发银行贵阳分行副行长的任职资格。
2025-12-04 14:45:00
高桥亮介获批担任北大方正人寿保险董事
12月3日,国家金融监督管理总局上海监管局关于TAKAHASHIRYOSUKE(高桥亮介)北大方正人寿保险有限公司董事任职资格的批复,核准TAKAHASHIRYOSUKE(高桥亮
2025-12-04 14:46:00
黔地药香里的金融温度:工行正安支行助力中药材产业“链”上腾飞
多彩贵州网讯(通讯员 陈小雨)生态为基,药材为脉。绥阳县依托自然禀赋打造的中药材产业,既是当地特色农业名片,也是乡村振兴的核心支柱
2025-12-04 14:50:00
歌声暖夕阳 工行贵阳白云支行奏响养老金融服务新乐章
多彩贵州网讯(通讯员 文睿)近日午后,阳光和煦。在工行贵阳白云支行的多功能活动室内,传出了阵阵悠扬而充满活力的歌声——二十余位银发学员在专业声乐老师的指导下放声高歌
2025-12-04 14:50:00
工行仁怀支行:“烟草贷”润泽小微 20万“及时雨”解商户燃眉之急
多彩贵州网讯(通讯员 岑柱瑾)11月25日,随着一笔20万元“烟草贷”资金的顺利到账,仁怀市某烟酒店经营者张先生紧锁多日的眉头终于舒展开来
2025-12-04 14:50:00
工行兴义普安支行:服务无“孤岛” 山路崎岖送温情
多彩贵州网讯(通讯员 杜红)近日,工行兴义普安支行的营业大厅刚刚开门,一位头发花白、步履蹒跚的老爷爷便走了进来。他的眼神里满是焦急与无助
2025-12-04 14:50:00