• 我的订阅
  • 头条热搜
李飞飞团队“50美元”复现DeepSeek R1?真相是…
...0美元的云计算费用,成功训练出了一个名为s1的人工智能推理模型。该模型在数学和编码能力测试中的表现,据称与OpenAI的O1和DeepSeek的R1等尖端推理模型不相上下。这一消息无疑在AI界投下了一颗重磅炸弹,真相究竟如何?《科...……更多
腾讯最强!混元自研深度思考模型T1正式发布:吐字快、能秒回
...了自研深度思考模型混元T1正式版,这是腾讯自研的最强推理模型。腾讯表示,T1不仅吐字快、能秒回,还擅长超长文处理。通过大规模强化学习,并结合数学、逻辑推理、科学和代码等理科难题的专项优化,混元T1正式版进一步...……更多
...其中,千亿参数大模型Step-1耗时2个月训练成功,在逻辑推理、中文知识、英文知识、数学、代码方面表现出色,性能全面超越GPT-3.5,拥有优秀的长文理解和生成能力、多轮指令跟随能力以及现场学习能力,同时能够实现单卡低...……更多
腾讯推出 Hunyuan-Large 开源大模型
...2B-Instruct和Hunyuan-A52B-Instruct-FP8。并发布了技术报告和训练推理操作手册,详细介绍了模型能力和训练与推理的操作。其中模型技术优势如下:高质量合成数据:通过合成数据增强训练,Hunyuan-Large能够学习到更丰富的表示,处理...……更多
挑战Scaling Law,Meta发布移动端350M小模型MobileLLM,性能比肩7B LLaMA-v2
...做个假设,如果把GPT-4(大约有1万亿参数)以50tokens/s的推理速度部署在生活中,你需要什么样的硬件?答案是1亿个H100 GPU。别说是移动设备了,家里都放不下。那如果降低标准,用LLaMA-v2 7B这样的模型,再加上8-bit量化呢?简单...……更多
收入占比40%、电话会议点名16次,英伟达:推理端的需求被低估了
...让人印象深刻的是,英伟达在财报电话会议的一个观点:推理端的爆发,可能很多人还是低估了。据英伟达电话会议披露,公司全年数据中心里已经有40%的收入来自推理业务,超出了绝大部分人预期。而在这次财报电话会议里,...……更多
1-bit大模型还能再突破!新一代BitNet架构启用4位激活值
...为可以吃到4位(INT4/FP4)内核的计算红利,实现了更快的推理速度。BitNet a4.8仅激活55%的参数,并支持3 bit KV cache,进一步提升了大规模LLM部署和推理的效率。BitNet a4.8模型架构模型的整体架构如图1所示,BitNet a4.8采用了与BitNet b……更多
微软被曝未来3年花1000亿美金囤芯片;杨元庆:AI不是取代人类的智能|钛媒体AGI
...柱。开源大模型Llama3推出,百度智能云支持其全系列训练推理北京时间4月19日凌晨,Meta公布期待已久的多模态开源大模型Llama 3系列,目前包括80亿和700亿两个参数的调优版本。与此同时,Meta还推出了其首款基于Llama 3开源模型的...……更多
智启新元年:PC成为AI落地首选终端
...了具备高性能计算能力的通用加速芯片,是大模型训练、推理的主要算力来源;云计算的发展和普及,则使软硬件充分解耦,大模型开发者可以以相对低的成本调用大规模的算力、存储和网络资源,开发进程大大加快;同时,Tra...……更多
腾讯版Sora发布即开源!130亿参数,模型权重、推理代码全开放
...,成为目前参数量最大的开源视频生成模型。模型权重、推理代码、模型算法等全部上传GitHub与Hugging Face,一点没藏着。实际效果如何呢?目前该模型已上线腾讯元宝APP,用户可在AI应用中的“AI视频”板块申请试用。API同步开...……更多
开源社区参数量最大的文生视频模型来了,腾讯版Sora免费使用
...的开源模型,开发者及企业无需从头训练,即可直接用于推理,并可基于腾讯混元系列打造专属应用及服务,能够节约大量人力及算力。同时,各大模型研发团队均可基于腾讯混元模型进行研究与创新,加速行业创新步伐。据技...……更多
乔布斯时代之后,会迎来黄仁勋时代吗?
...flops的FP4计算能力,这是由其2080亿个晶体管提供的。高效推理:当与Grace CPU结合形成GB200超级芯片时,它能在LLM推理工作负载上提供比单个GPU高出30倍的性能,同时在成本和能源消耗上比H100 GPU高出25倍。训练能力:使用Blackwell GPU...……更多
...数模型Qwen-1.8B和音频大模型Qwen-Audio。开源模型Qwen-1.8B,推理2K长度文本内容仅需3G显存,可在消费级终端部署。Qwen-Audio能够感知和理解人声、自然声、动物声、音乐声等各类语音信号。用户可以输入一段音频,要求模型给出对音...……更多
3D大模型助力,15分钟即可训练高质量、个性化的数字人模型
...人脸动作轨道的信息,对被遮挡的人脸动作进行去噪。在推理阶段,给定任意音频 - 视频对作为说话人风格提示,模型都能生成模仿该说话风格的人脸动作。图 3. 能在上下文中学习目标人说话风格的人脸动作生成模型模型的应...……更多
杨仝团队发布FairyR1模型:5%参数量数学和代码能力超越满血DeepSeek
...在保证特定任务性能的前提下,大幅降低模型规模和潜在推理成本的可能性。北京大学杨仝教授团队表示:“FairyR1-32B模型是我们探索高效大型语言模型技术路线的阶段性成果。通过对蒸馏和合并方法的改进,我们初步验证了在...……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...经理。CTO鲍凡在清华大学计算机系获得博士学位,在加速推理、可控生成、基础架构、训练策略等方面已发表十余篇顶会论文。首席科学家为清华大学计算机系人工智能实验室主任、智源研究院首席科学家朱军。可以说,2023年...……更多
9月13日,OpenAI发布具有推理能力的人工智能模型“o1”,备受行业瞩目。o1通过模仿人类的思维过程,强化学习和“思维链”技术,引导模型自主解决问题。这一特点在解决复杂问题,尤其是在科学、编码和数学等领域,展现出...……更多
这才是真开源模型!公开后训练一切,性能超越Llama 3.1 Instruct
...著提升,而背后的成功离不开后训练阶段强化学习训练和推理阶段思考计算量的增大。基于此,有人认为,新的扩展律 —— 后训练扩展律(Post-Training Scaling Laws) 已经出现,并可能引发社区对于算力分配、后训练能力的重新思...……更多
京东率先推出行业首批高商业可用数字人,618向商家免费开放
...考”双通道能力,能满足各行业对“即时响应”和“深度推理”的双重需求。具体来说,750B超大规模模型在训练过程中,使用了动态分层蒸馏、跨领域数据治理等京东创新技术,降低大模型的训练和部署成本,同时兼顾大模型...……更多
o1金牌团队揭秘AI超越人类惊人时刻!22分完整版视频全公开
...共有8点:1 强化学习加持的o1,比人类更善于发现新的CoT推理步骤2 自我批评的涌现,是o1最强有力的时刻3 让o1「超时」前完成回答,然后突然有了「啊哈」时刻 4 scaling参数规模的挑战,以及继续沿着强化学习算法进步之路5 许...……更多
李彦宏发布文心大模型4.0工具版,推理成本降到1%
...练效率提升到了原来的5.1倍,周均训练有效率达到98.8%,推理性能提升了105倍,推理的成本降到了原来的1%。“也就是说,客户原来一天调用1万次,同样成本之下,现在一天可以调用100万次。”此外,李彦宏在演讲中分享了百度...……更多
Meta版Sora深夜横空出世,小扎放出16秒高清大片!92页论文曝光技术细节,Llama 3架构立功
...验结果发现,Movie Gen Video模型能够理解物理世界——可以推理物体运动、主-客体交互、几何关系、相机运动、物理规律,以及各种概念的合理运动。在微调阶段,研究人员精选了一部分视频,对模型在美学、运动质量方面完成...……更多
OpenAI掀小模型血战!苹果DCLM强势登场,碾压Mistral 7B全开源
...外,HuggingFace上还发布了7B模型的指令微调版本,在数学推理任务GSM8K上的性能实现大规模提升,分数由原来的2.1直接飙到52.5。https://huggingface.co/apple/DCLM-7B-8k除了7B版本,1.4B版本也同步上线。神奇的是,训练数据量相比7B版本不……更多
零一万物发布千亿参数模型Yi-Large 李开复呼吁拒绝烧钱打法
...roduct-Market-Fit(TC-PMF),技术成本X产品市场契合度,尤其推理成本下降是个‘移动目标’,这比传统PMF难上一百倍。”李开复表示,希望大模型赛道的竞争聚焦于达成TC-PMF。李开复提出,国内大模型赛道的竞跑从狂奔到长跑,终...……更多
百倍提升7B模型推理能力!颜水成团队携手新加坡南洋理工大学发布Q*算法
...-7b等小模型达到参数量比其大数十倍、甚至上百倍模型的推理能力,使模型性能迎来惊人提升。自OpenAI的Q*项目曝光后,业内相关讨论始终层出不穷。据现有信息汇总,Q*项目被视作OpenAI在探索人工通用智能(Artificial General Intelli...……更多
摩尔线程、360达成战略合作!打造360智脑国产算力底座
...成国产、自主、可控的360智脑大模型,具备大模型管理、推理部署等功能。摩尔线程全功能GPU将为该一体机提供强大的底层算力,以高性价比硬件方案确保大模型推理效率与成本的平衡。不仅如此,360大模型产品还与摩尔线程完...……更多
国产模型指令跟随全球第一!来自LeCun亲推的最难作弊LLM新榜单
...训练。 故而,Step-2总参数量达到万亿级别,每次训练或推理所激活的参数量也超过了市面上的大部分Dense模型。此外,Step-2的训练过程中,阶跃的系统团队突破了6D并行、极致显存管理、完全自动化运维等关键技术,支撑起了整...……更多
如何跑赢生成式AI竞赛?云计算大厂揭秘组合拳:自研大模型只是开胃菜
...胜在全面,有琳琅满目的大模型品类,还有加速从训练到推理的各种工具“套餐”,以及围绕平台、存储、网络、数据库的一系列升级……一切变动都指向一个目的,即让云客户更快更方便地用生成式AI产生价值。一、大模型货...……更多
英伟达推出新一代ai芯片,预计今年晚些时候发货
...名为NIM的新产品。NIM可以更容易地使用旧的英伟达GPU进行推理,允许公司继续使用已拥有的数亿个英伟达GPU。这将减少新人工智能模型的初始训练推理所需的算力。英伟达的策略是让购买英伟达服务器的客户注册英伟达企业版,...……更多
位列第一梯队,腾讯混元再度领跑国内大模型
...维度的综合性测评基准,由十大基础任务组成,包括逻辑推理、代码、语言理解、长文本、角色扮演等。本次报告选取了国内外具有代表性的32个大模型4月份的版本,通过多维度综合性测评,真实准确地反映了国内外大模型在中...……更多
更多关于财经的资讯:
“世界超市”年货上新 马年创意好物成采购商“新宠”
距离马年春节还有两个多月的时间,但是对于“世界超市”义乌来说,这里的年味已经日渐浓厚。 不仅福字、对联、灯笼等传统年货产品已经上新
2025-12-05 08:13:00
江苏银行常州分行丰富产品矩阵 赋能转型升级
从大运河畔的古今交融,到智造车间的机械臂挥舞;从新能源车企的焊花闪烁,到光伏企业的技术迭代;从清洁能源的管道铺展,到城乡角落的净水潺潺……行走在钟灵毓秀的龙城大地
2025-12-05 10:58:00
摩尔线程全资子公司增资,增幅达100%
近日,摩尔线程(688795)全资子公司光速摩方智能科技(杭州)有限责任公司发生工商变更,注册资本增加至1亿元,增幅为100%
2025-12-05 11:12:00
超捷股份成立机器人科技公司
近日,无锡超捷智法机器人科技有限公司成立,法定代表人为王世华,注册资本为1000万元,经营范围包含:计算机系统服务;智能机器人的研发
2025-12-05 11:12:00
国电电力新设新能源公司,含风力发电技术服务业务
近日,绿能(枣庄台儿庄区)新能源有限公司成立,法定代表人为孙伟,注册资本为3891.1万元,经营范围包含:新兴能源技术研发
2025-12-05 11:12:00
多因素推动白银价格创历史新高,现存白银制品相关企业超8万家
据经济日报报道,近期,全球银价创出历史新高,成为市场关注的热点。据悉,今年白银现货价格涨幅超过90%,跑赢黄金;在期货方面
2025-12-05 11:12:00
中国人寿岱岳区支公司以案说险:关爱老年群体 警惕“高收益”理财骗局
鲁网12月5日讯退休教师张爷爷在公园遇到一位热情的“理财顾问”,对方推荐一款号称“专为老年人设计”的理财产品,承诺“保本保息
2025-12-05 11:46:00
金融活水润红梁--光大银行“酒粮贷”赋能贵州酱酒产业高质量发展
多彩贵州网讯(记者 金星)“仓盈庚亿,年岁有息。赤水含章,红粱献瑞。”当古老的诗句再次回荡在赤水河畔的田野,有关这片土地的故事便徐徐展开——从商周时期的酿酒遗存
2025-12-05 11:49:00
苏州人保财险召开财务年终收口工作会议
为确保财务工作的及时性、准确性、完整性,助力公司高质量完成全年目标任务。近日,苏州人保财险重要客户部/国际保险部召开2025年财务收口工作会议
2025-12-05 11:53:00
中国电力20亿成立海上风电公司
12月4日,国电投(日照)海上风电有限公司成立,法定代表人为罗朝发,注册资本20亿元人民币,经营范围涉及风力发电技术服务
2025-12-05 12:00:00
g0507公告.jpg
2025-12-05 12:11:00
饿了么官方正式宣布:更名为“淘宝闪购”
12月5日上午,饿了么官方正式宣布:即日起,“饿了么”APP在更新至最新版本后将全面焕新为“淘宝闪购”。与此同时,原涉及“饿了么”品牌表达的各个场景,近期也将陆续完成向“淘宝闪购
2025-12-05 09:14:00
欣旺达等在泉州投资成立资源循环公司
近日,泉州市欣海资源循环有限公司成立,注册资本1000万元,经营范围包含:电子专用材料销售;蓄电池租赁;储能技术服务;资源循环利用服务技术咨询等
2025-12-05 09:48:00
伊利股份等成立数字技术公司,含物联网业务
浙江超优伊数字技术有限责任公司成立,注册资本1000万元,经营范围包含:供应链管理服务;物联网应用服务;组织文化艺术交流活动
2025-12-05 09:48:00
南京银行承销全国首单“绿色+两新+乡村振兴”三贴标债券
江南时报讯 在金融服务实体经济质效不断提升的当下,如何发挥资本市场核心枢纽作用,将资金精准引导至绿色转型、乡村振兴等国家战略号召的关键领域
2025-12-05 10:04:00