• 我的订阅
  • 头条热搜
李飞飞团队“50美元”复现DeepSeek R1?真相是…
...0美元的云计算费用,成功训练出了一个名为s1的人工智能推理模型。该模型在数学和编码能力测试中的表现,据称与OpenAI的O1和DeepSeek的R1等尖端推理模型不相上下。这一消息无疑在AI界投下了一颗重磅炸弹,真相究竟如何?《科...……更多
腾讯最强!混元自研深度思考模型T1正式发布:吐字快、能秒回
...了自研深度思考模型混元T1正式版,这是腾讯自研的最强推理模型。腾讯表示,T1不仅吐字快、能秒回,还擅长超长文处理。通过大规模强化学习,并结合数学、逻辑推理、科学和代码等理科难题的专项优化,混元T1正式版进一步...……更多
...其中,千亿参数大模型Step-1耗时2个月训练成功,在逻辑推理、中文知识、英文知识、数学、代码方面表现出色,性能全面超越GPT-3.5,拥有优秀的长文理解和生成能力、多轮指令跟随能力以及现场学习能力,同时能够实现单卡低...……更多
腾讯推出 Hunyuan-Large 开源大模型
...2B-Instruct和Hunyuan-A52B-Instruct-FP8。并发布了技术报告和训练推理操作手册,详细介绍了模型能力和训练与推理的操作。其中模型技术优势如下:高质量合成数据:通过合成数据增强训练,Hunyuan-Large能够学习到更丰富的表示,处理...……更多
挑战Scaling Law,Meta发布移动端350M小模型MobileLLM,性能比肩7B LLaMA-v2
...做个假设,如果把GPT-4(大约有1万亿参数)以50tokens/s的推理速度部署在生活中,你需要什么样的硬件?答案是1亿个H100 GPU。别说是移动设备了,家里都放不下。那如果降低标准,用LLaMA-v2 7B这样的模型,再加上8-bit量化呢?简单...……更多
收入占比40%、电话会议点名16次,英伟达:推理端的需求被低估了
...让人印象深刻的是,英伟达在财报电话会议的一个观点:推理端的爆发,可能很多人还是低估了。据英伟达电话会议披露,公司全年数据中心里已经有40%的收入来自推理业务,超出了绝大部分人预期。而在这次财报电话会议里,...……更多
1-bit大模型还能再突破!新一代BitNet架构启用4位激活值
...为可以吃到4位(INT4/FP4)内核的计算红利,实现了更快的推理速度。BitNet a4.8仅激活55%的参数,并支持3 bit KV cache,进一步提升了大规模LLM部署和推理的效率。BitNet a4.8模型架构模型的整体架构如图1所示,BitNet a4.8采用了与BitNet b……更多
微软被曝未来3年花1000亿美金囤芯片;杨元庆:AI不是取代人类的智能|钛媒体AGI
...柱。开源大模型Llama3推出,百度智能云支持其全系列训练推理北京时间4月19日凌晨,Meta公布期待已久的多模态开源大模型Llama 3系列,目前包括80亿和700亿两个参数的调优版本。与此同时,Meta还推出了其首款基于Llama 3开源模型的...……更多
智启新元年:PC成为AI落地首选终端
...了具备高性能计算能力的通用加速芯片,是大模型训练、推理的主要算力来源;云计算的发展和普及,则使软硬件充分解耦,大模型开发者可以以相对低的成本调用大规模的算力、存储和网络资源,开发进程大大加快;同时,Tra...……更多
腾讯版Sora发布即开源!130亿参数,模型权重、推理代码全开放
...,成为目前参数量最大的开源视频生成模型。模型权重、推理代码、模型算法等全部上传GitHub与Hugging Face,一点没藏着。实际效果如何呢?目前该模型已上线腾讯元宝APP,用户可在AI应用中的“AI视频”板块申请试用。API同步开...……更多
开源社区参数量最大的文生视频模型来了,腾讯版Sora免费使用
...的开源模型,开发者及企业无需从头训练,即可直接用于推理,并可基于腾讯混元系列打造专属应用及服务,能够节约大量人力及算力。同时,各大模型研发团队均可基于腾讯混元模型进行研究与创新,加速行业创新步伐。据技...……更多
乔布斯时代之后,会迎来黄仁勋时代吗?
...flops的FP4计算能力,这是由其2080亿个晶体管提供的。高效推理:当与Grace CPU结合形成GB200超级芯片时,它能在LLM推理工作负载上提供比单个GPU高出30倍的性能,同时在成本和能源消耗上比H100 GPU高出25倍。训练能力:使用Blackwell GPU...……更多
...数模型Qwen-1.8B和音频大模型Qwen-Audio。开源模型Qwen-1.8B,推理2K长度文本内容仅需3G显存,可在消费级终端部署。Qwen-Audio能够感知和理解人声、自然声、动物声、音乐声等各类语音信号。用户可以输入一段音频,要求模型给出对音...……更多
3D大模型助力,15分钟即可训练高质量、个性化的数字人模型
...人脸动作轨道的信息,对被遮挡的人脸动作进行去噪。在推理阶段,给定任意音频 - 视频对作为说话人风格提示,模型都能生成模仿该说话风格的人脸动作。图 3. 能在上下文中学习目标人说话风格的人脸动作生成模型模型的应...……更多
杨仝团队发布FairyR1模型:5%参数量数学和代码能力超越满血DeepSeek
...在保证特定任务性能的前提下,大幅降低模型规模和潜在推理成本的可能性。北京大学杨仝教授团队表示:“FairyR1-32B模型是我们探索高效大型语言模型技术路线的阶段性成果。通过对蒸馏和合并方法的改进,我们初步验证了在...……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...经理。CTO鲍凡在清华大学计算机系获得博士学位,在加速推理、可控生成、基础架构、训练策略等方面已发表十余篇顶会论文。首席科学家为清华大学计算机系人工智能实验室主任、智源研究院首席科学家朱军。可以说,2023年...……更多
9月13日,OpenAI发布具有推理能力的人工智能模型“o1”,备受行业瞩目。o1通过模仿人类的思维过程,强化学习和“思维链”技术,引导模型自主解决问题。这一特点在解决复杂问题,尤其是在科学、编码和数学等领域,展现出...……更多
这才是真开源模型!公开后训练一切,性能超越Llama 3.1 Instruct
...著提升,而背后的成功离不开后训练阶段强化学习训练和推理阶段思考计算量的增大。基于此,有人认为,新的扩展律 —— 后训练扩展律(Post-Training Scaling Laws) 已经出现,并可能引发社区对于算力分配、后训练能力的重新思...……更多
京东率先推出行业首批高商业可用数字人,618向商家免费开放
...考”双通道能力,能满足各行业对“即时响应”和“深度推理”的双重需求。具体来说,750B超大规模模型在训练过程中,使用了动态分层蒸馏、跨领域数据治理等京东创新技术,降低大模型的训练和部署成本,同时兼顾大模型...……更多
o1金牌团队揭秘AI超越人类惊人时刻!22分完整版视频全公开
...共有8点:1 强化学习加持的o1,比人类更善于发现新的CoT推理步骤2 自我批评的涌现,是o1最强有力的时刻3 让o1「超时」前完成回答,然后突然有了「啊哈」时刻 4 scaling参数规模的挑战,以及继续沿着强化学习算法进步之路5 许...……更多
李彦宏发布文心大模型4.0工具版,推理成本降到1%
...练效率提升到了原来的5.1倍,周均训练有效率达到98.8%,推理性能提升了105倍,推理的成本降到了原来的1%。“也就是说,客户原来一天调用1万次,同样成本之下,现在一天可以调用100万次。”此外,李彦宏在演讲中分享了百度...……更多
Meta版Sora深夜横空出世,小扎放出16秒高清大片!92页论文曝光技术细节,Llama 3架构立功
...验结果发现,Movie Gen Video模型能够理解物理世界——可以推理物体运动、主-客体交互、几何关系、相机运动、物理规律,以及各种概念的合理运动。在微调阶段,研究人员精选了一部分视频,对模型在美学、运动质量方面完成...……更多
OpenAI掀小模型血战!苹果DCLM强势登场,碾压Mistral 7B全开源
...外,HuggingFace上还发布了7B模型的指令微调版本,在数学推理任务GSM8K上的性能实现大规模提升,分数由原来的2.1直接飙到52.5。https://huggingface.co/apple/DCLM-7B-8k除了7B版本,1.4B版本也同步上线。神奇的是,训练数据量相比7B版本不……更多
零一万物发布千亿参数模型Yi-Large 李开复呼吁拒绝烧钱打法
...roduct-Market-Fit(TC-PMF),技术成本X产品市场契合度,尤其推理成本下降是个‘移动目标’,这比传统PMF难上一百倍。”李开复表示,希望大模型赛道的竞争聚焦于达成TC-PMF。李开复提出,国内大模型赛道的竞跑从狂奔到长跑,终...……更多
百倍提升7B模型推理能力!颜水成团队携手新加坡南洋理工大学发布Q*算法
...-7b等小模型达到参数量比其大数十倍、甚至上百倍模型的推理能力,使模型性能迎来惊人提升。自OpenAI的Q*项目曝光后,业内相关讨论始终层出不穷。据现有信息汇总,Q*项目被视作OpenAI在探索人工通用智能(Artificial General Intelli...……更多
摩尔线程、360达成战略合作!打造360智脑国产算力底座
...成国产、自主、可控的360智脑大模型,具备大模型管理、推理部署等功能。摩尔线程全功能GPU将为该一体机提供强大的底层算力,以高性价比硬件方案确保大模型推理效率与成本的平衡。不仅如此,360大模型产品还与摩尔线程完...……更多
国产模型指令跟随全球第一!来自LeCun亲推的最难作弊LLM新榜单
...训练。 故而,Step-2总参数量达到万亿级别,每次训练或推理所激活的参数量也超过了市面上的大部分Dense模型。此外,Step-2的训练过程中,阶跃的系统团队突破了6D并行、极致显存管理、完全自动化运维等关键技术,支撑起了整...……更多
如何跑赢生成式AI竞赛?云计算大厂揭秘组合拳:自研大模型只是开胃菜
...胜在全面,有琳琅满目的大模型品类,还有加速从训练到推理的各种工具“套餐”,以及围绕平台、存储、网络、数据库的一系列升级……一切变动都指向一个目的,即让云客户更快更方便地用生成式AI产生价值。一、大模型货...……更多
英伟达推出新一代ai芯片,预计今年晚些时候发货
...名为NIM的新产品。NIM可以更容易地使用旧的英伟达GPU进行推理,允许公司继续使用已拥有的数亿个英伟达GPU。这将减少新人工智能模型的初始训练推理所需的算力。英伟达的策略是让购买英伟达服务器的客户注册英伟达企业版,...……更多
位列第一梯队,腾讯混元再度领跑国内大模型
...维度的综合性测评基准,由十大基础任务组成,包括逻辑推理、代码、语言理解、长文本、角色扮演等。本次报告选取了国内外具有代表性的32个大模型4月份的版本,通过多维度综合性测评,真实准确地反映了国内外大模型在中...……更多
更多关于财经的资讯:
贵州企业“创客中国”全国总决赛斩获全国三等奖
11月27日,第十届“创客中国”中小企业创新创业大赛全国总决赛圆满落幕。在这场代表全国中小企业最高创新水平的巅峰对决中
2025-12-06 05:29:00
东华软件成立新公司,含智能农业管理业务
近日,东华软件(塔城市)有限公司成立,注册资本5000万元,经营范围包含:智能控制系统集成;智能农业管理;大数据服务;数据处理服务等。企查查股权穿透显示,该公司由东华软件(002
2025-12-05 14:24:00
赣锋锂业、世荣兆业成立新能源公司,含热力生产和供应业务
近日,南昌珠赣新能源有限公司成立,法定代表人为余少华,注册资本为2000万元,经营范围包含:热力生产和供应,生物质燃料加工
2025-12-05 14:24:00
岱美股份成立智创机器人科技公司
近日,上海岱美智创机器人科技有限公司成立,注册资本1亿元,经营范围包含:智能机器人的研发;工业机器人制造;特殊作业机器人制造;服务消费机器人制造等。企查查股权穿透显示,该公司由岱
2025-12-05 14:24:00
三一重工成立智能机械公司
近日,安徽三昱智能机械有限公司成立,法定代表人为柴文俊,注册资本为1000万元,经营范围包含:机械设备销售;建筑工程用机械销售
2025-12-05 14:24:00
东方电气投资成立数智科技公司
近日,东方电气(安平)数智科技有限公司成立,法定代表人为王潇,经营范围包含:新兴能源技术研发;储能技术服务;合同能源管理
2025-12-05 14:36:00
“公益+教育”守护平安路 平安产险河南分公司积极探索交通安全治理新路径
大河网讯 近日,在河南,农村地区面临道路交通安全事故高发的严峻挑战。信号灯缺失的“盲区”、路网交织的“迷宫”、安全意识的“短板”
2025-12-05 14:54:00
平安产险许昌中心支公司亮相交通安全宣传日 互动宣教彰显专业与温度
大河网讯 12月2日上午,由许昌市交警支队与许昌广播电视台联合主办的第十四个“全国交通安全日”启动仪式在许昌中原科技学院自强报告厅举行
2025-12-05 14:54:00
交行郑州航空港区支行:反洗钱知识进乡村 筑牢基层金融安全防线
大河网讯 为深入贯彻《中华人民共和国反洗钱法》,破解农村地区金融知识普及薄弱难题,近日,交通银行郑州航空港区支行组建专业宣传团队
2025-12-05 14:55:00
平安产险商丘中心支公司联合交警一大队开展“全国交通安全日”主题宣传活动
大河网讯 12月2日,在第12个“全国交通安全日”到来之际,平安产险商丘中心支公司联合商丘市公安局交警支队一大队,以及1007商丘交通广播
2025-12-05 14:55:00
平安产险洛阳中心支公司获洛阳市公安交通管理支队感谢信
大河网讯 12月1日,平安产险洛阳中心支公司收到洛阳市公安局交通管理支队送来的感谢信,感谢信中对公司热心公益、助力道路交通安全隐患治理工作给予高度肯定
2025-12-05 14:55:00
华夏金融租赁因租赁物不合规、管理不审慎被罚65万元
12月4日,云南金融监管局行政处罚信息公示列表显示,华夏金融租赁有限公司及相关责任人因租赁物不符合监管要求、构筑物租赁业务风险分类管理不审慎被罚款65万元;责任人刘某勇被警告。
2025-12-05 15:12:00
富德生命人寿阿克苏中心支公司因财务数据造假、宣传材料不合规被罚10.5万元
12月4日,阿克苏金融监管分局行政处罚信息公示列表显示,富德生命人寿保险股份有限公司阿克苏中心支公司及相关责任人因财务数据不真实、业务宣传材料不合规被警告并罚款10.5万元。陈某
2025-12-05 15:15:00
海尔周云杰:做企业家IP应该坚守三个原则
12月4日,在2025企业家博鳌论坛期间,海尔集团董事局主席、首席执行官周云杰接受新华社专访,分享了做企业家IP的战略思考与实践路径
2025-12-05 15:31:00
潘峰获批担任郑州银行首席风险官
12月5日,河南金融监管局发布关于潘峰郑州银行股份有限公司首席风险官任职资格的批复,核准潘峰郑州银行股份有限公司首席风险官的任职资格。
2025-12-05 15:58:00