• 我的订阅
  • 头条热搜
破晓之光:2025 ChinaJoy AIGC大会圆满召开 | ChinaJoy2025
...共生的全新范式落地,深刻重塑内容生产与交互方式。 清华大学人工智能研究院副院长、生数科技创始人兼首席科学家 朱军微软大中华区数字原生事业部技术总经理金亿平此次演讲聚焦于Agentic AI的发展趋势及微软在AI基础设施...……更多
当大模型Scaling Law继续,万卡集群算力释放在百舸找到一条通途
...需求不可避免迎来爆炸式增长,无论是前期训练还是后期推理,都是如此。在训练层面,OpenAI 曾在 2018 年做过估算,自 2012 年以来,AI 模型训练算力需求每 3.5 个月翻一番,每年所需算力增幅高达 10 倍,增速远远超出了芯片产...……更多
...测中,它的综合能力逼近当时的顶尖大模型,尤其在逻辑推理和数学题上展现出强劲性能,而且它的成本要远低于作比较的其他大模型。更令圈内研究者惊喜的,是它在训练方式上的简化。以往的模型在提升推理能力时,通常依...……更多
大模型上岗三甲医院,给每个医生都配个“病历质控助手”
...理、术语标准化后构建患者画像,再经由惠每医疗大模型推理计算做出提醒或预警,同时大模型还可以基于用户的反馈持续进行优化。图:惠每科技病历内涵质控方案架构最终,在界面的呈现上,惠每科技这个系统会有医生端和...……更多
清华大学教授李宗鹏:大模型消除不了幻觉,大语言模型注定没有希望
(在2024大湾区科学论坛现场,清华大学教授李宗鹏接受凤凰网财经的采访)作者|王迪百度李彦宏称大模型基本消除了幻觉,AI从一本正经胡说八道变得可被信赖。清华大学李宗鹏在接受凤凰网财经采访时则指出,大模型永远不...……更多
国产大模型竞技场首超GPT-4o!零一万物GLM共同跻身Top10
...-13、GPT-4o-mini-2024-07-18、Claude 3.5 Sonnet等顶流。同时,国内清华系大模型公司智谱AI的GLM-4-Plus也杀进了总榜,位居第9位。该榜单结果来自全球累积超千万次的人类用户盲测投票。前段时间大模型竞技场还刚刚更新了规则,新榜单...……更多
车企老总下场做IP的时代,AI大模型能改变营销内卷吗?
...几天,斯坦福大学AI团队陷入抄袭风波,被质疑“套壳”清华系大模型开源成果,引起舆论哗然。起因是这个团队在5月29日发布了一个多模态大模型Llama3-V,声称只花500美元训练,就能实现在多个基准测试中比肩GPT-4的性能。但很...……更多
算力概念股,集体爆发
...开AI产品的想象空间。英伟达在业绩交流会中指出,长时推理AI每任务所需的算力可能比单次推理高出100倍。上述券商表示,从DeepSeek到Manus,AI+工具在不断进化,AI+应用也会随之呈现增长态势,对于算力的需求有望持续增加。 ...……更多
比GPU性价比高百倍!Cerebras推出新AI推理服务,号称“全球最快”
...28日消息,AI芯片独角兽Cerebras Systems于8月27日宣布推出AI推理服务Cerebras Inference,号称“全球最快”。该服务已经在云端上线。据官网介绍,该推理服务在保证精度的同时,速度比英伟达的服务快20倍;其处理器内存带宽是英伟达...……更多
...出了更令人震惊的“彩蛋”——成本利润率高达545%,V3/R1推理系统理论日利润达到346万元人民币。而在市场为这超高“暴利”连连感叹的同时,也更关心这几个问题:如何解读545%这个利润率?是否是对算力的核弹?这对云产业...……更多
在杭州,我们看到了阿里AI生态的近百种应用 | 焦点分析
...向量标记的步骤就会形成一个推理数,直至解题。而来自清华的团队“ChatCPU”则直接构建了一个提高芯片生产效率的AI Agent。芯片生产流程十分复杂,尤其在人才短缺的背景下,“ChatCPU”通过构建可以对Design Specification(设计规...……更多
AI出图更快、更懂你心意,高美感文生图模型修炼了哪些技术秘籍?
...等工具如何为部署模型提供支持,助力大模型更加高效地推理。赵一嘉首先分享了 Stable Diffusion 背后模型的原理详解,细致地阐述了 Clip、VAE 和 Unet 等关键组件的工作原理。随着 Sora 爆火,也带火了背后的 DiT(扩散 Transformer)...……更多
...赖算力资源的预训练阶段竞争终结了,下一阶段的重点在推理,并将出现一批新公司,DeepSeek的出现也是必然,用更低的算力资源就可以实现同等甚至更高的效能。虽然这几年大模型发展速度很快,但我们并没有投资大模型项目...……更多
Meta版慢思考来了!田渊栋团队整合快慢思考,能走迷宫推箱子
...本更低。能解决迷宫、推箱子等复杂问题。通过让模型在推理轨迹和最终答案上进行训练,再基于特定策略丢掉部分轨迹,Dualformer模型可以在模仿慢思考的同时,像快思考一样走捷径。由此能形成更简洁的思维链(CoT)。从结...……更多
国家科学技术进步一等奖,为何给了这家AI国家队
...由科大讯飞股份有限公司牵头,联合中国科学技术大学、清华大学、华为终端有限公司、中移(杭州)信息技术有限公司等高校及行业领军企业联合完成的“多语种智能语音关键技术及产业化”项目荣获2023年度国家科技进步奖...……更多
补齐Transformer规划短板又不放弃快速思考,Dualformer双重优势
...些解答或慢点思考。OpenAI ο1 模型的发布掀起了人们对 AI 推理过程的关注,甚至让现在的 AI 行业开始放弃卷越来越大的模型,而是开始针对推理过程进行优化了。今天我们介绍的这项来自 Meta FAIR 田渊栋团队的研究也是如此,其...……更多
山东移动济南分公司2025算力集群服务项目推理功能正式上线
近日,山东移动算力集群服务项目成功实现推理功能上线,标志着该项目取得突破性进展,为山东移动在智能计算领域的发展注入了强劲动力。该项目总投资约2亿元,旨在构建一个千卡级高性能的AI算力集群,集群配备1024块先...……更多
“清华AI医院”上线!首批42位AI医生亮相,诊断覆盖300余种疾病
张亚勤旗下,清华AIR又一孵化项目曝光:紫荆智康,专注AI医疗。他们构建了Agent Hospital(也被称为“清华AI医院”),首批AI医生现已亮相内测!今年5月,由清华大学智能产业研究院(AIR)智慧医疗团队完成的论文“Agent Hospital...……更多
商汤营收恢复增长,亏损收窄至43亿元;CEO徐立回应DeepSeek影响
...长核心引擎。这得益于市场对生成式AI模型训练、微调和推理的需求爆发性增长。过去一年,大模型技术放缓成为不可争议的事实,但AI厂商们也都在谋求应用的突破,其中特别重要的就是如何降低成本。商汤提到,算法与基础...……更多
百川智能、阿里云等进入开源大模型领域,开启商业化前奏
...开源大模型ChatGLM2-6B一开始商用并不免费,7月,智谱AI和清华KEG实验室才决定该模型可免费商用。同时拥有闭源大模型和开源免费大模型的百川智能、阿里云等企业,推出开源免费大模型客观上也有打开知名度的作用。 大模型...……更多
“女巴菲特”预期2030年人形机器人进入家庭,通用AI出现,重仓马斯克
...幅下降。AI 训练性能正在迅速提高。研究人员正在训练和推理、硬件和模型设计方面进行创新,以提高性能并降低成本。随着生产用例的出现,AI 焦点正在转向推理成本。最初关注 LLM 训练成本优化之后,研究人员现在正在优先...……更多
Meta祭出三篇最详尽Llama微调指南!千字长文,0基础小白必备
...类型的信息:- 仅输入和输出文本,也就是少样本学习- 推理追踪:添加中间推理步骤,可参阅思维链(COT)提示- 计划和反思追踪:添加信息,教LLM计划和反思其解决问题的策略,可参阅ReACT 选择正确的适配方法要决定上述哪...……更多
...将主要围绕DeepSeek不同模态、不同尺寸的系列模型,面向推理、微调、训练过程,低成本使用测试工具AISHPerf,从适配成本、功能完备性、优化效果、性能指标等多方面开展测试评估。(完)【编辑:曹子健】 ……更多
文心大模型4.0 Turbo来了!百度推出文心快码2.5,已覆盖内部80%程序员
...考虑到大模型和异构多芯发展趋势,为了保障大模型训练推理性能、简化大模型开发调优过程以及更好地适配各种芯片,飞桨与文心联合,在训练、推理两个方面定向优化。▲飞桨框架设计理念具体来说,动静统一的自动并行能...……更多
...山326TA国产服务器,实现了昇腾算力与DeepSeek系列模型的推理适配优化。其性能表现卓越,媲美高端GPU,为开发者带来高效、灵活且稳定的AI推理服务。在算法和工程上的优化,使得模型在保持高精度的同时,显著降低了计算负担...……更多
摩尔线程与360达成战略合作,将共同打造“360智脑大模型一体机”
...模型一体机”集成了 360 智脑大模型,具备大模型管理、推理部署等功能,摩尔线程全功能 GPU 将为其提供底层算力,“以高性价比硬件方案确保大模型推理效率和成本的平衡”。双方还将共同研发和优化推理框架,在软件层面...……更多
贵州数据宝:“数据+算法+算力”三位一体激发数智动能
...等轻量化手段压缩至企业级算力可承载的规模,保留核心推理能力的同时降低算力门槛。”彭海林说。数据宝推出的企业私域业务模型一体机无独有偶,针对某国际大型零售商的业务需求,数据宝成功部署的AI一体机,AI会自动...……更多
从线性注意力视角揭秘视觉Mamba,清华、阿里合作提出全新MILA模型
Mamba 是一种具有线性计算复杂度的状态空间模型,它能够以线性计算复杂度实现对输入序列的有效建模,在近几个月受到了广泛的关注。本文给出了一个十分有趣的发现:强大的 Mamba 模型与通常被认为性能不佳的线性注意力有...……更多
开拓AI“生态圈”,江苏多地宣布DeepSeek正式登陆
...是降低成本,实现效能飙升。DeepSeek通过自研GRPO算法优化推理成本,结合移动云全网算力布局,整体推理成本降低超13%。预搭载的大模型管理平台和预部署的DeepSeek大模型,让企业无需投入大量时间和资源进行技术开发,直接进...……更多
刘庆峰谈科大讯飞与华为合作:任正非高度重视,双方共同看好,非干不可
...“心中有数”,也很清楚与GPT-4在小样本快速训练、复杂推理、多模态综合使用、长文本内容等方面还有差距。“国内大模型都有不小差距,那些说跟它差不多的,我觉得还是要更客观。要有科学精神,才能真正实现从追赶到超...……更多
更多关于科技的资讯:
12月10日,公测仅23天月活突破3000万后,千问APP正以周为单位快速迭代,意在打造全能“办事”助手,即日起向所有用户首批开放AI PPT
2025-12-10 15:04:00
存量博弈下,潍柴如何用服务增值让客户体验与企业增长双向奔赴?
鲁网12月10日讯当发动机及装备制造业迈入存量竞争深水区,新能源与智能化技术加速迭代,客户需求越来越高,后市场服务早已超越了简单“售后服务”的范畴
2025-12-10 11:25:00
杭州造火箭了!最快明年首飞,“半小时全球直达”
火箭不仅可以向太空发射卫星,还可以送洲际快递,甚至可以建造太空城实现“太空旅居”?这个听起来充满未来感的愿景,正在杭州迈出第一步
2025-12-10 12:19:00
望海康信荣膺国家级专精特新“小巨人”企业称号
近日,望海康信(北京)科技股份公司成功入选北京市第七批专精特新“小巨人”企业名单,荣获由工业和信息化部认定的国家级专精特新“小巨人”企业称号
2025-12-10 12:05:00
图达通港股上市,黄山市深度投资,助力汽车产业升级发展
大皖新闻讯 2025年12月10日,全球顶尖激光雷达制造商图达通正式在香港联合交易所挂牌上市,截至上午10点30分,涨幅50%
2025-12-10 11:32:00
大皖新闻讯 屏幕,作为用户感知数字世界的核心窗口,其进化正迈向关键阶段。随着AMOLED技术加速向笔记本电脑、车载等中大尺寸应用渗透
2025-12-10 10:20:00
100天倒计时|于变化中锚定成长,来京宠展驭见2026
十二年为一纪,自2014年破土而生,北京万耀雄鹰国际展览有限公司举办的京宠展已悄然走过它的第一轮春秋,我们看着行业从青涩走向成熟
2025-12-10 10:43:00
杭州日报讯 还没毕业就带队创业,把密码学原理变成孩子爱玩的闯关游戏。日前,在第十一届杭州市大学生科技创新大赛决赛现场,杭州电子科技大学在校生唐萌团队带来的“秘密传递小特工”项目
2025-12-10 06:43:00
智能穿戴产品打开千亿市场空间
从运动健康到生活全场景︐智能穿戴设备以技术融合重塑消费生态︐开启市场新增长极腕间智能手表实时监测心率,耳畔智能耳机同步语音控制
2025-12-10 07:13:00
病理诊断准确率可达到90%以上,AI破局病理诊断痛点每日商报讯 12月4日-6日,第四届中国智能肿瘤学大会在杭州举行。作为大会核心专题板块之一
2025-12-10 07:44:00
从“卖布料”到“卖创意”杭州日报讯 眼下,绍兴未远品牌管理有限公司负责人周凯正为其一手打造的品牌“GUYUANDAI”筹备新系列的作品
2025-12-10 06:44:00
原佳星摘要:互联网行业的迅速发展使数据成为企业核心资源,统计学专业的重要性随之提升。企业在产品运营、用户分析和商业预测中高度依赖统计能力
2025-12-09 05:45:00
近年来,商品过度包装问题引发社会广泛关注。部分商家为提升商品附加值,通过增加包装层数、扩大空隙率、使用高成本材料等方式制造“包装溢价”
2025-12-09 07:18:00
在杭州,两位潜心科研的博士后,不约而同地将目光投向了地球上空数百公里处的低轨卫星。来自西安电子科技大学杭州研究院的孙冉冉博士
2025-12-09 07:49:00
我省交通行业首个自主创新研发的交通数智大模型太行交通数智大模型发布河北日报讯(曹智、谭磊)12月6日,河北交投集团发布太行交通数智大模型
2025-12-09 08:00:00