• 我的订阅
  • 头条热搜
本文转自:经济参考报“随着AI从1.0进入2.0大模型技术阶段,我们迎来了有史以来最重要的科技革命和平台革命。”零一万物CEO、创新工场董事长李开复日前在接受记者采访时表示,算力作为AI 2.0发展的关键环节,需要采用更务...……更多
中科大联合华为诺亚Entropy Law,揭秘大模型性能、数据压缩率
...力于推动人工智能领域的技术创新和发展。数据是大语言模型(LLMs)成功的基石,但并非所有数据都有益于模型学习。直觉上,高质量的样本在教授 LLM 上预期会有更好的效率。因此,现有方法通常专注于基于质量的数据选择。...……更多
智能驾驶的「 ChatCPT 时刻」,这么近,那么远
...路线;更早的时候,小鹏公测了基于网络神经的端到端大模型;华为 ADS 3.0 端到端系统将在 8 月推送;极越搭载百度 Apollo 视觉大模型 VTA ,转向端到端路线。让大家寄予厚望的端到端系统,是将智能驾驶推向「ChatGPT 时刻」的关...……更多
大华股份获得发明专利授权:“设备模型升级方法、装置、设备、服务器及存储介质”
...股份(002236)新获得一项发明专利授权,专利名为“设备模型升级方法、装置、设备、服务器及存储介质”,专利申请号为CN202010809190.7,授权日为2025年3月7日。专利摘要:本发明公开了一种设备模型升级方法、装置、设备、服...……更多
如何让“机器不学习”?学会“遗忘”将使新一代AI更出色
...可能会泄露私人数据,计算机科学家们正努力教机器学习模型如何遗忘。虽然这非常困难,但“机器不学习”的解决方案已经开始出现。这项工作除了能解除人们对隐私和错误信息的担忧外,还能起到一个至关重要的作用——如...……更多
...石油天然气股份有限公司申请一项名为“双通道去噪网络模型训练方法、地震数据去噪方法及装置”的专利,公开号CN 119622326 A,申请日期为2023年9月。专利摘要显示,本发明公开了一种双通道去噪网络模型训练方法、地震数据...……更多
算力直降97%,GPT-3存储只用20MB?!这篇新论文火了
...行围观。他提出了一项名为“noise_step”的新技术,允许模型直接在1.58-bit低精度下训练,且无需反向传播或动量(Momentum)加速,从而降低算力和存储消耗。对此,网友们也纷纷发来祝贺,表示很高兴看到模型越来越具有性价比...……更多
刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
大模型领域的技术发展,今天起再次「从 1 开始」了。大语言模型还能向上突破,OpenAI 再次证明了自己的实力。北京时间 9 月 13 日午夜,OpenAI 正式公开一系列全新 AI 大模型,旨在专门解决难题。这是一个重大突破,新模型可...……更多
当AI大模型卷向服务机器人,会有哪些新故事?|硬氪分析
...消息曝光,将机器人再度推上了风口。 过去一年,AI 大模型浪潮中,以大模型+机器人的路径,为人与机器共存提供新的交互模式。甚至有观点认为,机器人大脑的进化速度,主要取决于大模型的发展速度。 市场对机器人的火热...……更多
海康威视申请分类模型相关专利,提高人员分类结果的准确性
...海康威视数字技术股份有限公司申请一项名为“一种分类模型的训练方法及人员分类方法”的专利,公开号CN 119377800 A,申请日期为2024年12月。专利摘要显示,本申请 实施例提供了一种 分类模型的训练方 法及人员分类方法, 涉...……更多
被字节索赔800万的实习生:拿下NeurIPS 2024最佳论文!
...中排名第六,得分达7,8,8,8。今年10月份,有信息称字节大模型训练任务被实习生攻击,“涉及8000多卡、损失上千万美元”。后字节跳动通过官方账号发布事实澄清,称确有实习生发生严重违纪,涉事实习生已于2024年8月被公司辞...……更多
苹果发布mm1.5-ui模型
...13日消息,近日,苹果公司推出了300亿参数的多模态AI大模型MM1.5,该版本是在前代MM1的架构基础上发展而来的。该模型继续遵循数据驱动的训练原则,着重探究在不同训练周期中混合各类数据对模型性能产生的影响,相关模型文...……更多
万字技术干货!LLM工程师必读量化指南,可视化图解揭秘大模型如何压缩
...量化」的基本概念和分支方法进行了全方位总结。大语言模型(LLM)通常过于庞大,无法在消费级硬件上运行。这些模型的参数可能超过数十亿,通常需要显存较大的GPU来加速推理过程。因此,越来越多的研究开始关注如何缩小...……更多
OpenCity大模型预测交通路况,零样本下表现出色,来自港大百度
长时间交通状况预测,可以用大模型实现了。香港大学联合华南理工大学和百度,推出了长时间城市交通预测模型——OpenCity。而且泛化能力极强,可有效应用于广泛的交通预测场景。为了解决传统交通预测模型泛化性及长期预...……更多
3天把Llama训成Mamba,性能不降,推理更快!
...尔、普林斯顿等机构的研究人员成功将Llama提炼成了Mamba模型,并且设计了新的推测解码算法,加速了模型的推理。先来看一张其乐融融的图片(一眼AI):右边的小羊驼代表Llama,而左边的蛇(Mamba)也是我们的老熟人了。至于...……更多
超越YOLOv10/11、RT-DETRv2/3!D-FINE重新定义边界框回归任务
...定性。此外,D-FINE 将定位知识 (Localization Knowledge) 融入到模型输出,通过高效的自蒸馏策略在各层共享这些知识,因而在不增加额外训练成本的前提下,实现了性能的进一步显著提升。 论文标题: D-FINE: Redefine Regression Task of ……更多
微软连发3款Phi-3.5模型:128K上下文,首用MoE架构,部分性能超GPT-4o mini
...东西8月21日消息,今天,微软一口气甩出3款超强轻量级模型!微软本次发布的轻量级模型系列名为Phi-3.5,适合在内存和算力受限的环境中运行,均支持128k上下文长度。Phi-3.5-mini-instruct主要面向基础快速推理任务,Phi-3.5-MoE-instru...……更多
微软连发3款Phi-3.5模型:128K上下文,首用MoE架构,部分性能超GPT-4o mini
...东西8月21日消息,今天,微软一口气甩出3款超强轻量级模型!微软本次发布的轻量级模型系列名为Phi-3.5,适合在内存和算力受限的环境中运行,均支持128k上下文长度。Phi-3.5-mini-instruct主要面向基础快速推理任务,Phi-3.5-MoE-instru...……更多
AI潮起 共筑数智之基
...,中国移动正式发布了由万卡级智算集群、千亿多模态大模型、汇聚百大要素的生态平台共同构成的“九天”人工智能基座,并开放三大人工智能基地,加快大模型产业化、规模化发展,为数字中国建设注入更加强劲动能。集聚...……更多
AI “早筛” 癌症,准确区分13种癌症,准确率98.2%,人类尽早治疗癌症还远吗?
...帝国理工学院和剑桥大学的研究团队训练了一种人工智能模型——EMethylNET,通过观察 DNA 甲基化模式,从非癌组织中识别出 13 种不同类型的癌症(包括乳腺癌、肝癌、肺癌和前列腺癌等),准确率高达 98.2%。相关论文以“Early de...……更多
...预见它的到来并来得及向全世界发出警报?随着大型语言模型,如ChatGPT的兴起,这个问题最近受到了很多关注。这些模型随着规模的增长已经获得了大量新功能。一些研究结果指向了“涌现”现象,即人工智能模型以一种骤然...……更多
扩散模型也能搞定社交信息推荐,港大数据智能实验室提出RecDiff
用扩散模型搞社交信息推荐,怎么解决数据噪声难题?现有的一些自监督学习方法效果还是有限。针对此,港大数据智能实验室提出了新项目RecDiff。RecDiff是一种全新的基于扩散模型的推荐框架,能够更好地捕捉用户的潜在偏好...……更多
“深思熟虑”的 AI:OpenAI 提出全新安全对齐方法
...熟虑的对齐”(Deliberative Alignment)的新方法,以提升 AI 模型安全性,并已在 o 系列模型中取得显著成效。项目背景如何确保大语言模型(LLMs)遵守明确的道德和安全准则,目前存在诸多挑战。监督微调(SFT)和来自人类反馈的...……更多
Mamba再次挑战霸主Transformer!首个通用Mamba开源大模型一鸣惊人
【新智元导读】TII开源全球第一个通用的大型Mamba架构模型Falcon Mamba 7B,性能与Transformer架构模型相媲美,在多个基准测试上的均分超过了Llama 3.1 8B和Mistral 7B。今天,阿布扎比支持的技术创新研究所(TII) 开源了全球第一个通用的...……更多
LLM训练通信量减少10000倍!全新分布式优化器,整合世间算力训练强大AI
...了1000到10000倍!如果可以使用世界上所有的算力来训练AI模型,会怎么样?近日,凭借发布了开源的Hermes 3(基于Llama 3.1)而引起广泛关注的Nous Research,再次宣布了一项重大突破——DisTrO(分布式互联网训练)。通过使用与架构...……更多
腾讯发布最大开源MoE模型,3890亿参数免费可商用
...家本领,来挤开源赛道,突然发布了市面上最大的开源MoE模型。Hunyuan-Large,3890亿总参数,520亿激活参数。跑分超过Llama 3.1 405B等开源旗舰,上下文长度支持也高出一档来到256k。虽然Hunyuan-Large还不算腾讯内部的旗舰模型,但腾讯...……更多
机器人迈向ChatGPT时刻!清华团队首次发现具身智能Scaling Laws
...专家 Ted Xiao 都忍不住为这项研究点赞,称其对机器人大模型时代具有里程碑意义! Scaling Laws:从 ChatGPT 到机器人的制胜法则还记得 ChatGPT 为什么能横空出世吗?答案就是 scaling laws!现在,清华团队首次证明:这个法则在机器...……更多
谷歌世界模型:单张图生成可玩3D世界,还要和马斯克一起做AI游戏
昨晚,世界模型向前迈出了一大步!Google DeepMind 震撼宣布了他们的新一代世界模型 Genie 2,其可根据一张图生成可供人类或 AI 智能体游玩的无限 3D 世界。消息发布后,好评与震惊如潮水般涌现。有人被这技术进步的速度震撼,...……更多
人形机器人的发展历程,一起来看看
...该型号机器人)为了训练生成视频中展示行为的机器学习模型,1X团队在这30台机器人中组装了一个高质量、多样化的演示数据集。这些数据被用来训练出一个基础模型,这个模型可以理解广泛的身体行为,比如清洁整理房屋、...……更多
第一个100%开源的MoE大模型,7B的参数,1B的推理成本
... checkpoint、训练日志和训练数据都已经开源。尽管大语言模型 (LM) 在各种任务上取得了重大进展,但在训练和推理方面,性能和成本之间仍然需要权衡。对于许多学者和开发人员来说,高性能的 LM 是无法访问的,因为它们的构建...……更多
更多关于科技的资讯:
储热赋能双碳 智慧引领供热 泰山集团高电压直入式电储能技术破解能源转型难题
鲁网12月4日讯在“双碳”目标深入推进、能源结构加速转型的时代背景下,电网峰谷差拉大、清洁供热需求迫切、弃风弃光资源浪费等问题成为制约绿色发展的关键瓶颈
2025-12-04 09:57:00
上海街头的数字生活指南,是城市数字品牌与公共艺术的对话
在上海,街头悄然出现的“数字城市指示牌”成为了市民与游客驻足讨论的热点。这些立体的、新颖的指示牌,是“智云上海”这个城市信息化名片的立体呈现
2025-12-04 08:17:00
摘要:随着生成式人工智能技术在各行业的广泛应用,模型输出结果的不确定性问题日益受到关注。为提高模型在关键领域的可靠性,对输出不确定性进行量化分析成为重要方向
2025-12-04 06:17:00
杭州博士后用AI让机器懂协作、更安全杭州日报讯 让机器从执行命令的“孤岛”,成为懂得协作的群体?让机器人安全走进人类生活
2025-12-04 06:38:00
12月3日从紫林醋业获悉,紫林醋业部分主导产品通过欧盟有机认证(EU Organic Certification),获准使用欧盟统一有机标识“欧洲叶标”(Euro-Leaf)
2025-12-04 07:31:00
中新经纬12月3日电 12月3日,豆包手机助手在官方微信号就“侵犯用户隐私”等问题进行回应,称不存在任何黑客行为。具体来看
2025-12-04 07:42:00
支付宝AI4SDL研发安全体系斩获首届“AI领航杯”星光金奖
12月1日-3日,由中国互联网协会主办的2025“人工智能+”产业生态大会在北京举办。开幕式上,首届“AI领航杯”“人工智能+”应用与技能大赛总决赛举行了隆重的颁奖仪式
2025-12-04 07:47:00
近期,在“智绘星空胜算在天—太空数据中心建设工作推进会”上,北京拟在700—800公里晨昏轨道建设运营超GW(千兆瓦)级集中式大型数据中心系统
2025-12-03 09:42:00
太极韵动武汉,一场独属于银发爱好者的健康之约
承武当余韵,赴江城之约——小糖乐学以“传韵江城汇,小糖太极行”为引,再启太极文化与健康同行之旅。继武当山“问道太极”盛会圆满落幕
2025-12-03 13:40:00
杭州日报讯 产品还没走下生产线,就能在虚拟世界预知它未来十年会不会开裂、变形——这样的场景正在杭州成为现实。日前,工业科技企业浙江远算科技有限公司发布“AI质检数实融合验证平台”
2025-12-03 13:41:00
本报记者 陆春花 为进一步深化江苏与中东地区在“一带一路”倡议下的经贸合作,推动江苏制造高质量“走出去”、精准“引进来”
2025-12-03 13:41:00
曹操出行与越疆合作,人形机器人入驻行业首个“绿色智能通行岛”,推进具身智能在出行、物流领域的规模化应用
12月1日,曹操出行与越疆科技正式签署战略合作协议。双方将围绕Robotaxi(自动驾驶出租车)运营场景,共同探索机器人技术在车辆清洁
2025-12-03 13:41:00
江苏“领航工厂”引领“智造”变革
从“智慧车间”到“工业大脑”,“江苏智造”通过数据驱动全流程变革,赋能产业链协同升级 近日,全国首批15家领航级智能工厂名单发布
2025-12-03 13:41:00
国内首款AI助盲眼镜发布,基于通义千问打造
12月3日,杭州瞳行科技公司正式发布国内首款AI助盲眼镜。该眼镜基于通义千问Qwen-VL、OCR等系列模型打造,具有出行避障
2025-12-03 13:41:00
橙友“橙汁儿”向橙柿直通车反映:这几天收到了短信,是杭州市公共自行车公司发来的——“尊敬的用户,由于业务升级,您之前办理的绑卡租车功能即将在2025年12月底取消
2025-12-03 13:41:00