模型,训练,方法,模型,训练,视觉头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

李开复：AI大模型产业如何找到“算力”最优解

本文转自：经济参考报“随着AI从1.0进入2.0大模型技术阶段，我们迎来了有史以来最重要的科技革命和平台革命。”零一万物CEO、创新工场董事长李开复日前在接受记者采访时表示，算力作为AI 2.0发展的关键环节，需要采用更务...……更多

2024-06-17 04:28:00李开复,模型,产业,模型,应用,万物

中科大联合华为诺亚Entropy Law，揭秘大模型性能、数

...力于推动人工智能领域的技术创新和发展。数据是大语言模型（LLMs）成功的基石，但并非所有数据都有益于模型学习。直觉上，高质量的样本在教授 LLM 上预期会有更好的效率。因此，现有方法通常专注于基于质量的数据选择。...……更多

2024-07-23 09:41:00诺亚,华为,模型,性能,联合,数据

智能驾驶的「 ChatCPT 时刻」，这么近，那么远

...路线；更早的时候，小鹏公测了基于网络神经的端到端大模型；华为 ADS 3.0 端到端系统将在 8 月推送；极越搭载百度 Apollo 视觉大模型 VTA ，转向端到端路线。让大家寄予厚望的端到端系统，是将智能驾驶推向「ChatGPT 时刻」的关...……更多

2024-06-28 14:06:00驾驶,时刻,智能,驾驶,特斯,特斯拉

大华股份获得发明专利授权：“设备模型升级方法、装置、设备、服

...股份（002236）新获得一项发明专利授权，专利名为“设备模型升级方法、装置、设备、服务器及存储介质”，专利申请号为CN202010809190.7，授权日为2025年3月7日。专利摘要：本发明公开了一种设备模型升级方法、装置、设备、服...……更多

2025-03-08 04:37:00大华,设备,介质,装置,模型,存储

如何让“机器不学习”？学会“遗忘”将使新一代AI更出色

...可能会泄露私人数据，计算机科学家们正努力教机器学习模型如何遗忘。虽然这非常困难，但“机器不学习”的解决方案已经开始出现。这项工作除了能解除人们对隐私和错误信息的担忧外，还能起到一个至关重要的作用——如...……更多

2024-06-14 11:54:00新一代,机器,学习,模型,数据,训练

中国石油申请双通道去噪网络模型相关专利，能够高效率、高精度的

...石油天然气股份有限公司申请一项名为“双通道去噪网络模型训练方法、地震数据去噪方法及装置”的专利，公开号CN 119622326 A，申请日期为2023年9月。专利摘要显示，本发明公开了一种双通道去噪网络模型训练方法、地震数据...……更多

2025-03-18 16:25:00地震数据,高精,高精度,噪声,高效率,中国

算力直降97%，GPT-3存储只用20MB？！这篇新论文火了

...行围观。他提出了一项名为“noise_step”的新技术，允许模型直接在1.58-bit低精度下训练，且无需反向传播或动量（Momentum）加速，从而降低算力和存储消耗。对此，网友们也纷纷发来祝贺，表示很高兴看到模型越来越具有性价比...……更多

2024-12-30 09:11:00文火,新论,存储,训练,小哥,模型

刚刚，OpenAI震撼发布o1大模型！强化学习突破LLM推理

大模型领域的技术发展，今天起再次「从 1 开始」了。大语言模型还能向上突破，OpenAI 再次证明了自己的实力。北京时间 9 月 13 日午夜，OpenAI 正式公开一系列全新 AI 大模型，旨在专门解决难题。这是一个重大突破，新模型可...……更多

2024-09-13 16:42:00推理,模型,极限,突破,学习,模型

当AI大模型卷向服务机器人，会有哪些新故事？｜硬氪分析

...消息曝光，将机器人再度推上了风口。过去一年，AI 大模型浪潮中，以大模型+机器人的路径，为人与机器共存提供新的交互模式。甚至有观点认为，机器人大脑的进化速度，主要取决于大模型的发展速度。市场对机器人的火热...……更多

2024-03-13 12:10:00机器人,模型,机器,故事,分析,服务

海康威视申请分类模型相关专利，提高人员分类结果的准确性

...海康威视数字技术股份有限公司申请一项名为“一种分类模型的训练方法及人员分类方法”的专利，公开号CN 119377800 A，申请日期为2024年12月。专利摘要显示，本申请实施例提供了一种分类模型的训练方法及人员分类方法，涉...……更多

2025-01-30 21:42:00海康,威视,分类,模型,准确性,专利

被字节索赔800万的实习生：拿下NeurIPS 2024最佳

...中排名第六，得分达7,8,8,8。今年10月份，有信息称字节大模型训练任务被实习生攻击，“涉及8000多卡、损失上千万美元”。后字节跳动通过官方账号发布事实澄清，称确有实习生发生严重违纪，涉事实习生已于2024年8月被公司辞...……更多

2024-12-04 15:08:00实习生,索赔,字节,实习,论文,模型

苹果发布mm1.5-ui模型

...13日消息，近日，苹果公司推出了300亿参数的多模态AI大模型MM1.5，该版本是在前代MM1的架构基础上发展而来的。该模型继续遵循数据驱动的训练原则，着重探究在不同训练周期中混合各类数据对模型性能产生的影响，相关模型文...……更多

2024-10-13 10:57:00模型,苹果,模型,苹果公司,数据,苹果

万字技术干货！LLM工程师必读量化指南，可视化图解揭秘大模型

...量化」的基本概念和分支方法进行了全方位总结。大语言模型（LLM）通常过于庞大，无法在消费级硬件上运行。这些模型的参数可能超过数十亿，通常需要显存较大的GPU来加速推理过程。因此，越来越多的研究开始关注如何缩小...……更多

2024-08-01 09:38:00干货,可视化,模型,工程师,指南,工程

OpenCity大模型预测交通路况，零样本下表现出色，来自港

长时间交通状况预测，可以用大模型实现了。香港大学联合华南理工大学和百度，推出了长时间城市交通预测模型——OpenCity。而且泛化能力极强，可有效应用于广泛的交通预测场景。为了解决传统交通预测模型泛化性及长期预...……更多

2024-09-02 13:34:00路况,样本,模型,交通,交通,模型

3天把Llama训成Mamba，性能不降，推理更快！

...尔、普林斯顿等机构的研究人员成功将Llama提炼成了Mamba模型，并且设计了新的推测解码算法，加速了模型的推理。先来看一张其乐融融的图片（一眼AI）：右边的小羊驼代表Llama，而左边的蛇（Mamba）也是我们的老熟人了。至于...……更多

2024-09-06 10:01:00推理,更快,性能,模型,输出,训练

超越YOLOv10/11、RT-DETRv2/3！D-FIN

...定性。此外，D-FINE 将定位知识 (Localization Knowledge) 融入到模型输出，通过高效的自蒸馏策略在各层共享这些知识，因而在不增加额外训练成本的前提下，实现了性能的进一步显著提升。论文标题: D-FINE: Redefine Regression Task of ……更多

2024-10-30 09:52:00边界,任务,检测,目标,边界,进一

微软连发3款Phi-3.5模型：128K上下文，首用MoE架

...东西8月21日消息，今天，微软一口气甩出3款超强轻量级模型！微软本次发布的轻量级模型系列名为Phi-3.5，适合在内存和算力受限的环境中运行，均支持128k上下文长度。Phi-3.5-mini-instruct主要面向基础快速推理任务，Phi-3.5-MoE-instru...……更多

2024-08-22 09:49:00上下文,微软,架构,模型,上下,性能

微软连发3款Phi-3.5模型：128K上下文，首用MoE架

2024-08-22 09:49:00上下文,微软,架构,模型,上下,性能

AI潮起共筑数智之基

...，中国移动正式发布了由万卡级智算集群、千亿多模态大模型、汇聚百大要素的生态平台共同构成的“九天”人工智能基座，并开放三大人工智能基地，加快大模型产业化、规模化发展，为数字中国建设注入更加强劲动能。集聚...……更多

2024-05-25 07:21:00潮起,模型,中国,中国移动,移动,模态

AI “早筛” 癌症，准确区分13种癌症，准确率98.2%，

...帝国理工学院和剑桥大学的研究团队训练了一种人工智能模型——EMethylNET，通过观察 DNA 甲基化模式，从非癌组织中识别出 13 种不同类型的癌症（包括乳腺癌、肝癌、肺癌和前列腺癌等），准确率高达 98.2%。相关论文以“Early de...……更多

2024-06-27 08:48:00癌症,准确率,人类,治疗,癌症,模型

超级人工智能会偷袭人类吗？

...预见它的到来并来得及向全世界发出警报？随着大型语言模型，如ChatGPT的兴起，这个问题最近受到了很多关注。这些模型随着规模的增长已经获得了大量新功能。一些研究结果指向了“涌现”现象，即人工智能模型以一种骤然...……更多

2023-12-29 07:44:00人工智能,人工,人类,智能,模型,研究

扩散模型也能搞定社交信息推荐，港大数据智能实验室提出RecD

用扩散模型搞社交信息推荐，怎么解决数据噪声难题？现有的一些自监督学习方法效果还是有限。针对此，港大数据智能实验室提出了新项目RecDiff。RecDiff是一种全新的基于扩散模型的推荐框架，能够更好地捕捉用户的潜在偏好...……更多

2024-07-30 09:31:00社交,实验室,模型,实验,智能,数据

“深思熟虑”的 AI：OpenAI 提出全新安全对齐方法

...熟虑的对齐”（Deliberative Alignment）的新方法，以提升 AI 模型安全性，并已在 o 系列模型中取得显著成效。项目背景如何确保大语言模型（LLMs）遵守明确的道德和安全准则，目前存在诸多挑战。监督微调（SFT）和来自人类反馈的...……更多

2024-12-26 09:29:00深思,全新,方法,安全,模型,安全

Mamba再次挑战霸主Transformer！首个通用Mam

【新智元导读】TII开源全球第一个通用的大型Mamba架构模型Falcon Mamba 7B，性能与Transformer架构模型相媲美，在多个基准测试上的均分超过了Llama 3.1 8B和Mistral 7B。今天，阿布扎比支持的技术创新研究所(TII) 开源了全球第一个通用的...……更多

2024-08-14 09:43:00一鸣,霸主,模型,再次,模型,序列

LLM训练通信量减少10000倍！全新分布式优化器，整合世间

...了1000到10000倍！如果可以使用世界上所有的算力来训练AI模型，会怎么样？近日，凭借发布了开源的Hermes 3（基于Llama 3.1）而引起广泛关注的Nous Research，再次宣布了一项重大突破——DisTrO（分布式互联网训练）。通过使用与架构...……更多

2024-09-10 13:39:00训练,分布式,世间,整合,全新,通信

腾讯发布最大开源MoE模型，3890亿参数免费可商用

...家本领，来挤开源赛道，突然发布了市面上最大的开源MoE模型。Hunyuan-Large，3890亿总参数，520亿激活参数。跑分超过Llama 3.1 405B等开源旗舰，上下文长度支持也高出一档来到256k。虽然Hunyuan-Large还不算腾讯内部的旗舰模型，但腾讯...……更多

2024-11-07 09:54:00腾讯,商用,模型,参数,模型,数据

机器人迈向ChatGPT时刻！清华团队首次发现具身智能Sca

...专家 Ted Xiao 都忍不住为这项研究点赞，称其对机器人大模型时代具有里程碑意义！ Scaling Laws：从 ChatGPT 到机器人的制胜法则还记得 ChatGPT 为什么能横空出世吗？答案就是 scaling laws！现在，清华团队首次证明：这个法则在机器...……更多

2024-11-04 09:52:00清华,机器人,团队,机器,时刻,智能

谷歌世界模型：单张图生成可玩3D世界，还要和马斯克一起做AI

昨晚，世界模型向前迈出了一大步！Google DeepMind 震撼宣布了他们的新一代世界模型 Genie 2，其可根据一张图生成可供人类或 AI 智能体游玩的无限 3D 世界。消息发布后，好评与震惊如潮水般涌现。有人被这技术进步的速度震撼，...……更多

2024-12-06 09:53:00马斯,马斯克,世界,生成,模型,生成

人形机器人的发展历程，一起来看看

...该型号机器人）为了训练生成视频中展示行为的机器学习模型，1X团队在这30台机器人中组装了一个高质量、多样化的演示数据集。这些数据被用来训练出一个基础模型，这个模型可以理解广泛的身体行为，比如清洁整理房屋、...……更多

2024-02-10 21:06:00人形,机器人,历程,机器,发展,机器人

第一个100%开源的MoE大模型，7B的参数，1B的推理成本

... checkpoint、训练日志和训练数据都已经开源。尽管大语言模型 (LM) 在各种任务上取得了重大进展，但在训练和推理方面，性能和成本之间仍然需要权衡。对于许多学者和开发人员来说，高性能的 LM 是无法访问的，因为它们的构建...……更多

2024-09-06 10:01:00推理,模型,成本,参数,模型,训练

page 7/3334 首页上一页 2 3 4 5 678 9 10 11 12 下一页末页

更多关于科技的资讯：

储热赋能双碳智慧引领供热泰山集团高电压直入式电储能技术破

鲁网12月4日讯在“双碳”目标深入推进、能源结构加速转型的时代背景下，电网峰谷差拉大、清洁供热需求迫切、弃风弃光资源浪费等问题成为制约绿色发展的关键瓶颈

2025-12-04 09:57:00

上海街头的数字生活指南，是城市数字品牌与公共艺术的对话

在上海，街头悄然出现的“数字城市指示牌”成为了市民与游客驻足讨论的热点。这些立体的、新颖的指示牌，是“智云上海”这个城市信息化名片的立体呈现

2025-12-04 08:17:00

基于提示工程的模型输出不确定性量化分析

摘要：随着生成式人工智能技术在各行业的广泛应用，模型输出结果的不确定性问题日益受到关注。为提高模型在关键领域的可靠性，对输出不确定性进行量化分析成为重要方向

2025-12-04 06:17:00

给智能体装上“大脑”和“小脑”

杭州博士后用AI让机器懂协作、更安全杭州日报讯让机器从执行命令的“孤岛”，成为懂得协作的群体？让机器人安全走进人类生活

2025-12-04 06:38:00

紫林醋业产品通过欧盟认证

12月3日从紫林醋业获悉，紫林醋业部分主导产品通过欧盟有机认证(EU Organic Certification)，获准使用欧盟统一有机标识“欧洲叶标”(Euro-Leaf)

2025-12-04 07:31:00

豆包手机助手回应“侵犯用户隐私”：不存在任何黑客行为

中新经纬12月3日电 12月3日，豆包手机助手在官方微信号就“侵犯用户隐私”等问题进行回应，称不存在任何黑客行为。具体来看

2025-12-04 07:42:00

支付宝AI4SDL研发安全体系斩获首届“AI领航杯”星光金奖

12月1日-3日，由中国互联网协会主办的2025“人工智能+”产业生态大会在北京举办。开幕式上，首届“AI领航杯”“人工智能+”应用与技能大赛总决赛举行了隆重的颁奖仪式

2025-12-04 07:47:00

海内外太空算力布局同步加速

近期，在“智绘星空胜算在天—太空数据中心建设工作推进会”上，北京拟在700—800公里晨昏轨道建设运营超GW(千兆瓦)级集中式大型数据中心系统

2025-12-03 09:42:00

太极韵动武汉，一场独属于银发爱好者的健康之约

承武当余韵,赴江城之约——小糖乐学以“传韵江城汇,小糖太极行”为引,再启太极文化与健康同行之旅。继武当山“问道太极”盛会圆满落幕

2025-12-03 13:40:00

“数字试错”替代“物理试错” 新一代AI质检平台在杭发布

杭州日报讯产品还没走下生产线，就能在虚拟世界预知它未来十年会不会开裂、变形——这样的场景正在杭州成为现实。日前，工业科技企业浙江远算科技有限公司发布“AI质检数实融合验证平台”

2025-12-03 13:41:00

“江苏制造”叩响中东商机

本报记者陆春花为进一步深化江苏与中东地区在“一带一路”倡议下的经贸合作，推动江苏制造高质量“走出去”、精准“引进来”

2025-12-03 13:41:00

曹操出行与越疆合作，人形机器人入驻行业首个“绿色智能通行岛”

12月1日，曹操出行与越疆科技正式签署战略合作协议。双方将围绕Robotaxi（自动驾驶出租车）运营场景，共同探索机器人技术在车辆清洁

2025-12-03 13:41:00

江苏“领航工厂”引领“智造”变革

从“智慧车间”到“工业大脑”，“江苏智造”通过数据驱动全流程变革，赋能产业链协同升级近日，全国首批15家领航级智能工厂名单发布

2025-12-03 13:41:00

国内首款AI助盲眼镜发布，基于通义千问打造

12月3日，杭州瞳行科技公司正式发布国内首款AI助盲眼镜。该眼镜基于通义千问Qwen-VL、OCR等系列模型打造，具有出行避障

2025-12-03 13:41:00

杭州市公共自行车公司发来短信绑卡租车功能即将取消想问一下

橙友“橙汁儿”向橙柿直通车反映：这几天收到了短信，是杭州市公共自行车公司发来的——“尊敬的用户，由于业务升级，您之前办理的绑卡租车功能即将在2025年12月底取消

2025-12-03 13:41:00

头条订阅服务