• 我的订阅
  • 科技

谷歌在AI赛道加速

类别:科技 发布时间:2024-07-11 09:47:00 来源:虎嗅APP

7月8日消息,Google 的 AI 研究实验室Google DeepMind 发布了一项关于训练 AI 模型的新研究,Google 声称,该研究将大大提高训练速度和能效,比其他方法的性能高出 13 倍,能效高出 10 倍。

随着有关 AI 数据中心对环境影响的讨论日益升温,新的 JEST 训练方法的出现可谓恰逢其时。

谷歌在AI赛道加速

DeepMind 的方法被称为 JEST 或联合示例选择,它以一种简单的方式打破了传统的 AI 模型训练技术。典型的训练方法侧重于单个数据点进行训练和学习,而 JEST 则基于整个批次进行训练。JEST 技术的核心突破在于其独特的联合示例选择机制,该机制通过分析数据批次之间的相互关系,实现了更高效的学习效果。

JEST 技术使用两种模型——学习者模型和参考模型——来共同评估数据批次的可学习性。学习者模型负责捕捉数据中的复杂模式,而参考模型则提供了一种基线,用于衡量数据批次的学习潜力。通过对比两者之间的差异,JEST 能够更准确地识别出哪些数据对模型学习最为关键,挑选出最具学习价值的批次进行训练,从而大幅提高学习效率。

谷歌在AI赛道加速

上面的图表显示了 JEST 方法在速度和 FLOPS 效率方面如何超越 SigLIP(用于在图像-字幕对上训练模型的前沿方法),以及超越许多其他方法。(数据来自Google DeepMind )

研究显示,JEST 技术具有广泛的应用前景,可以应用于图像-文本预训练、视觉问答、图像描述、视觉推理、多模态检索等多个领域。它有望推动多模态学习技术的进一步发展,并为人工智能领域带来新的突破。

当然,该系统完全依赖于其训练数据的质量,如果没有人工整理的最高质量的数据集,引导技术就会失效。这意味着,相比其他方法,业余爱好者或业余人工智能开发人员更加难以与 JEST 方法相兼容,因为可能需要专家级的研究技能来整理最初的最高等级的训练数据。

随着有关 AI 数据中心对环境影响的讨论日益升温,科技行业和世界各国政府已经开始讨论人工智能的极端电力需求。JEST 研究的推出可能一定程度上缓解了AI领域的算量焦虑。

2023年,人工智能工作负载约占 4.3 GW,几乎与塞浦路斯全国的年电力消耗相当。到今年6月,一些AI公司已经在考虑利用核电。而且,AI“吞电”速度绝对不会减缓:单个 ChatGPT 请求的耗电量是 Google 搜索的 10 倍,Arm 的首席执行官估计,到 2030 年,人工智能将占据美国电网的四分之一。

据报道,GPT-4o 的训练成本为 1 亿美元,未来更大的模型可能很快就会达到 10 亿美元大关,因此公司很可能正在寻找在这方面节省开支的方法。有人认为,JEST 方法将用于在更低的功耗下保持当前的训练生产率,从而降低 AI 成本并帮助地球。

然而,更有可能的是,资本机器将保持全速,使用 JEST 方法将功耗保持在最大水平,以实超快速的训练输出。成本节约与产出规模,谁会赢?

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-07-11 11:45:10

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

较传统采标方法降本80%,合成数据服务商「卓印智能」获天使轮融资 | 36氪首发
...正是基于这样的背景,于2022年成立。团队先从自动驾驶赛道切入,为客户提供高质量的合成数据服务。截至2024年5月,团队已经获得自动驾驶、机器人领域多个头部客户超2000万的
2024-05-31 13:59:00
AIGC 时代,Amazon DeepRacer 带你驶入机器学习的快车道
...学习实践而打造,旨在模拟现实世界的条件,同时在物理赛道上测试RL模型。Amazon Deep Racer 硬件规格作为一个教具
2023-08-08 18:00:00
AIGC生成图像加速度 百亿赛道将开启
...网巨头、AI独角兽等各行业玩家也在集体涌进AIGC图像生成赛道,如百度的文心一格、腾讯的AI画匠、蓝色光标的“创意画廊”等
2023-04-23 16:45:00
别只盯着ChatGPT版Her,多模态AI拟人互动上,国内玩家也支棱起来了
...ba.github.io/MER2024-website/#organization本届挑战赛共设置了三个赛道,分别为 Semi(半监督学习赛道)
2024-08-01 09:34:00
腾讯发布最大开源MoE模型,3890亿参数免费可商用
腾讯拿出看家本领,来挤开源赛道,突然发布了市面上最大的开源MoE模型。Hunyuan-Large,3890亿总参数,520亿激活参数
2024-11-07 09:54:00
撞墙还是新起点?自回归模型在图像领域展现出Scaling潜力
...会 work」将自回归模型应用于视觉生成并不是一条拥挤的赛道,因为众所周知,想要跑通这条路线需要克服很多难点,比如生成速度慢、长程依赖难建模、高分辨率扩展性差、生成质量受限等
2024-11-27 13:32:00
只要一张图就能还原绘画过程,这篇论文比Paints-UNDO实现得更早
...疑为艺术教育提供了新工具,同时也为 AIGC 社区开辟了新赛道。也许不久的将来,Civitai 上会有各种模拟人类画师绘画过程的不同 Lora 出现。更多细节,欢迎阅读论文原
2024-07-31 09:39:00
深度学习在AI教育中的应用及其关键技术探究
...一化以及特征选择和降维技术。最后,介绍了模型构建和训练的关键步骤,包括深度学习模型的选择和设计、模型初始化和参数调整、批量梯度下降和优化算法以及学习率调整和模型评估。通过这些
2023-09-12 11:30:00
MSRA:视觉生成六大技术问题
文生图、文生视频,视觉生成赛道火热,但仍存在亟需解决的问题。微软亚洲研究院研究员古纾旸对此进行了梳理,他认为视觉信号拆分是最本质的问题。生成模型的目标是拟合目标数据分布,然而,目
2024-07-15 09:34:00
更多关于科技的资讯:
人气旺 厦门多个商场假日客流爆棚、销售额亮眼
集美大悦城商圈内,小朋友和机器人亲密互动。(本组图/厦门日报记者 黄晓珍 摄)国庆中秋假期, 厦门SM购物中心潮玩店内人气火爆
2025-10-04 09:20:00
省数据和政务服务局发布公告公开征集一批河北省高质量数据集河北日报讯(记者解楚楚)9月26日,河北省数据和政务服务局发布公告
2025-10-04 08:03:00
央媒看太原9月30日,央视财经频道《经济信息联播》栏目以《双节市场备货足美食特产受青睐》为题,报道了假期到来,太原市各大综合市场提前备货
2025-10-04 07:17:00
厦门网讯(厦门日报记者 朱道衡)近日,2025鼓浪屿世遗文创作品征集活动启动。此次活动面向全国(含港澳台地区)高校、企业
2025-10-03 08:37:00
厦门网讯(厦门日报记者 楚燕 通讯员 石青青)长假期间,许多人从忙碌的工作中解脱出来,趁机好好休息。可是,如果休息方式不得当
2025-10-03 08:37:00
渤海之潮涌动着澎湃的脉搏,海河之畔镌刻着科技的印记。10年前,一颗带有“清华”基因的种子在天津这片沃土扎根;10年后,它长成一棵枝繁叶茂的参天大树
2025-10-03 09:25:00
太燃了!无人机空中展旗!高新区国庆“氛围组”已上线!
2025-10-03 23:48:00
抖音生活服务联合北京卫视发起“老板驾到”直播活动,吸引用户下单超100万元团购券
9月29日,抖音生活服务联合北京卫视发起“老板驾到”直播活动,助力北京国庆中秋消费。抖音用户在@北京卫视 直播间下单超1万次
2025-10-03 18:36:00
“FutureBOT未来引力”2025北京机器人文化节首日盛况 打造国庆科技打卡新地标
国庆首日,“FutureBOT未来引力”2025北京机器人文化节在北京昌平超极合生汇正式拉开帷幕,成为国庆假期极具科技温度的打卡地
2025-10-03 19:06:00
走到白石山巅的尽头,这家建在悬崖边的“云端咖啡厅”绝对让你惊呼。
2025-10-03 11:37:00
泰康人寿发布新品“泰康百万药无忧(庆典版)医疗保险”(以下‬简称“百万药无忧”),以广覆盖、易投保、强保障、低费率为优势
2025-10-03 09:17:00
厦门网讯(厦门日报记者 翁华鸿 通讯员 林雨新)在近日举行的2025全球数据管理峰会“数据要素分论坛暨大数据统计与人工智能技术创新管理研讨会”上
2025-10-03 08:38:00
兴趣-实践-视野:达芬奇金奖少年带来的教育启示录
摘要:2025“你是达芬奇”全球青少年科学与艺术创新赛圆满落幕,其中金奖获奖少年的亲身实践告诉我们,在AI赋能的新时代
2025-10-02 16:22:00
单日调用近1万亿次,高德助力北斗规模化民用跨入新量级
2025年10月1日,随着国庆长假首日出行高峰的到来,高德基于北斗卫星导航系统的定位数量接近1万亿次,支撑导航总里程数超90亿公里
2025-10-02 22:31:00
10月1日,从太钢获悉,今年以来,太钢不锈进料加工团队以“精准备案、高效协同”为核心,在进料铬铁镍铁资源利用方面取得突破性进展
2025-10-02 17:39:00