• 我的订阅
  • 科技

比ChatGPT省电10倍 Google研训练AI模型新方法

类别:科技 发布时间:2024-07-09 17:41:00 来源:十轮网
比ChatGPT省电10倍 Google研训练AI模型新方法

人工智能为人类带来便利性的同时也对能源造成负担,有数据指出ChatGPT一天用超过50万度电,而每处理5-50个提示就会消耗接近半公升水冷却运算系统,情况令人堪忧。有见及此,Google DeepMind研究团队近日提出一种加快人工智能训练的新方法,使用多模态对比学习与联合范例选择(JEST)能大大减少训练人工智能所需的计算资源和时间,其迭代次数比现在少13倍而运算量也少10倍,成功超越最先进的模型。

根据Google DeepMind研究团队发布的研究报告,数据品质是预训练表现的重要驱动因素。Phi-3、Gemma 2等模型表明,更少但高品质的数据可以实现更强大的性能。若要筛选出高品质的数据,关键是需创建有效的数据渠道。现在大致分为手动管理和基于模型的数据管理方法,但前者成本高且难以扩展,而后者则有望为多模态大规模语言模型(LLM)实现Scaling Law。

研究团队发布的JEST原理简单易懂,模型会从“超级batch”中筛选出“子batch”,能显著提升学习效率。研究数据指出,当过滤90%的数据时,JEST可提升6%性能,而在以运算为代价来最大化训练速度或效率的情况下,JEST相对于可比较的IID训练运行可加速13倍。

研究报告展示JEST数据品质引导的巨大潜力,即使小规模的精选数据集也能指导对更大未经管理的数据集的学习,为人工智能和多模态模型的发展开创新方向。

数据源:Tom's Hardware

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-07-09 21:45:01

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

据外媒Techruch报道,初创人工智能公司「Flower lands」近期宣布完成360万美元的pre-seed轮融资
2023-08-09 19:05:00
谷歌在AI赛道加速
...个领域。它有望推动多模态学习技术的进一步发展,并为人工智能领域带来新的突破。当然,该系统完全依赖于其训练数据的质量,如果没有人工整理的最高质量的数据集,引导技术就会失效。这意
2024-07-11 09:47:00
...的数据,对于 AI 训练来说,这些数据,可能要见底了。人工智能研究和预测组织 Epoch 发表的一篇论文里预测,高质量的文本数据会在 2023-2027 年之间消耗殆尽
2023-07-17 15:49:00
清华教授唐杰:Scaling Laws虽被质疑,但至今仍是提高大模型性能的重要方法
清华大学计算机系讲席教授、人工智能研究院基础模型研究中心主任唐杰出品|搜狐科技作者|郑松毅2024年已过半,大模型之争热度不减,通往AGI的路究竟该怎么走?近日,清华大学计算机系
2024-06-05 18:36:00
一文看尽Meta开源大礼包!全面覆盖图像分割、语音、文本、表征、材料发现、密码安全性等
...迅猛的助推剂,而其中的一股重要力量就是来自MetaMeta在人工智能开源界可谓是硕果颇丰,从大模型LLama到图像分割模型Segment Anything
2024-11-28 12:02:00
深度学习在AI教育中的应用及其关键技术探究
...性能。关键字:深度学习;神经网络; AI教育引言:随着人工智能技术的不断发展,深度学习作为其中的重要分支,在各个领域都有广泛的应用。在教育领域,深度学习技术可以为学生提供更个
2023-09-12 11:30:00
百川智能发布baichuan3稳定语言模型
1月29日,百川智能发布超千亿参数的大语言模型Baichuan3。在多个权威通用能力评测如CMMLU、GAOKAO和AGI-Eval中
2024-01-29 19:57:00
影响英伟达根本逻辑的大争论:OpenAI改变策略意味着什么?谁在撒谎?
...相关技术的应用最终推动OpenAI发布o1模型。这可能会改变人工智能硬件的竞争格局。目前为止,AI硬件市场主要由对英伟达训练芯片的无限需求主导。但如果通过增加训练时间和测试(
2024-11-13 14:09:00
如何让“机器不学习”?学会“遗忘”将使新一代AI更出色
由于人们担心人工智能(AI)驱动的聊天机器人可能会泄露私人数据,计算机科学家们正努力教机器学习模型如何遗忘。虽然这非常困难,但“机器不学习”的解决方案已经开始出现。这项工作除了能
2024-06-14 11:54:00
更多关于科技的资讯:
职场福尔摩斯速成手册:5个细节看穿谁是“真领导”
茶水间摸鱼时偷听到两个实习生争论:“新来的总监开会总爱说‘我觉得’,一看就没领导力!”“你懂啥,人家之前带团队拿过行业大奖
2025-04-02 09:00:00
Mistral AI 米斯特拉尔 的AI+金融,打造全球最精准的智能投顾系统
AI在金融领域的应用正迎来革命性突破,而MistralAI米斯特拉尔站在这一浪潮的最前沿。公司最新推出的AI+金融解决方案
2025-04-02 09:16:00
嘉兴卓威科技:以创新智造赋能健康未来,远红外治疗仪获双证认证
近日,嘉兴卓威科技有限公司(以下简称“卓威科技”)自主研发的“接触式远红外治疗仪”正式通过浙江省药品监督管理局医疗注册证及生产许可证双认证
2025-04-02 09:16:00
在国家大力推进新型城镇化建设和建筑业转型升级的大背景下,建筑工程领域正迎来前所未有的发展机遇。随着城市基础设施建设的不断推进和建筑技术的日新月异
2025-04-02 09:16:00
爱凯奇品牌郑朝君匠心铸就中国轻工业新标杆‌
导语‌2025年3月,中国轻工业领域迎来高光时刻——爱凯奇品牌携其创始人郑朝君先生的创业故事与品牌理念,强势登陆央视综合频道(CCTV-1)爱凯奇央视广告播出ID号(2510595470050021)
2025-04-02 09:17:00
链动济宁①|以链式突围制胜,济宁工程机械千亿舰队加速驶向全球
齐鲁晚报·齐鲁壹点 孔茜中国工程机械行业春潮涌动。中国工程机械工业协会最新数据显示,2025年2月国内挖掘机销量达19270台
2025-04-02 09:25:00
本文转自:人民网-青海频道况玉人民网记者:南京智算中心在全国处于怎样的地位?青海移动算力分公司市场拓展部经理江恺瑞:南京智能计算中心是全国首批9家建设的国家新一代人工智能公共算力开放创新平台之一
2025-04-02 09:39:00
创想三维11周年店庆,3D打印机享国补+百亿补贴,惊喜上线
今年4月9日,创想三维即将迎来成立11周年的里程碑。作为全球消费级3D打印生态领创者,创想三维以先进技术与卓越品质,赢得全球500万创客用户青睐
2025-04-02 09:45:00
DeepSeek预测中大型企业招聘优先挑选AI招聘系统!
在数字化转型浪潮席卷全球的当下,人工智能(AI)正以前所未有的速度重塑企业运营的每一个环节。近日,知名行业研究机构DeepSeek发布《2024企业招聘技术趋势报告》
2025-04-02 09:45:00
2025中关村论坛年会:人工智能引领科技变革与产业升级
3月27日至31日,由科技部、国家发展改革委、国务院国资委、中国科学院、中国工程院、中国科协和北京市政府共同主办的2025中关村论坛年会在京举行
2025-04-02 09:45:00
中微公司等离子体刻蚀技术再获重大突破,引领行业迈向新高度
近日,中微半导体设备(上海)股份有限公司(股票代码:688012.SH,以下简称“中微公司”)传出振奋人心的消息。通过持续提升反应台之间气体控制精度
2025-04-02 09:51:00
蚂蚁消金被罚140万,合规警钟为谁而鸣?
文|罗曾日前,国家金融监督管理总局重庆监管局的一纸罚单,将重庆蚂蚁消费金融有限公司(下称“蚂蚁消金”)推至风口浪尖。这家成立不足四年的消费金融巨头
2025-04-02 09:52:00
首届中国手机摄影大展正式启动
本文转自:人民网首届中国手机摄影大展系列活动在四川省巴中市正式启动。作为首个国家级手机摄影品牌活动,本届手机摄影大展以“人人都是创作者”为主题
2025-04-02 10:11:00
数智赋能开启中小微商户运营新篇章
鲁网4月1日讯(记者 郑泽之 通讯员 张沙沙)在数字经济浪潮下,中小微商户的生存与发展正经历深刻变革。随着5G、云计算
2025-04-02 10:11:00
古贝春百年老窖金装酒荣膺2024年度“青酌奖”酒类新品
鲁网4月1日讯(记者 吴美琳)3月28日,在四川泸州举办的第二十二届中国国际酒业博览会上,中国酒业协会正式揭晓2024年度“青酌奖”酒类新品评选结果
2025-04-02 10:12:00