• 我的订阅
  • 头条热搜
算力直降97%,GPT-3存储只用20MB?!这篇新论文火了
好家伙!1750亿参数的GPT-3只需20MB存储空间了?!基于1.58-bit训练,在不损失精度的情况下,大幅节省算力(↓97%)和存储(↓90%)。最近,从事机器学习的Will小哥发了一篇论文,直接引来几十万网友or同行围观。他提出了一项...……更多
GPT-4o不会数r,被外国小哥原地逼疯! 谷歌论文揭秘Transformer「数不到n」
...谷歌最近的论文也揭示了本质原因:LLM没有足够空间,来存储计数向量。Strawberry里究竟有几个r,如今已经成为测试模型能力的黄金标准之一了!就在昨天,号称世界最强模型Reflection 70B在证明自己的性能时,证据之一就是「反...……更多
【多彩新论】算力时代 用数字描绘的现实越来越清晰
九天川流出行大模型、“新一代多芯多算力”政企云平台、天翼云一体化计算加速平台......2024数博会发布的十大领先科技成果中,算力平台和大模型成为主流,而这些赋能各行各业的黑科技发明正加快改变着我们的生活。当我...……更多
2022生成模型进展有多快,新论文盘点9类生成模型代表作
ChatGPT的出现,彻底将生成AI推向爆发。但别忘了,AI生成模型可不止ChatGPT一个,光是基于文本输入的就有7种——图像、视频、代码、3D模型、音频、文本、科学知识……尤其2022年,效果好的AI生成模型层出不穷,又以OpenAI、Meta...……更多
苹果新论文证明LLM大模型存在缺陷!没有进行真正的逻辑推理
快科技10月13日消息,近日,苹果公司的AI研究团队发表了一篇题为“Understanding the Limitations of Large Language Models in Mathematical Reasoning”的论文,揭示了大型语言模型(LLM)在数学推理方面的显著局限性。尽管……更多
Llama版o1来了,来自上海AI Lab,强化学习代码已开源,
...问题,作为OpenAI草莓项目的开源版本。10月初,团队上传新论文,使用成对优化(不直接给出绝对分数,而是比较两个答案的相对优劣)提高Llama模型数学奥赛能力。在最难的AIME2024基准测试30道题中,原版LLaMA-3.1-8B-Instruct做对2道...……更多
chatgpt教你写ai包教包会,准确度最高达99.7%
...程,仅凭ChatGPT就可以创建模型。它不仅帮你找数据集、训练模型写代码,还能评估准确性、创建程序一步到位。就有这么一个25岁小哥,让ChatGPT帮他创建了个地理位置识别程序,最终准确率最高达99.7%。而且各种细节步骤全在,...……更多
【多彩新论】 绘好“六大产业基地”工笔画
习近平总书记指出,新时代新征程,以中国式现代化全面推进强国建设、民族复兴伟业,实现新型工业化是关键任务。今年以来,全省坚持把新型工业化作为高质量发展的首要任务,大抓工业、大兴工业、大干工业,着力打造...……更多
Llama3训练每3小时崩一次?豆包大模型、港大为脆皮万卡训练提效
...痛点,检查点(Checkpoint)系统在训练过程中负责状态的存储和恢复,已经成为克服训练故障、保障训练进度和提高训练效率的关键。近日,字节跳动豆包大模型团队与香港大学联合提出了 ByteCheckpoint。这是一个 PyTorch 原生,兼...……更多
浪潮信息推出as13000g7-n系列
...时代下,浪潮信息紧跟时代步伐,于近日推出分布式全闪存储AS13000G7-N系列,专为大模型优化而设,为数据存储带来革命性的突破。该系列依托浪潮信息自研分布式文件系统,搭载新一代数据加速引擎DataTurbo,通过盘控协同、GPU...……更多
70倍极致压缩!大模型的检查点再多也不怕
...里,系统会崩溃 466 次,平均 2.78 小时一次!那么,频繁存储检查点就显得十分必要。但存储检查点本身也是一个大工程。 Meta 做了很多努力来加速存储检查点时间和增加存储频率,来对抗频繁出现的系统失效。但频繁存储也意...……更多
华为AI存储助力中国移动构建超大规模智算集群
...前存在的可用度、推理体验等问题,华为推出业界首款AI存储——OceanStor A800,致力于成为支撑智算集群发展的关键基座。智算集群为千行万业发展新质生产力夯基筑石近年来,智能计算已经成为推动社会发展进步的重要力量。...……更多
谷歌DeepMind推Imagen2;ChatGPT Plus恢复订阅;OpenAI提出用小模型监督大模型 | 本周硅谷发生了什么?
...科学人物,表彰其在ChatGPT开发中的核心作用。OpenAI发布新论文,探讨用小模型监督大模型的方法,为未来超人类AI对齐工作提供支持。Key PointsRunway宣布开展通用世界模型研发Mistral AI发布专家混合模型Mixtral 8x7B微软发布27亿参数...……更多
鄂维南院士领衔新作:大模型不止有RAG、参数存储,还有第3种记忆
...绍了一种支持知识外化的记忆电路理论,并提出了可以让存储易于处理的记忆稀疏机制和促进记忆形成的两阶段预训练方案。总结而言:Memory3 在推理过程中利用显式记忆,减轻了模型参数记忆特定知识的负担;显式记忆是从构...……更多
人工智能的第三支柱:数据存储
借助人工智能数据周期(AI Data Cycle)存储框架,释放数据的AI力量西部数据公司副总裁兼中国区总经理 蔡耀祥西部数据公司副总裁兼中国区总经理蔡耀祥如今,AI无处不在。各个行业正通过对基础设施进行大量投资,来支持创...……更多
【多彩新论】加速建设全国算力高地
作为全国一体化算力网络的重要枢纽,贵州不仅承载着东部数据处理的转移重任,更在算力资源的布局与优化中,探索出了符合自身特色的算力建设新路径,加速向全国算力高地目标迈进。在贵州,算力不再是简单的数据存储...……更多
...就要警惕侵权陷阱和伦理陷阱。技术的“一体两面”并非新论,历史上很多重大的技术革新都曾被视为“双刃剑”,既带来巨大益处,也引发新的挑战和问题。科技能否暖人心,究竟是“数字疗愈”还是“数字陷阱”,最终要看...……更多
大模型是否有推理能力?DeepMind数月前的论文让AI社区吵起来了
...《给小学数学题加句「废话」,OpenAI o1 就翻车了,苹果新论文质疑 AI 推理能力》)。这种现象被归结为「当前的 LLM 无法进行真正的逻辑推理;相反,它们试图复制在训练数据中观察到的推理步骤」。然而,事实真的是这样吗...……更多
AI落地千行百业,存储痛点凸显,浪潮信息如何助力AI向实?
AI时代,存储不仅是数据的栖息之地,更是AI模型训练、落地过程中的坚实底座。在AI开启的存储行业新周期中,众多厂商已将带宽等性能指标卷至新的高度。然而,这种追求似乎将AI这一复杂应用场景简单地“存储化”了。实际...……更多
业界首次!中国联通AI大模型存算分离技术新突破
...通、联通服装制造军团协同攻关,针对AI敏感数据的本地存储异地训练需求提出了创新的业务模式,并成功在杭州与金华两地间实施了业界首次30TB样本数据的跨200公里存算分离拉远训练。经过实际测算,训练效率高达97%以上。中...……更多
Claude自动玩崩铁清日常,NUS新论文完整测评AI电脑操控
Claude操控电脑,究竟可以做到什么程度?新加坡国立大学团队在20多个场景下做了全面测试,其中最引人瞩目的是:AI可以自动玩手游清日常任务了!研究中选用了米哈游《崩坏:星穹铁道》,可以跟它说”帮我完成今天的模拟...……更多
【多彩新论】初心拓展司法审判的社会效应
镇宁自治县法院从司法审判中总结规律,通过智能化赋能,在预防未成年人被侵害方面起到前置预防的作用,拓展了司法审判的社会效应。一般而言,法院以法律之光护卫未成年人,主要是通过案件审判和法律宣传来实现,所...……更多
亚马逊连甩6款大模型!推出3nm AI训练芯片,最强AI服务器算力爆表
...颗Trainium2芯片的集群上进行训练。总体来看,AWS的计算、存储、数据库、AI推理,四大板块都迎来一大波重要更新。一、全新自研大模型Amazon Nova系列登场!文本、图像、视频齐活了亚马逊总裁兼CEO安迪·贾西现场分享了生成式AI...……更多
华为周跃峰:数据觉醒时代,共创数据存储产业新未来
...华为中国合作伙伴大会2024”在深圳隆重举行。华为数据存储产品线总裁周跃峰发表“数据觉醒时代,共创数据存储产业新未来”主题演讲。周跃峰表示,AI大模型加速数据觉醒,华为秉持“以存强算、以存强训、以存强安”的理...……更多
“京东物流超脑”升级 首次揭秘“快准稳”背后的数智化供应链技术全景
...京东物流超脑通过集成先进技术和软硬件协同,从而实现存储、拣选、打包、分拣等场景的全面智能化。在存储环节,基于销售预测动态优化储位布局,大幅提升存储和拣货效率,今年11.11期间,通过智能存储、商品布局优化、...……更多
【多彩新论】小学生作文要用“童真”驱散“油腻”
最近,“油腻”的小学生作文,成为多家媒体的热门话题,还上了微博热搜榜。所谓的油腻,是指小学生作文的修辞和情感泛滥,像裹上了一层油脂,遮蔽了真实的情感流露。有网友举例,鲜花一定是娇艳欲滴的,天空一定是...……更多
00后华裔小哥哈佛辍学组团挑战英伟达,史上最快AI芯片Sohu推理性能超H100二十倍!
...化测试中,超越了人类。 这是怎么做到的?因为Meta用于训练Llama 400B(2024年SOTA模型)的计算量,比OpenAI训练GPT-2(2019年SOTA模型)多5万倍。OpenAI用Scaling Law预测了GPT-4性能,并预计GPT-5+同样适用奥特曼曾说过,「扩展参数规模……更多
infini-attention:谷歌大内存机制
...多的信息。好比一个存放100本书的图书馆,通过新技术能存储11400本书了。这项最新成果立马引发学术圈关注,大佬纷纷围观。加之最近DeepMind也改进了Transformer架构,使其可以动态分配计算资源,以此提高训练效率。有人感慨,...……更多
存储市场“供销两旺”原厂业绩好转,AI对存储应用市场提出要求
近年来,存储市场在终端需求不振、产业链高库存等不利因素下步入下行周期,包括存储原厂在内的产业链企业都遭遇重创,最终三星、SK海力士、美光科技、西部数据和铠侠等厂商纷纷宣布减少产能,并降低关于存储业务的资...……更多
阿里云CTO周靖人:全面投入升级AI大基建
...立一个AI基础设施的新标准,全面升级从服务器到计算、存储、网络、数据处理、模型训练和推理平台的技术架构体系,让数据中心成为一台超级计算机,为每个AI和应用提供高性能、高效的算力服务。大会现场,通义大模型迎...……更多
更多关于科技的资讯:
博主曝华为首款鸿蒙PC:办公软件已基本解决
快科技4月27日消息,在3月举行的华为Pura先锋盛典及鸿蒙智行新品发布会上,华为常务董事、终端BG董事长余承东正式宣布
2025-04-27 20:04:00
再添天文利器!中国首个大型通用光谱望远镜JUST启动建设
快科技4月27日消息,据报道,上海交通大学JUST光谱望远镜基建项目在青海冷湖正式启动建设,标志着我国即将实现大型光谱望远镜从无到有的历史性突破
2025-04-27 20:04:00
全球首个在轨验证星载基站亮相科交会
大皖新闻讯 作为“平天星座”的首发卫星,“池州一号”卫星将于今年年底搭载“池州造”火箭发射升空。“池州一号”卫星由池州星移联信航天科技公司自主研发
2025-04-27 20:23:00
从显示技术到航天动力 蚌埠近200件创新成果闪耀“科交会”
大皖新闻讯 世界首片8.6代OLED玻璃基板彰显国内显示技术的领先实力,“蚌埠造”龙云发动机助力航空航天产业发展……第三届中国(安徽)科技创新成果转化交易会上
2025-04-27 20:23:00
OPPO担任人工智能终端工作组副组长单位
4月25日,人工智能终端产业发展研讨会暨人工智能终端工作组第一次全体大会召开,工业和信息化部副部长熊继军出席会议并致辞
2025-04-27 20:28:00
母亲节送礼攻略 | 野兽派萱草花系列新品
近日,高端艺术生活方式品牌野兽派发布2025母亲节主题大片《每个妈妈都喜欢花》。片中,国民演员赵雅芝与其儿子黄恺杰温情亮相
2025-04-27 20:45:00
何同学风波后复更:为一位女生制作单手键盘
快科技4月27日消息,此前,博主何同学因发布网约车司机求好评相关言论引发争议,不久何同学删博。今日晚间,沉寂两周后何同学复更
2025-04-27 21:04:00
中国青年报客户端讯(中青报·中青网记者 胡春艳 实习生 粟悦)在中国电影诞生120周年、世界电影诞生130周年之际,作为第15届北京国际电影节的重要组成部分
2025-04-27 21:14:00
重庆千里科技股份有限公司总裁周宗成,他以系统性改革思维化解企业经营风险,盘活资产价值;聚焦新能源与“AI+车”智能化赛道
2025-04-27 21:46:00
AI大讲堂 为农业注入“科技芯动能”
近日,四平市科协在四平市农业技术推广总站举办“智汇科普+AI讲堂”培训,为四平市40余名农技骨干注入“科技芯动能”。培训中
2025-04-27 21:55:00
奋战二季度 拼抢上半场丨浙江首设“技术预见机制” 让未来产业“遇见”未来
中国蓝新闻 作为全国最早设立未来产业先导区的省份之一,浙江先后培育了杭州城西科创大走廊人工智能等两批共17个省级未来产业先导区
2025-04-27 22:05:00
西湖茶山来了AI“采茶工” 能否破解“春茶困局”?
中国蓝新闻 2025年的春天,浙江的天气格外多变,茶叶生长得比往年更慢。直到清明临近,西湖龙井茶园才终于迎来了一年中最忙碌的采摘季
2025-04-27 22:05:00
千场活动、亿元福利!2025重庆6·18电商节4月28日启动
山城好物组团上新,爆款尖货全网首发!4月27日,重庆市商务委员会举行“2025重庆6·18电商节暨第七届双品网购节”新闻发布会
2025-04-27 17:08:00
大众网记者 连繁繁 临沂报道在数字经济与实体经济深度融合的战略机遇期,临商银行以"国之大者"的担当率先破局。4月18日
2025-04-27 17:08:00
通讯员 陈娟为提升物资供应效率和质量管理水平,国网新泰市供电公司通过多项举措加强物资计划管理,取得了显著成效。强化物资质量管控
2025-04-27 17:11:00