• 我的订阅
  • 头条热搜
算力直降97%,GPT-3存储只用20MB?!这篇新论文火了
好家伙!1750亿参数的GPT-3只需20MB存储空间了?!基于1.58-bit训练,在不损失精度的情况下,大幅节省算力(↓97%)和存储(↓90%)。最近,从事机器学习的Will小哥发了一篇论文,直接引来几十万网友or同行围观。他提出了一项...……更多
GPT-4o不会数r,被外国小哥原地逼疯! 谷歌论文揭秘Transformer「数不到n」
...谷歌最近的论文也揭示了本质原因:LLM没有足够空间,来存储计数向量。Strawberry里究竟有几个r,如今已经成为测试模型能力的黄金标准之一了!就在昨天,号称世界最强模型Reflection 70B在证明自己的性能时,证据之一就是「反...……更多
【多彩新论】算力时代 用数字描绘的现实越来越清晰
九天川流出行大模型、“新一代多芯多算力”政企云平台、天翼云一体化计算加速平台......2024数博会发布的十大领先科技成果中,算力平台和大模型成为主流,而这些赋能各行各业的黑科技发明正加快改变着我们的生活。当我...……更多
2022生成模型进展有多快,新论文盘点9类生成模型代表作
ChatGPT的出现,彻底将生成AI推向爆发。但别忘了,AI生成模型可不止ChatGPT一个,光是基于文本输入的就有7种——图像、视频、代码、3D模型、音频、文本、科学知识……尤其2022年,效果好的AI生成模型层出不穷,又以OpenAI、Meta...……更多
苹果新论文证明LLM大模型存在缺陷!没有进行真正的逻辑推理
快科技10月13日消息,近日,苹果公司的AI研究团队发表了一篇题为“Understanding the Limitations of Large Language Models in Mathematical Reasoning”的论文,揭示了大型语言模型(LLM)在数学推理方面的显著局限性。尽管……更多
Llama版o1来了,来自上海AI Lab,强化学习代码已开源,
...问题,作为OpenAI草莓项目的开源版本。10月初,团队上传新论文,使用成对优化(不直接给出绝对分数,而是比较两个答案的相对优劣)提高Llama模型数学奥赛能力。在最难的AIME2024基准测试30道题中,原版LLaMA-3.1-8B-Instruct做对2道...……更多
chatgpt教你写ai包教包会,准确度最高达99.7%
...程,仅凭ChatGPT就可以创建模型。它不仅帮你找数据集、训练模型写代码,还能评估准确性、创建程序一步到位。就有这么一个25岁小哥,让ChatGPT帮他创建了个地理位置识别程序,最终准确率最高达99.7%。而且各种细节步骤全在,...……更多
【多彩新论】 绘好“六大产业基地”工笔画
习近平总书记指出,新时代新征程,以中国式现代化全面推进强国建设、民族复兴伟业,实现新型工业化是关键任务。今年以来,全省坚持把新型工业化作为高质量发展的首要任务,大抓工业、大兴工业、大干工业,着力打造...……更多
Llama3训练每3小时崩一次?豆包大模型、港大为脆皮万卡训练提效
...痛点,检查点(Checkpoint)系统在训练过程中负责状态的存储和恢复,已经成为克服训练故障、保障训练进度和提高训练效率的关键。近日,字节跳动豆包大模型团队与香港大学联合提出了 ByteCheckpoint。这是一个 PyTorch 原生,兼...……更多
浪潮信息推出as13000g7-n系列
...时代下,浪潮信息紧跟时代步伐,于近日推出分布式全闪存储AS13000G7-N系列,专为大模型优化而设,为数据存储带来革命性的突破。该系列依托浪潮信息自研分布式文件系统,搭载新一代数据加速引擎DataTurbo,通过盘控协同、GPU...……更多
70倍极致压缩!大模型的检查点再多也不怕
...里,系统会崩溃 466 次,平均 2.78 小时一次!那么,频繁存储检查点就显得十分必要。但存储检查点本身也是一个大工程。 Meta 做了很多努力来加速存储检查点时间和增加存储频率,来对抗频繁出现的系统失效。但频繁存储也意...……更多
谷歌DeepMind推Imagen2;ChatGPT Plus恢复订阅;OpenAI提出用小模型监督大模型 | 本周硅谷发生了什么?
...科学人物,表彰其在ChatGPT开发中的核心作用。OpenAI发布新论文,探讨用小模型监督大模型的方法,为未来超人类AI对齐工作提供支持。Key PointsRunway宣布开展通用世界模型研发Mistral AI发布专家混合模型Mixtral 8x7B微软发布27亿参数...……更多
华为AI存储助力中国移动构建超大规模智算集群
...前存在的可用度、推理体验等问题,华为推出业界首款AI存储——OceanStor A800,致力于成为支撑智算集群发展的关键基座。智算集群为千行万业发展新质生产力夯基筑石近年来,智能计算已经成为推动社会发展进步的重要力量。...……更多
鄂维南院士领衔新作:大模型不止有RAG、参数存储,还有第3种记忆
...绍了一种支持知识外化的记忆电路理论,并提出了可以让存储易于处理的记忆稀疏机制和促进记忆形成的两阶段预训练方案。总结而言:Memory3 在推理过程中利用显式记忆,减轻了模型参数记忆特定知识的负担;显式记忆是从构...……更多
大华股份获得发明专利授权:“设备模型升级方法、装置、设备、服务器及存储介质”
...,专利名为“设备模型升级方法、装置、设备、服务器及存储介质”,专利申请号为CN202010809190.7,授权日为2025年3月7日。专利摘要:本发明公开了一种设备模型升级方法、装置、设备、服务器及存储介质,其中设备模型升级方...……更多
人工智能的第三支柱:数据存储
借助人工智能数据周期(AI Data Cycle)存储框架,释放数据的AI力量西部数据公司副总裁兼中国区总经理 蔡耀祥西部数据公司副总裁兼中国区总经理蔡耀祥如今,AI无处不在。各个行业正通过对基础设施进行大量投资,来支持创...……更多
【多彩新论】加速建设全国算力高地
作为全国一体化算力网络的重要枢纽,贵州不仅承载着东部数据处理的转移重任,更在算力资源的布局与优化中,探索出了符合自身特色的算力建设新路径,加速向全国算力高地目标迈进。在贵州,算力不再是简单的数据存储...……更多
没有这些,别妄谈做 ChatGPT 了
...没有你单机训的快;然后你会发现训练 ChatGPT 的海量数据存储也是个问题,就算存下来了,数据读取的 IO 效率又极大的制约了模型的训练效率;一通基础设施问题下来,A100 的算力被浪费了 7、8 成,模型训练实验无法开展。因...……更多
...就要警惕侵权陷阱和伦理陷阱。技术的“一体两面”并非新论,历史上很多重大的技术革新都曾被视为“双刃剑”,既带来巨大益处,也引发新的挑战和问题。科技能否暖人心,究竟是“数字疗愈”还是“数字陷阱”,最终要看...……更多
大模型是否有推理能力?DeepMind数月前的论文让AI社区吵起来了
...《给小学数学题加句「废话」,OpenAI o1 就翻车了,苹果新论文质疑 AI 推理能力》)。这种现象被归结为「当前的 LLM 无法进行真正的逻辑推理;相反,它们试图复制在训练数据中观察到的推理步骤」。然而,事实真的是这样吗...……更多
AI落地千行百业,存储痛点凸显,浪潮信息如何助力AI向实?
AI时代,存储不仅是数据的栖息之地,更是AI模型训练、落地过程中的坚实底座。在AI开启的存储行业新周期中,众多厂商已将带宽等性能指标卷至新的高度。然而,这种追求似乎将AI这一复杂应用场景简单地“存储化”了。实际...……更多
业界首次!中国联通AI大模型存算分离技术新突破
...通、联通服装制造军团协同攻关,针对AI敏感数据的本地存储异地训练需求提出了创新的业务模式,并成功在杭州与金华两地间实施了业界首次30TB样本数据的跨200公里存算分离拉远训练。经过实际测算,训练效率高达97%以上。中...……更多
Claude自动玩崩铁清日常,NUS新论文完整测评AI电脑操控
Claude操控电脑,究竟可以做到什么程度?新加坡国立大学团队在20多个场景下做了全面测试,其中最引人瞩目的是:AI可以自动玩手游清日常任务了!研究中选用了米哈游《崩坏:星穹铁道》,可以跟它说”帮我完成今天的模拟...……更多
【多彩新论】初心拓展司法审判的社会效应
镇宁自治县法院从司法审判中总结规律,通过智能化赋能,在预防未成年人被侵害方面起到前置预防的作用,拓展了司法审判的社会效应。一般而言,法院以法律之光护卫未成年人,主要是通过案件审判和法律宣传来实现,所...……更多
【多彩新论】AI赋能文旅,开启智慧旅游新篇
日前,“AI游贵州”接入DeepSeek,从大模型到智能体,被业界认为是AI真正走向落地应用的关键一步。智慧旅游服务的核心在于以用户需求为导向。“AI游贵州”通过智能交互问答、行程规划、多语言导游等功能,实现了旅游服务...……更多
亚马逊连甩6款大模型!推出3nm AI训练芯片,最强AI服务器算力爆表
...颗Trainium2芯片的集群上进行训练。总体来看,AWS的计算、存储、数据库、AI推理,四大板块都迎来一大波重要更新。一、全新自研大模型Amazon Nova系列登场!文本、图像、视频齐活了亚马逊总裁兼CEO安迪·贾西现场分享了生成式AI...……更多
新ai模型发布:设计圈看了心慌慌
CV大佬朱俊彦的新论文,让设计师们感觉危了。事情是这样的:量子位在微博上搬运了朱俊彦团队的新成果,一个能将2D草图一键变成3D模型的新算法,却意外引发设计圈盆友们的热烈转发讨论。配文全是“沃日”、“???”...……更多
让美国硅谷恐慌!中国工程院院士揭秘:DeepSeek究竟厉害在哪里
...注意力算子压缩了KV Cache大小,实现了在同样容量下可以存储更多的KV Cache,该架构和DeepSeek-V3模型中FFN 层的改造相配合,实现了一个非常大的稀疏MoE 层,这成为DeepSeek训练成本低最关键的原因。”据了解,KV Cache是一种优化技术...……更多
华为周跃峰:数据觉醒时代,共创数据存储产业新未来
...华为中国合作伙伴大会2024”在深圳隆重举行。华为数据存储产品线总裁周跃峰发表“数据觉醒时代,共创数据存储产业新未来”主题演讲。周跃峰表示,AI大模型加速数据觉醒,华为秉持“以存强算、以存强训、以存强安”的理...……更多
“京东物流超脑”升级 首次揭秘“快准稳”背后的数智化供应链技术全景
...京东物流超脑通过集成先进技术和软硬件协同,从而实现存储、拣选、打包、分拣等场景的全面智能化。在存储环节,基于销售预测动态优化储位布局,大幅提升存储和拣货效率,今年11.11期间,通过智能存储、商品布局优化、...……更多
更多关于科技的资讯:
小米15 Ultra在印度发布,小米15跌至大米价米粉悲伤不已!
近期,小米于印度正式推出了小米15Ultra与小米15这两款旗舰手机。这两款手机全都搭载了骁龙8Elite移动平台,并且都配备有最高可达16GB的运行内存
2025-03-13 01:06:00
传荣耀Magic8系列将推小屏旗舰,Magic7命运悲惨沦为百元机!
此前曾有消息传出,荣耀Magic8系列大概率会在今年10月前后正式登场,主打“全尺寸覆盖”的策略,会为大家提供6.3英寸
2025-03-13 01:07:00
iPhone折叠屏惊艳曝光,华为机皇一夜沦为百元机遭疯抢!
今日,数码博主在此前曾透露过,华为首款搭载原生鸿蒙正式版的手机,会在手机行业内率先呈现全新形态,预计这部手机会配备大概6
2025-03-13 01:07:00
iPhone折叠屏惊艳曝光,华为旗舰沦为百元机刷新感人记录!
3月12日,华为官方对外宣称,会在下周举办新品发布会,到时候将会推出一款别具一格的新手机,有消息称这款手机会是有着全新形态的折叠屏新机
2025-03-13 01:08:00
小屏党狂欢!一加新机曝光,前辈机皇一夜沦为百元机!
家人们谁懂啊!数码圈开年王炸来了!3月12日最新消息,一加正在憋一个大招——一款堪称"掌中怪兽"的小屏旗舰即将在4月杀疯市场
2025-03-13 01:09:00
一加新机曝光,前辈机皇沦为百元机机皇直呼按打买!
这次一加在影像上彻底放飞自我!主摄直接上了旗舰级IMX906传感器,支持DAGHDR技术,拍夜景直接吊打同价位机型!更夸张的是副摄居然也是5000万像素2倍长焦
2025-03-13 01:09:00
苹果三星屠榜!2024全球手机TOP10曝光,国产军团全军覆没?
核心看点:1️⃣ iPhone16ProMax登顶年度机皇,苹果6款机型霸榜,三星4款紧随其后;2️⃣ 国产手机首次零上榜
2025-03-13 01:11:00
iPhone 17 Air惊艳外观亮相,iPhone15沦为百元机果粉按打买!
多方信源指向苹果或于今秋推出革命性超薄机型iPhone17Air,但CNMO调研发现,其极致纤薄化设计或将引发显著镜头模组外凸问题
2025-03-13 01:11:00
192GB!芝奇发布超大容量DDR5-6000内存豪华套装
快科技3月13日消息,芝奇一口气发布了多款高规格的内存套装,包括超大容量的DDR5-6000 CL28-36-36 192GB(48GB x 4)
2025-03-13 03:20:00
原生基于AMD平台!DeepSeek AI系统测试平台可以免费体验了
快科技3月13日消息,AMD携手清醒异构公司的AI应用联合实验室(Thewake Systems AI Applications Joint Lab)
2025-03-13 03:50:00
首发18A工艺!Intel Panther Lake酷睿Ultra 300近距离首秀:明年再见?
在德国举办的2025年嵌入式世界大会上,意外看到了Intel Panther Lake也就是酷睿Ultra 300H/U系列处理器的近距离展示
2025-03-13 04:20:00
机器人科普展人气旺
本文转自:人民日报海外版江苏苏州:机器人科普展人气旺近日,2025环梦AI智能机器人科普展(苏州站)在江苏苏州举办,掀起人工智能科技产品科普热潮。图为小朋友在科普展上同宇树机器人
2025-03-13 04:31:00
群联号称一年研发投入30亿!却没有个靠谱的PCIe 5.0 SSD主控
快科技3月13日消息,群联电子,一度是PCIe SSD主控市场上的佼佼者,但是在PCIe 5.0时代却渐渐落伍了,首发且长期唯一的E26主控方案不但性能无法满血
2025-03-13 04:50:00
柽柳与柊树:名字太怪 只认半边 注定读错!
树木的名字很多都遵循形声字的规律,左边部分通常描述形状,右边部分则提示读音。这些名字的读音主要分为两种情况:一种是树的名字直接和右边的读音一样
2025-03-13 05:20:00
本文转自:人民日报王 姝登顶全球动画电影票房榜的《哪吒之魔童闹海》,藏着这样的“AI力量”:电影在剧本定稿后,借助AI技术快速生成数百张甚至数千张设计图
2025-03-13 05:46:00