• 我的订阅
  • 头条热搜
1行代码改进大模型训练,Llama训练速度升至1.47倍,华人团队出品
只要改一行代码,就能让大模型训练效率提升至1.47倍。拥有得州大学奥斯汀分校背景四名华人学者,提出了大模型训练优化器Cautious Optimizers。在提速的同时,Cautious能够保证训练效果不出现损失,而且语言和视觉模型都适用。...……更多
全球首次!时序大模型突破十亿参数,华人团队发布Time-MoE,预训练数据达3000亿个时间点
...发团队还发布了Time-300B数据集,为时序分析提供了丰富的训练资源,为各行各业的时间序列预测任务带来了新的解决方案。在当今以数据为驱动的时代,时序预测已成为众多领域不可或缺的核心组成。然而,构建一个兼具强大性...……更多
全球首位AI程序员爆火,背后公司成立仅4个月,CEO才27岁
...我们接下来就来一探究竟。自主写代码,Debug还能“自己训练自己”首先,这位AI程序员长什么样?在演示视频中,Devin最开始拥有一个左右窗口并列的布局:左边是当前大语言模型们的经典UI,可以通过下方的对话框与Devin沟通...……更多
最强AI程序员砸饭碗:84秒跑通代码 像人一样思考
...自我对弈、逐步验证等方法,还用到了基于大量标记数据训练的AI模型。好处是,当基础模型能力提升时,它们能够提取的数据质量也会相应提高。最终Genie使用该专有数据进行训练。数据集中编码了人类推理的完整过程,包括...……更多
炒菜、做家务的开源机器人来了,斯坦福华人开发、Transformer 架构驱动、造价 3.2 万美元
...是一种用于双手遥控操作的低成本开源硬件系统,解决了训练需要人类操作员仔细指导的移动双手机器人的高成本和技术挑战。值得一提的是,Mobile Aloha 能实现以上操作,并非完全自主,其全身也支持远程操作。得益于生成模...……更多
将偏好学习引入模型训练,北大李戈团队提出代码生成优化新框架
...习的问题有解了。北大李戈教授团队与字节合作,在模型训练过程中引入偏好学习,提出了一个全新的代码生成优化框架——CodeDPO。在部分模型上,相比于单独使用SFT,CodeDPO能够将模型的HumanEval得分再多提升10个百分点,最高...……更多
百度文心大模型4.0技术进展
...文心一言从数万亿数据和数千亿知识中融合学习,得到预训练大模型,在此基础上采用有监督精调、人类反馈强化学习、提示等技术,具备知识增强、检索增强和对话增强的技术优势。文心一言的基础模型5月升级至文心大模型3....……更多
文心大模型4.0 Turbo来了!百度推出文心快码2.5,已覆盖内部80%程序员
...上,考虑到大模型和异构多芯发展趋势,为了保障大模型训练推理性能、简化大模型开发调优过程以及更好地适配各种芯片,飞桨与文心联合,在训练、推理两个方面定向优化。▲飞桨框架设计理念具体来说,动静统一的自动并...……更多
字节跳动实习生投毒自家大模型:全删了
10月19日,字节跳动大模型训练遭实习生攻击一事引发广泛关注。据多位知情人士透露,字节跳动某技术团队在今年6月遭遇了一起内部技术袭击事件,一名实习生因对团队资源分配不满,使用攻击代码破坏了团队的模型训练任务...……更多
AGI一日要闻:台积电预测2040年GPU芯片性能提升1000倍;Scale估值高达130亿美金
...智能应用都归功于三个因素:高效机器学习算法的创新、训练神经网络的大量数据的可用性,以及通过半导体技术的进步实现节能计算的进步。文章内容称,如果AI要以目前的速度发展下去,它将需要半导体产业做出更多贡献。1...……更多
谷歌「诚意之作」,开源9B、27B版Gemma2,主打高效、经济!
...进行了有无注意力logit软封顶的消融实验,发现大多数预训练和后期评估中,生成质量几乎不受影响。本文中的所有评估均使用包含注意力logit软封顶的完整模型架构。然而,某些下游性能可能仍会受到此移除的轻微影响。 使用R...……更多
Llama3.1训练平均3小时故障一次,H100万卡集群好脆弱
每3个小时1次、平均1天8次,Llama 3.1 405B预训练老出故障,H100是罪魁祸首?最近有人从Meta发布的92页超长Llama 3.1论文中发现了华点:Llama 3.1在为期54天的预训练期间,经历了共466次任务中断。其中只有47次是计划内的,419次纯属意...……更多
Llama版o1来了,来自上海AI Lab,强化学习代码已开源,
...目便开源了。LLaMA版o1最新进展目前已开源内容包括:预训练数据集、 预训练模型、强化学习训练代码。OpenLongCoT-Pretrain数据集,包含10万+条长思维链数据。每条数据包含一个完整的数学问题推理过程,包含思考内容和评分结果...……更多
斯坦福AI团队抄袭国产大模型?连识别“清华简”都抄了!清华系团队发文回应
...5月29日发布了一个多模态大模型Llama3-V,声称只花500美元训练,就能实现在多个基准测试中比肩GPT-4的性能。但很快有人发现,该模型跟清华系大模型创企面壁智能5月发布的MiniCPM-Llama3-V 2.5模型有不少相似处,而且没有任何相关...……更多
国产大模型竞技场首超GPT-4o!零一万物GLM共同跻身Top10
...根据任务的难度动态自动选择最合适的专家网络组合——训练过程中会激活所有专家网络,使模型能学习到所有专家知识;而推理阶段,根据任务的难度,模型会选择性激活更匹配的专家网络。另外,之前有一些传言称国内大模...……更多
腾讯开源最大MoE大语言模型!3D大模型同时支持文/图生成,晒混元模型及应用全家桶
...界参数规模最大、效果最好的开源MoE大语言模型,采用7T训练tokens,总参数量389B,激活参数量52B,上下文长度高达256K,技术报告也同步发布。混元-Large包括三款模型:Hunyuan-A52B-Pretrain,Hunyuan-A52B-Instruct和Hunyuan-A52……更多
该实习生已在8月被辞退。近日有传闻称字节跳动大模型训练被实习生攻击,对此,字节跳动10月19日回应表示,经公司内部核实,确有商业化技术团队实习生发生严重违纪行为且已被辞退,但相关报道也存在部分夸大及失实信息...……更多
多个中国团队斩获EMNLP\\\'24最佳论文!UCLA华人学者中三篇杰出论文
...了一个新的数据集和方法,用于检测给定文本是否为LLM预训练数据的一部分,有助于提高LLM训练数据透明度。EMNLP’24今年收录论文总共2978篇,比去年增长5%,其中2455篇主会议论文,523篇workshop论文。除最佳论文外,杰出论文也...……更多
前实习生篡改代码攻击大模型训练 字节跳动起诉要求赔偿800万元
...字节跳动起诉前实习生田柯宇篡改代码攻击公司内部模型训练一案,已获北京市海淀区人民法院正式受理。字节跳动请求法院,判令田柯宇赔偿公司侵权损失800万元及合理支出2万元,并公开赔礼道歉。11月5日,字节跳动曾发布...……更多
入职一年半,这个AI员工晋升为了国内首位AI架构师
...型提供动力,前不久刚刚升级到 4.0 Turbo 版本。通过更大训练数据体量、更优数据分布与质量、更强训练算法,文心大模型在理解、逻辑推理层面再次跃升。可以说,更强大文心大模型为文心快码的又一次「变身」提供了理论上...……更多
Sam Altman或筹数十亿美元自造AI芯片,DeepMind首席科学家或将辞职创业
...美元,计划建立全球性的半导体晶圆厂网络,以应对GPT-5训练中的芯片短缺问题。GPT-5预计需要5万张H100芯片。为了获得算力基础设施的独立性,OpenAI决定不再依赖英伟达,而是自行建立AI芯片生产线。Altman担心,随着AI技术的普...……更多
马斯克擎天柱大将跳槽,在抱抱脸开源一套机器人技术:会做家务的大白,复刻低至1800
...amazing刷屏了。所以,这个开源机器人,究竟如何而来?训练只用2个小时完成这些动作的,是花粉机器人公司最新的机器人Reachy2。不过,Reachy2并不是一开始就实现自主操作的,而是先经历了一段遥控操作的过程。该阶段中,开...……更多
算子开发到推理加速,一位00后开发者的“升级打怪”之旅
...算架构CANN主线,参与开发的深度学习框架降低了大模型训练的门槛,目前正在做大模型分布式推理加速,希望可以帮助其他开发者在生产环境中高效部署在线推理服务。在昇腾AI的生态里,像郑辉这样为大模型浪潮默默贡献自己...……更多
一行代码训练成本再降30%,AI大模型混合精度训练再升级
...的数值表示方式,能够在保持一定精度的同时,在大模型训练中提高训练速度、节省内存占用,最终降低训练成本。AI大模型开发系统Colossal-AI的混合精度训练再度升级,支持主流的BF16(O2) + FP8(O1)的新一代混合精度训练方案。仅...……更多
阿里前副总裁贾扬清吐槽国产大模型“套壳”,李开复公司回应称有借鉴公开成果
...包括13B、65B等。不过,业内的怀疑对象指向刚发布首款预训练大模型Yi-34B的零一万物,其是李开复在今年7月入局AI大模型新成立的公司,由李开复牵头创办并担任CEO。搜狐科技注意到,零一万物开源发布的Yi-34B模型目前在Hugging F...……更多
百度CTO王海峰:文心大模型的底色和成色
...惑:“团队基于更大的算力、更多的数据和更强的算法,训练出来规模更大、效果更好的文心大模型4.0。”升级:算力更大、数据更多、算法更强王海峰坦言,文心大模型4.0的基本技术架构与文心大模型3.0和3.5版本一脉相承,升...……更多
新晋AI编程神器干翻Cursor!首创实时感知无限用,估值12.5亿华人初创震惊AI界
...未来,并决定重塑品牌并转向AI编码。Codeium平台得到了大模型加持,在应用程序的整个代码库的上下文中提供建议。它可以支持大约70种编程语言,并与许多流行的开发环境集成,包括Microsoft Visual Studio、JetBrains。如今,这家初...……更多
字节跳动大模型训练被实习生攻击 背后内幕曝光:四点真相
快科技10月19日消息,今日,字节跳动大模型训练遭实习生攻击一事引发广泛关注,相关话题随即登上热搜。据“大厂青年”爆料,据内部厂友透露,破坏模型训练确有其事,但传闻也有些夸张和虚构的信息。据了解,事情发生...……更多
春节流量给支付宝留下了什么?
...资源的高效管理和调度,支付宝能够更快地完成AI模型的训练过程,使得AI模型能够更快地迭代更新,从而更好地支持AI在支付宝各业务线的应用。同时,在处理大规模数据时,异构计算技术的应用也显著提高了数据处理的速度和...……更多
GPT-4批评GPT-4实现「自我提升」!OpenAI前超级对齐团队又一力作被公开
...前任超级对齐团队的「遗作」之一。CriticGPT同样基于GPT-4训练,但目的却是用来指正GPT-4的输出错误,实现「自我批评」。OpenAI最近的拖延症状逐渐严重,不仅GPT-5遥遥无期,前几天还宣布GPG-4o的语音功能将推迟一个月发布。或许...……更多
更多关于科技的资讯:
一加Ace 5系列详细参数汇总:全面升级 或2399元起
【CNMO科技消息】一加Ace5系列将于明日(12月26日)14:30发布。12月25日,博主@数码闲聊站汇总了一加Ace5系列的详细参数
2024-12-26 20:56:00
荣耀公布MagicOS 9.0五大升级亮点
【CNMO科技消息】据CNMO了解,荣耀MagicOS9.0第二波升级已经到来,官方总结了五大升级亮点,包括YOYO智能体
2024-12-26 20:57:00
华为手环10曝光,或与华为Pura 80同台亮相
据报道称,华为手环10已经通过了印尼SDPPI认证和TUVSUD认证,同时认证显示该款设备支持IP68级别防尘防水性能
2024-12-26 20:58:00
OPPO A5 Pro支持360°抗摔:通过多项军标环境测试
2024年12月24日,OPPO推出A5Pro手机,该产品以卓越的360°抗摔性能引发了行业内外的广泛关注,其实现了全方位的防护
2024-12-26 20:58:00
OPPO A5 Pro发布 闯入耐用无人区1999元起售
12月24日,OPPO打造的全新耐用科技手机OPPOA5Pro正式推出,该机提供了360度防摔和满级防水支持,并在此基础上打造出了耐用科技3
2024-12-26 20:58:00
十八种防水还送进水保 务实首选OPPO A5 Pro
选手机不能忽视性价比,尤其是一两千元的手机,更是性价比决胜的关键价位段。而随着手机使用周期的延长,性价比的考量因素也发生了潜移默化的变化
2024-12-26 20:59:00
OPPO A5 Pro推出新年红配色:开启新年新希望
随着新年的脚步日益临近,OPPO为广大消费者带来了一份特别的礼物——A5Pro新春特别版配色“新年红”。这款独具特色的配色不仅彰显了OPPO对传统节日的重视
2024-12-26 20:59:00
一加平板标准版现身跑分库 搭载天玑8350处理器
此前,有数码博主爆料了一加平板标准版的配置信息,将搭载联发科天玑8350处理器。12月24号消息,一加平板标准版在GeekBench跑分库出现
2024-12-26 20:59:00
致态推新TiPro9000固态硬盘
致态今天官宣了旗下首款PCIe5.0消费级固态硬盘TiPro9000,采用有缓设计,配备了全新的Xtacking4.0架构颗粒
2024-12-26 20:59:00
OPPO A5 Pro评测:拓宽耐用性赛道放心去用
OPPOA系列手机作为OPPO的出货主力机型,被很多消费者使用过,结实耐用是该系列手机的招牌。随着手机市场的不断变化,A系列也持续深耕耐用性
2024-12-26 21:00:00
疑似RTX 5090裸PCB曝光
作为英伟达的下一代旗舰显卡,英伟达的RTX5090始终备受关注。今天Chiphell网友skanlife分享了一张疑似英伟达GeForceRTX5090显卡的无元件裸PCB照片
2024-12-26 21:00:00
OPPO A5 Pro搭载超亮阳光屏
2024年12月24日,OPPO发布了OPPOA5Pro,该产品最大的亮点,就是极度耐用。不过,这并不意味着OPPOA5Pro的其他配置不亮眼
2024-12-26 21:00:00
OPPO A5 Pro支持扬声器排水除尘功能:无惧“水劫”
在智能手机功能日益多样化的今天,OPPOA5Pro凭借其独特的功能配置,再次成为消费者关注的焦点,其中新增的扬声器排水清灰功能尤为亮眼
2024-12-26 21:00:00
OPPO A5 Pro搭载五年耐用大电池:定义手机续航新标杆
在智能手机快速发展的时代,续航能力成为用户选择手机的重要考量因素之一。OPPOA5Pro以其卓越的电池技术,在续航方面交出了一份令人瞩目的答卷
2024-12-26 21:01:00
红红火火好几年 OPPO A5 Pro新年红开启预售
在近几年的年底时分,OPPO都会打造一款专门的红色主题的新春特别版手机。今年的新年红版本被放在了A系列新机OPPOA5Pro中
2024-12-26 21:01:00