• 我的订阅
  • 头条热搜
代码模型自我进化超越GPT-4o蒸馏!UIUC伯克利等提出自对齐方法 | NIPS 2024
【新智元导读】代码模型可以自己进化,利用自身生成的数据来进行指令调优,效果超越GPT-4o直接蒸馏!LLM作为智能的基座,可以衍生出各种能力。代码能力就是其中一种:程序补全、注释、优化、修bug、测试等等。而想要充...……更多
这才是真开源模型!公开后训练一切,性能超越Llama 3.1 Instruct
开源模型阵营又迎来一员猛将:Tülu 3。它来自艾伦人工智能研究所(Ai2),目前包含 8B 和 70B 两个版本(未来还会有 405B 版本),并且其性能超过了 Llama 3.1 Instruct 的相应版本!长达 73 的技术报告详细介绍了后训练的细节。在...……更多
LLM数学性能暴涨168%,微软14人团队力作!合成数据2.0秘诀曝光,智能体生成教学
...动创建大量、多样化的合成数据。经过合成数据微调后的模型Orca-3,在多项基准上刷新了SOTA。全世界高质量数据几乎枯竭。AI科学家们为了解决这一难题,可谓是绞尽脑汁。目前来看,合成数据或许就是大模型的未来,也成为业...……更多
第一个100%开源的MoE大模型,7B的参数,1B的推理成本
... checkpoint、训练日志和训练数据都已经开源。尽管大语言模型 (LM) 在各种任务上取得了重大进展,但在训练和推理方面,性能和成本之间仍然需要权衡。对于许多学者和开发人员来说,高性能的 LM 是无法访问的,因为它们的构建...……更多
定价15000!老黄重磅发布RTX 5090:世界最小AI超级计算机也来了
...I超级计算机——Project Digits。有多强悍? 2000亿参数的大模型,直接在你办公桌上(自己的桌面系统)就能跑!如果把两台Project Digits一块“食用”,那么还可以跑4050亿参数的大模型。据了解,每个Project DIGITS配备了128GB统一、...……更多
大模型推理乘上RISC-V快车?国内AI芯片创企推大模型系列一体机
...算力需求大爆发的转折之年,如今随着国内两批超20个大模型获得审批、种类多样的大模型相关应用显现,企业对私有化部署的需求也水涨船高。面向这一行业趋势,2023年世界互联网大会乌镇峰会上,国内云端RISC-V大芯片创企希...……更多
...院创始人、创始理事长张宏江表示,今天大热的多模态大模型未来发展方向一定不光是做视频生成、视频剪辑、拍电影或是生成电视剧。从技术角度观察,可以用它来做机器的大脑、识别外围的世界、武装未来的自动驾驶,从而...……更多
AI PC能做什么? 让AI无处不在
...生成数字人、AI视频抠像、AI音乐创作、本地130亿参数大模型智能助手、AIGC文生图、AI优化智慧办公、AI赋能数字艺术…12月15日,英特尔发布AI战略,以及英特尔酷睿Ultra处理器、第五代英特尔至强可扩展处理器,同时还有支持AI...……更多
让手机、PC、汽车、AIoT等“终端”都用好AI,搞定统一生态这事太重要了
...此产业也通常将今年看作是“端侧AI元年”。当下,AI大模型在终端细分赛道展现出的强大生命力,各类AI产品几乎无处不在,AI手机、AI PC、AI眼镜,以及AIoT领域的各类AI智能终端设备成为当下数码和科技圈广为热议的关键词。根...……更多
阿里云佘俊泉:创新涌现,边缘云场景的探索与机遇|GDCC智算
...了人工智能与云计算领域的深度融合与集中爆发,其中GPT模型的横空出世对全球科技革新产生了深远的影响,颠覆性地推动了计算机智能应用的边界。这一趋势在分布式云架构下得到了进一步强化和扩展,AI技术深度融入云计算...……更多
精准狙击Llama 3.1?Mistral AI开源Large 2,123B媲美Llama 405B
...所未有的速度加速,继 Meta 昨天推出其新的开源 Llama 3.1 模型之后,法国 AI 初创公司 Mistral AI 也加入了竞争。刚刚,Mistral AI 宣布其旗舰开源模型的下一代产品:Mistral Large 2,该模型拥有 1230 亿个参数,在代码生成、数学、推理...……更多
零一万物Yi-1.5来了,国产开源大模型排行榜再次刷新
...机器之心编辑部在 OpenAI 发布会的前一天,来自中国的大模型公司零一万物,让开源大模型社区活跃了起来:Yi 大模型家族新成员「Yi-1.5」模型正式开源。在项目主页可以看到,Yi-1.5 包括一系列预训练和微调模型,分为 6B、9B、3...……更多
Meta祭出三篇最详尽Llama微调指南!千字长文,0基础小白必备
...开的彻彻底底。这不,Meta一连放出三篇技术文章,从大模型适配方法出发,介绍了:如何使用特定领域数据微调LLM,如何确定微调适配自己的用例,以及如何管理良好训练数据集的经验法则。接下来,直接进入正题。适配大模...……更多
NPU全球出货超1亿颗!芯原如何迎战大模型时代的边缘计算变革?
...(VPU)也已经赋能智能视频处理等行业。戴伟进谈及了大模型推进边缘计算变革的机遇与挑战,他谈道,随着大模型的爆发,我们看到在手机、AI PC、汽车等各种终端,大模型正被加速引入嵌入式系统。 今天,大模型已经运行...……更多
进迭时空宣布开源RISC-V芯片的AI核心技术
...码,创新性地以CPU核的方式提供通用AI算力,使得所有AI模型可以快速在K1芯片上部署,解决了当下ARM类芯片普遍存在的部署难的问题,整体性能全面领先于ARM同等微架构芯片产品。据陈志坚介绍,面向AI应用中算力占比最高的卷...……更多
大模型时代,谁才是第一终端?英特尔掀开AI PC万亿美金市场大幕
图片来源@视觉中国2023年,AI大模型是一个高频出现的词汇,在多个场合被频繁提及,几乎成为行业年底大会的必谈话题,甚至是地铁口摊煎饼的小哥都能够脱口而出“ChatGPT、大模型”这些看似与他们生活毫不相干的词语。一个...……更多
人工智能已成风口:这款扫地机器人也要拥抱AI
...扫拖机器人应该来说十分契合如今的AI热潮,借助大语言模型可以让扫拖机器人听懂自然语言,从而交流起来更加方便,例如石头新近推出的自清洁扫拖机器人P20Pro就是一款内置大语言模型的扫拖机器人。想要实现模糊语音识别...……更多
林达华谈大模型发展之路:未来会有更高效的模型结构出现
大模型的上下文长度快速增长,超长上下文解锁新应用,但推理计算代价高昂,上下文本身对于信息不会进行压缩,不能直接捕捉其中的深层知识和规律。上海人工智能实验室领军科学家林达华。过去一年,人工智能领域风起...……更多
智谱AI的双轨驱动:从基座大模型出发,以共创理念推进商业落地
在全球范围内,大模型技术正以前所未有的速度发展,成为人工智能领域的焦点。从大洋彼岸的硅谷到国内,科技公司和研究机构都在竞相探索这一领域的无限可能。刚刚结束的两会上,“新质生产力”成为热词。打造新的经...……更多
...总经理陈宁介绍,DeepEdge10是国内首创的国产14nm Chiplet大模型推理芯片,采用自主可控的国产工艺,内含国产RISC-V核,支持大模型推理部署。依托自研芯片DeepEdge10创新的D2D chiplet架构打造的X5000推理卡,已适配并可承载SAM CV大模型...……更多
所谓AI革命,到现在为止,是能源的一场“灾难”
6月底,谷歌新一代开源模型Gemma2发布,相比今年早些时候推出的轻量级开源模型Gemma,Gemma2有了90亿(9B)和270亿(27B)两种参数规模可用。就在谷歌摩拳擦掌准备与OpenAI一较高下时,前几天其发布的一份报告却引来了媒体的“...……更多
专访AMD产品技术大咖王启尚:未来AI一定无处不在
...开源的生态系统。AMD选择和始智AI等国内的一些本地化大模型公司开展合作,使得这些模型可以在AMD的硬件产品上实现无缝运行。目的是构建一个庞大的AI生态链,而不是仅有AMD一家公司在做,希望大家一起来把这个开源的生态...……更多
腾讯钟学丹:人工智能成为汽车行业新质生产力 推动数智化升级
...《AI驱动汽车“新智能”》的主题演讲,分享了腾讯AI大模型等新技术在汽车产业的创新应用成果。 腾讯智慧出行副总裁钟学丹钟学丹表示:“人工智能将作为新质生产力,推动汽车产业从数字化向数智化升级。”随着大模型技...……更多
OpenAI-o1思考替代法火了!焦剑涛高徒一作提出思考偏好优化
OpenAI-o1替代品来了,大模型能根据任务复杂度进行不同时间的思考。不限于推理性的逻辑或数学任务,一般问答也能思考的那种。最近畅销书《Python机器学习》作者Sebastian Raschka推荐了一项新研究,被网友们齐刷刷码住了。论文...……更多
百万鲁棒数据训练,3D场景大语言模型新SOTA!IIT等发布Robin3D
...数据生成引擎(RIG)生成的大规模数据进行训练,以提高模型在3D场景理解中的鲁棒性和泛化能力,在多个3D多模态学习基准测试中取得了优异的性能,超越了以往的方法,且无需针对特定任务的微调。多模态大语言模型(Multi-mo...……更多
自然语言处理:大模型理论与实践
今天分享的是:自然语言处理:大模型理论与实践报告共计:450页《自然语言处理:大模型理论与实践》系统介绍了大模型技术在自然语言处理中的理论与实践。核心观点1. 语言模型基础- 介绍独热表示、分布式表示等文本表示...……更多
“智算融合 共创未来”——开普云AI战略暨新产品发布会召开
...展示了在AI领域的综合实力。开普云已构建从数据治理、模型训练、产品研发到运维服务的全流程能力体系,开发出多款大模型平台级产品及AI智能应用类产品,并以全系列AI一体机产品,为大模型应用客户和大型智算中心客户提...……更多
CMU&清华:让LLM自己合成数据来学习,特定任务性能同样大幅提升
...赵晨阳,卡内基梅隆大学硕士生贾雪莹。虽然大规模语言模型(LLM)在许多自然语言处理任务中表现优异,但在具体任务中的效果却不尽如人意。为了提升模型在特定自然语言任务上的表现,现有的方法主要依赖于高质量的人工...……更多
a16z前合伙人重磅演讲:企业FOMO情绪严重,未来AI模型将以周为速度迭代
...急于跟进AI浪潮,投入巨资以避免被淘汰。Evans还谈道,AI模型的快速迭代和成本下降将是推动市场发展的关键因素。OpenAI通过技术优化将模型训练成本降低了90%,Meta和苹果通过开源和边缘计算等策略,加速AI技术的普及与多元化...……更多
焊接“点”上的大模型之舞
...院的实验室里,工作人员通过电脑端的人工智能(AI)大模型发布指令后,一束蓝色的激光线在一块块焊缝形态各异的钢板上快速移动,焊缝数据几秒之内便已采集完毕。3月21日,《中国电子报》记者来到了华工科技中央研究院...……更多
更多关于科技的资讯:
病毒肆虐,一场人类存亡的细胞暗战 | 专访《癌症传》作者
当基因技术与人工智能的浪潮席卷科学界,细胞,古老而神秘的生命单位,这个比基因更基础、比器官更微观的生命载体,正在成为我们理解健康
2025-02-24 02:04:00
小心矿渣!希捷硬盘翻新造假泛滥 银河、酷狼Pro都遭殃
快科技2月23日消息,为了挖矿,大量显卡被压榨成矿渣,再改头换面,翻新流入二手市场,坑了不少用户。同样是为了挖矿(Chia奇亚币)
2025-02-23 23:02:00
复现人手级运动能力!中国科大研发出19自由度假肢灵巧手
快科技2月23日消息,据报道,中国科学技术大学及合作者成功研发了一套具备19自由度的轻质仿生灵巧手。仿生灵巧手能复现人手级别的功能
2025-02-23 23:02:00
韩国专家调查显示:半导体技术已经落后于中国
快科技2月23日消息,据报道,韩国科学技术企划评价院公布了一项针对39名当地半导体领域专家的调查结果,数据显示,韩国在半导体技术领域已被中国反超
2025-02-23 23:02:00
西安咸阳机场扩建 发现4000多座古墓:于是 原地开了家博物馆!
快科技2月23日消息,很多人应该知道,在西安修地铁是“高危工种”,因为一不小心就会挖出各种古墓,导致工程进展迟缓。其实
2025-02-23 23:02:00
40亿美元!AMD刚买AI服务器工厂又卖掉 台湾四巨头抢破头
快科技2月23日消息,2024年8月,AMD斥资49亿美元(约合350亿元人民币),收购了服务器制造商ZT Systems
2025-02-23 23:32:00
《阿凡达3:火与灰》12月19日上映!卡梅隆:试映反馈良好 绝对是三部里最好的一部!
快科技2月23日消息,《阿凡达》是有史以来全球票房最高的电影,詹姆斯·卡梅隆却说,第三部可能是迄今为止最好的。近日,传好莱坞奇导演詹姆斯·卡梅隆 (James Cameron)接受新西兰媒体Stuff采访时透露
2025-02-23 17:31:00
高铁乘务员小姐姐怎么总看“手机”:原来有5大功能
快科技2月23日消息,经常坐高铁的话,你肯定注意到了,乘务员小姐姐或者小哥哥会经常盯着一台看着像手机又不像手机的设备,这是什么呢
2025-02-23 18:01:00
医生称DeepSeek有三甲医院专家水平:可帮忙诊断超复杂脑瘤
快科技2月23日消息,据报道,北京某医院神经外科主任医师分享了一段使用DeepSeek辅助诊断复杂脑瘤患者的经历,并对DeepSeek的表现给予了高度评价
2025-02-23 18:01:00
仰望U8同级!猛士917L长轴距版曝光:现款63.77万起
快科技2月23日消息,东风猛士科技计划在今年上半年发布猛士917L长轴距版高定车型,同时将在下半年推出与华为合作的全新智电越野产品
2025-02-23 18:01:00
前波士顿动力研究所展示智能自行车UMV:跑酷轻松跳上桌
快科技2月23日消息,近期,机器人领域可谓热闹非凡。中国宇树机器人凭借其灵巧的身姿和强大的运动能力,在国内外掀起一股热潮
2025-02-23 18:31:00
105公里、速度提升4760倍!中国量子直接通信迈向实用
快科技2月23日消息,最近,北京量子信息科学研究院与清华大学、北方工业大学合作,提出单向量子直接通信理论,并成功研制出实用化系统
2025-02-23 18:31:00
蔚来乐道:L90最快将于2季度亮相 3季度上市
快科技2月23日消息,乐道汽车宣布其第二款车型,旗舰产品乐道L90 SUV,专为大家庭设计的“大三排”车型,计划最快于2025年第二季度亮相
2025-02-23 18:31:00
小鹏汽车:计划2025年进入60个国家和地区
快科技2月23日消息,小鹏汽车宣布了其2025年的全球扩张计划,届时将进入60个国家和地区,并建立超过300个海外售后服务网点
2025-02-23 19:01:00
AMD RX 9070 XT理论跑分首曝:居然逼近RX 7900 XTX!
快科技2月23日消息,AMD RX 9070系列显卡即将在本月底正式发布,3月5日解禁、6日上市开卖,现在我们看到了第一份理论跑分
2025-02-23 19:01:00