• 我的订阅
  • 头条热搜
训练一次ChatGPT,“折寿”3000辆特斯拉
...聊天应用ChatGPT风靡全球后,立即在全球范围内掀起了大模型开发的热潮。但准备参战的玩家们很快便认清现实,这不过是一场由巨头主宰的游戏,其中的关键,就是能耗。知名计算机专家吴军的形容并不夸张——ChatGPT每训练一...……更多
烧数亿美元、耗上万颗英伟达 GPU,微软揭秘构建 ChatGPT 背后超级计算机往事 !
整理 | 苏宓出品 | CSDN(ID:CSDNnews)都说 ChatGPT 这种大模型研发是大公司之间的博弈,不仅仅是因为其要消耗的算力巨大,也是因为需要有强大的资金支撑。那么,加入这场战局,究竟要花费多少钱?此前,据 Techcrunch 报道,有...……更多
...人民日报客户端施芳4月24日,腾讯在京发布了汽车行业大模型“全域智能”方案,覆盖汽车研发、生产、营销、服务、企业协同等五大核心场景。与此同时,腾讯发布了在智能汽车云、智能座舱、出海等方面的升级方案。腾讯集...……更多
...全球十多家医院,达摩院基于此设想构建出了胰腺癌检测模型PANDA:利用深度学习技术观察低对比度平扫CT图像中微小的密度差异,继而有效检测出癌症病灶。该论文发表在《自然·医学》上,引起了广泛关注,论文访问量高达6.4...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...为刘家铭博士,研究方向为面向开放世界的多模态具身大模型与持续性学习技术。本工作第二作者为刘梦真,研究方向为视觉基础模型与机器人操纵。指导老师为仉尚航,北京大学计算机学院研究员、博士生导师、博雅青年学者...……更多
百度文心大模型4.0技术进展
...023在北京首钢园举办,百度首席技术官王海峰解读文心大模型4.0背后的关键技术和最新进展。王海峰表示,文心大模型4.0的理解、生成、逻辑、记忆四大能力都有显著提升,9月已开始小流量上线,过去一个多月效果又提升了近30...……更多
...方案京津冀蒙算力走廊助力“跨省算”本报记者 曹政大模型、元宇宙、自动驾驶、工业互联网……眼下最火的这些技术都得仰仗算力,算力如电力一样不可或缺。北京怎样筑牢“算力底座”?近日,市经信局等部门发布《北京...……更多
新一代aigc技术的发展
...决方案——DDC技术。GPU负载共享的三种方法前述AIGC大型模型的卓越能力不仅来自于其庞大的数据量,也源于算法的不断演进和进步。在训练这些大型模型时,通常需要利用多个GPU来分担工作负载。为实现高效的负载共享,采用3...……更多
马斯克承诺开源版大模型 来了!Grok-1:3140亿参数迄今最大,权重架构全开放
...之心开源社区有福了。说到做到,马斯克承诺的开源版大模型 Grok 终于来了!今天凌晨,马斯克旗下大模型公司 xAI 宣布正式开源 3140 亿参数的混合专家(MoE)模型‘Grok-1’,以及该模型的权重和网络架构。这也使得Grok-1成为当...……更多
英特尔发布全新软硬件平台,全速助力企业推进AI创新
...飞跃。 英特尔Gaudi3预计可大幅缩短70亿和130亿参数Llama2模型,以及1750亿参数GPT-3模型的训练时间。此外,在Llama7B、70B和Falcon180B大语言模型(LLM)的推理吞吐量和能效方面也展现了出色性能。英特尔Gaudi3提供开放的、基于社区的...……更多
...科技趋势预测。进入2023年,达摩院预测多模态预训练大模型、Chiplet模块化设计封装、存算一体、云原生安全、软硬融合云计算体系架构、端网融合的可预期网络、双引擎智能决策、计算光学成像、大规模城市数字孪生、生成式A...……更多
阿里云的AI路线图
...“未来,云计算的算力都会被这些智能时代的电动机——模型消耗掉。”不过,在王坚看来,2023年人工智能和云计算有了一次集中体现和爆发后,第三次浪潮不会在一两年内完成,而是需要十年、几十年的时间。 阿里云将在其...……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...雨编辑 | 邓咏仪全球首家发布Sora同款底层架构的清华系模型公司,近期完成了新一轮融资。投资名单中,也出现了大模型独角兽智谱AI的身影。36氪获悉,近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融资由启明...……更多
中国电信中部智算中心在中部地区属于最高等级
...内一流绿色节能环保水平的同时,可支持部署万亿参数大模型。中国电信在全国构建了多点智算中心,提供5000PFLOPS的智算算力,中部智算中心依托天翼云骁一体化算力平台,提供高性能、高显存、高兼容性的主流大模型训练、...……更多
AI服务器缺货真相调查:两天涨价30万,连“味精大王”都入场了
...打响以来,国内AI服务器产业可谓冰火两重天。一边,大模型浪潮带来了AI服务器需求暴增。互联网云大厂、AI大模型企业以及行业公司需纷纷砸钱投入。不仅中国电信这样的ICT龙头近期定下超80亿元的AI算力服务器采购项⽬,就...……更多
中国最接近GPT3.5的团队 默默无闻的驻扎在西湖边
...,之所以会选中西湖心辰,是因为看中了其领先国内的大模型研发水准及其有长期记忆、情感感知和主动聊天的特色。凭借着顶流的技术团队、多模态的技术优势,这个默默无闻的低调企业,不仅打造了国内极少数能与GPT-3.5一...……更多
商汤如何玩转大模型+大算力?详解“日日新SenseNova”大模型体系的关键招
出品 | 搜狐科技作者 | 梁昌均在ChatGPT引发的大模型和生成式AI热潮下,国内AI公司商汤科技也秀出自家肌肉。在4月10日下午的技术交流日上,商汤正式发布“日日新SenseNova”大模型体系。这一大模型体系的名称取自《礼记·大学...……更多
一键解锁ChatGPT原理与应用
在这段时间,有关大语言模型的消息频频传出,许多人也逐渐了解、甚至开始应用起相关的AI软件。那么,你了解GPT模型的原理是什么吗?大模型和传统AI的区别在于哪里?其应用可以体现于哪些方面?一起来看看作者的分析和...……更多
昆仑万维:“天工大模型3.0”将于4月17日正式发布 同步开源4000亿参数MoE超级模型
...新闻网2023年4月17日,昆仑万维发布自研双千亿级大语言模型“天工1.0”。即将到来的2024年4月17日,在“天工”大模型一周年之际,昆仑万维重磅宣布,“天工3.0”正式开启公测!“天工3.0”采用4千亿级参数MoE混合专家模型,并...……更多
...强GPU,实现毫秒级算存数据传输,率先实现“算力+语料+模型+训练”一体化服务能力。立足宁夏自然禀赋优势和算力先发优势,宁夏移动积极打造全国首个“万卡+”智算基地,构建人工智能产业生态体系。据现有数据统计,以...……更多
AI 已死?不,AIGC 给我们带来了新的希望 | 氪记 2022
...上了一步台阶,可以向公众发布以供广泛使用。以大语言模型(large language models,以下简称“LLM”)为基础的 text-to-X(文本到任意)技术再在2022年有了突破性进展,分别在 text- to-image(文本到图片)、AI-generated-text(AI 生成……更多
把大模型装进手机,总共分几步?
...去上海参加华为春季新品发布会,用一页keynote提到了大模型技术与手机硬件的结合。虽然只有短短的一两分钟,但我专门发了一条朋友圈,看好自然语言交互能力在手机上的应用。当时我就有预感,大语言模型跟手机结合,应...……更多
科学家提出情景学习新范式,让学霸大模型向学弱大模型输送能力
近日,上海算法创新研究院大模型团队的研究员李志宇和同事提出一种情景学习新范式:SLEICL(基于强模型增强的情景学习,Strong LLM Enhanced ICL),能更好地加速小模型的学术研究和产业落地。借助这一方法可以大幅提升小模型...……更多
全面开源 浪潮信息发布千亿参数基础大模型“源2.0”
...浪潮电子信息产业股份有限公司在京发布“源2.0”基础大模型,并宣布全面开源。“源2.0”包括102B(1026亿)、51B(518亿)、2B(21亿)三种参数规模的模型,在编程、推理、逻辑等方面展示出了先进的能力。基础大模型的关键能...……更多
大模型推理乘上RISC-V快车?国内AI芯片创企推大模型系列一体机
...算力需求大爆发的转折之年,如今随着国内两批超20个大模型获得审批、种类多样的大模型相关应用显现,企业对私有化部署的需求也水涨船高。面向这一行业趋势,2023年世界互联网大会乌镇峰会上,国内云端RISC-V大芯片创企希...……更多
一次平扫CT 筛查多种癌症(大健康观察)
...癌症之王”,研究团队研制出一个强大的胰腺癌早期检测模型PANDA——利用AI放大并识别平扫CT图像中那些肉眼难以识别的细微的病理特征,有望成为一种在医院、体检中心落地推广的大规模癌症早筛工具。 与过往的医疗影像AI...……更多
chatgpt低成本复现流程开源
首个开源的ChatGPT低成本复现流程来了!预训练、奖励模型训练、强化学习训练,一次性打通。最小demo训练流程仅需1.62GB显存,随便一张消费级显卡都能满足了。单卡模型容量最多提升10.3倍。相比原生PyTorch,单机训练速度最高...……更多
亚马逊开发史上最大文本转语音模型
...能研究团队宣布开发了一个据称是史上最大的文本转语音模型,该模型拥有最多的参数,并使用了最大的训练数据集。研究人员已经在arXiv预印本服务器上发表了一篇论文,详细描述了模型的开发和训练过程。近年来,像ChatGPT这...……更多
AI大模型技术应用爆发,云市场也在加速变革。4月18日,火山引擎在其举办的“原动力大会”上发布自研DPU等系列云产品,并推出新版机器学习平台:支持万卡级大模型训练、微秒级延迟网络,让大模型训练更稳更快。火山引擎...……更多
国云注智 聚力向新 第七届数字中国建设峰会·电信生态成果体验馆盛大开馆
...聚”面向不同专业水平和应用场景,提供全流程一站式大模型智算服务,提升大模型训练推理效率,降低训练门槛。云智超智算加速平台“云骁”支持多款国产芯片以及上层框架,可以对万卡规模智算集群进行纳管。算力分发网...……更多
更多关于科技的资讯:
新华社权威快报丨中法天文卫星成功发射
本文转自:新华社记者从国家航天局获悉6月22日,我国在西昌卫星发射中心用长征二号丙运载火箭成功发射中法天文卫星这颗卫星是中法两国联合论证研制的空间科学卫星是迄今为止全球对伽马暴开
2024-06-22 15:24:00
不止小米SU7 仰望U9完成纽北赛道首轮测试:超预期
快科技6月22日消息,上周有海外媒体在纽北赛道拍到了来测试的小米SU7伪装车,后引发关注,其实除了小米US7,比亚迪仰望旗下的旗舰超跑仰望U9也来到这条赛道
2024-06-22 15:36:00
本文转自:新华网新华社天津6月22日电题:传统产业如何锻造新质生产力?——智博会探“新”记新华社记者李亭形态可掬的冲咖啡机器人
2024-06-22 15:42:00
小伙安装安全卫士喜提360全家桶 吐槽根本不能卸载:被投诉后秒认怂
快科技6月22日消息,近日,有网友公开吐槽360,称安装了一个安全卫士,结果电脑上多了一套360全家桶。当然了,之所以让这位小伙生气
2024-06-22 16:06:00
中考满分900分 女生仅扣26分:数学轻松满分 目标直指北大
6月22日消息,据国内媒体报道称,四川绵阳一学生在满分900分的中考中取得874分的好成绩,仅扣26分。如此优秀的学生自然也是引来外界的围观
2024-06-22 16:21:00
余承东邀请微博CEO试乘享界S9:空间很大 零重力座椅、投影都有
快科技6月22日消息,华为开发者大会2024(HDC 2024)在东莞松山湖开幕,现场不仅展示了丰富多彩的鸿蒙生态软件创新
2024-06-22 16:21:00
镭神智能发明专利授权突破百项大关,创新驱动引领未来
在这个日新月异的科技时代,创新能力成为衡量一家企业核心竞争力的关键指标。镭神智能,作为一家在智能科技领域孜孜不倦追求创新的公司
2024-06-22 16:46:00
天赋清凉 猫人男士冰丝抗菌内裤3条 到手19.9元
阿里自营淘新衣店猫人男士冰丝抗菌内裤3条日常标价 99.9 元,下单领取 80 元优惠券,实付到手价 19.9 元。男士冰丝内裤
2024-06-22 16:51:00
“假煤气”爆炸致5人受伤!二甲醚到底是啥
快科技6月22日消息,由于二甲醚的市场价格低于液化石油气,有部分不法商家在液化石油气中掺入二甲醚以牟取更高利润。然而,这种做法不仅不耐烧(二甲醚的热值仅为液化石油气的63%)
2024-06-22 16:51:00
比亚迪又一王炸!宋L DM-i内饰曝光:空调出风口大变样
快科技6月22日消息,有博主今天发布了一组比亚迪宋L DM-i的内部照片,让我们能够提前一窥其内饰设计。从图片中可以看出
2024-06-22 17:06:00
蓝月亮稳坐618多平台冠军宝座 过硬产品力和品牌力是取胜关键
近日,一年一度的618在火热氛围中圆满落幕。今年的618各方依然积极投入,但与往年不同的是,京东、天猫等主要电商平台纷纷取消预售机制
2024-06-22 17:07:00
本文转自:人民日报客户端吴勇内蒙古自治区人民政府办公厅日前发布若干意见,从优化产业布局、强化电力保障、促进调度交易、推进绿色发展
2024-06-22 17:14:00
余承东邀微博CEO试乘享界S9:豪华美学全面超越迈巴赫
6月22日,华为开发者大会2024如期而至。而在大会期间,华为常务董事、终端BG董事长、智能汽车解决方案BU董事长余承东的专属座驾换成了华为全景智慧旗舰轿车享界S9
2024-06-22 17:36:00
本文转自:新华网新华社郑州6月22日电题:中试基地为小城发展注入科创“芯”——河南探索中试基地全链条搭建新模式新华社记者杨琳近日
2024-06-22 17:44:00
“含金量”足!智能产业之变,技术到落地“最后一公里”加速实现
本文转自:央视网央视网消息:2024世界智能产业博览会正在天津举办。目前,已经有103个重点项目完成签约,协议签约额突破1000亿元
2024-06-22 17:45:00