• 我的订阅
  • 头条热搜
...于大模型分布式并行训练场景的GPU实例,相较上一代实例集群性能最高提升3倍以上。 自动驾驶公司毫末智行与火山引擎合作打造智算中心,为DriveGPT自动驾驶生成式预训练模型提供强大的算力支持。毫末智行CEO顾维灏介绍,Driv...……更多
全新小布助手开启新一轮公测!OPPO官宣与联发科技共建大模型端侧化部署方案
...的生成式用户专属大模型。该模型以“端云协同”为基础架构设计思路,推出从10亿至千亿多种不同参数规模的模型规格,实现在本地与云端协同运作的效果。AndesGPT 对大模型端侧推理引擎进行算子融合与优化,使得结果生成速...……更多
激活数据价值!贵州:构建数据流通新生态 培育数字产业竞争力
...做大规模中做优结构。截至目前,贵阳信息技术服务产业集群入选国家首批战略性新兴产业集群、入选国家区块链综合型创新应用试点,世纪恒通在创业板成功上市,满帮贡献网络货运等产值近100亿元。人工智能取得突破医学影...……更多
5年特斯拉老车推送最新端到端 网友:极氪你看看人家
...足够大——端到端入门门槛,通常认为是10亿资金、万卡集群,但对特斯拉来说,都不是问题。所以当下的FSD V12版本可能某些场景上表现不稳定,甚至小版本间还会出现“负优化”现象,但在整体体验、平均能力和发展性上,无...……更多
北京智源发布悟道3.0大模型系列
...文本代码生成模型。7B、33B在技术上继承了GPT-3、LLaMA等的架构设计优点,替换了一批更高效的底层算子实现、重新设计实现了中英双语的tokenizer,升级了BMTrain并行训练方法,在Aquila的训练过程中实现了比Magtron+DeepSpeedZeRO-2将近8...……更多
“言出必行”马斯克,全球最大开源模型Grok真的来了
...时间3月17日,xAI 正式宣布开源大模型Grok-1的权重和网络架构。xAI 表示,开源版大模型Grok-1是一个由 xAI 从头开始训练的 3140 亿个参数混合专家模型。据介绍,基础模型基于大量文本数据进行训练,没有针对任何具体任务进行微...……更多
...成更困难、更复杂的任务。“空天·灵眸”3.0版内核工作架构是基于热传导,这是联合团队自主研发的一套小而精的原创性架构。受传热学物理思想启发,联合团队将场景目标间视觉语义传播建模为热能扩散过程,从而使该架构...……更多
阿里云的AI路线图
...阿里云升级了人工智能平台PAI。PAI底层采用HPN7.0新一代AI集群网络架构,支持高达10万卡量级的集群可扩展规模,超大规模分布式训练加速比达96%,在大模型训练任务中,可节省超过50%的算力资源。阿里云官网显示,PAI是面向开...……更多
智谱AI生成视频模型清影(Ying)正式上线,有“点子”就能进行创作
...供了全方位的支持。清影(Ying)的训练依托亦庄高性能算力集群,未来将应用于北京亦庄的高精尖产业集群,推动大模型赋能实体经济的新业态发展。合作伙伴bilibi和华策影视也参与了清影的技术研发过程,共同探索未来的应用场...……更多
烧数亿美元、耗上万颗英伟达 GPU,微软揭秘构建 ChatGPT 背后超级计算机往事 !
...的规模是前所未有的,比业内任何人试图建立的网络 GPU 集群都要大得多。据彭博社报道,微软在该项目上已经花费了数亿美元。要问这个钱花得值不得,现在无论是微软,还是业界同行,给出的答案必然是肯定的。因为去年 11 ...……更多
ChatGPT走红背后:苦熬五年,三次AI路线迭代|行业观察
...节点众多,跨服务器通信需求大,网络带宽性能亦成为GPU集群瓶颈,高性能计算网络也随之成为一个话题。具体的数字更具说服力。有报道指出,Stability AI此前仅计算就需要花费约2000万美元。而如果仅拿大模型去做微调和推理...……更多
大模型还能怎么创新?复旦教授邱锡鹏:需在新的架构、多模态等方面多做研究
...学术论文,被引用1.5万余次。划重点:1.现在大模型整体架构比较雷同,要想做出创新,还需在新的架构、幻觉问题、多模态等方面多做研究。2.我本身就比较喜欢自由的研究氛围。复旦是一个让我觉得舒服宽松的地方,能够去...……更多
手机市场深陷泥沼,厂商如何破冰?
...颈不断,手机厂商该如何破冰,进入下一个增长期?潮汐架构,一份关键答案性能不再是手机的瓶颈,前几年手机厂商都选择了新的影像赛道,通过与传统相机企业的携手同行,让高端手机市场迎来了新的增长机会。如今市面上...……更多
连续无故障训练15天!摩尔线程发布夸娥智算集群KUAE 1.2
快科技8月19日消息,摩尔线程正式发布了夸娥智算集群KUAE 1.2版本,通过软硬件层面的综合性优化,在功能、性能上多维升级,更高效、稳定,对生态系统更友好,可为大模型训练提供更坚实可靠的算力支撑。夸娥1.2主要升级点...……更多
摩尔线程与360达成战略合作,将共同打造“360智脑大模型一体机”
...摩尔线程完成适配,基于摩尔线程夸娥(KUAE)千卡智算集群,360 集团已成功完成了 70 亿和 700 亿参数的大模型分布式训练任务。摩尔线程方面称,测试结果显示全程软硬件即插即用,集群训练稳定性达到 100%,训练效率和兼容...……更多
高通骁龙:端侧AI 启幕移动智能“芯”时代
...在十年前也就是2013年就推出了名声大噪的AI芯片Zeroth和SNN架构——彼时高通也同步提出了神经处理单元(NPU)的概念,2014年高通进一步收购了AI图像识别技术公司Euvision进一步探索AI在移动端的潜在用例,并在随后将源于Zeroth的AI加...……更多
百度All in的大模型何时能赚钱?
...的要求自然也更进一步,据媒体报道,文心4.0是在万卡AI集群上训练出来的,应该也为国内首次使用万卡规模集群进行训练的大语言模型。而万卡集群,国内目前只有华为、阿里透露已建成万卡AI集群,但我们都没看到基于它推...……更多
腾讯推出了一条大模型“高速公路”,大模型通信性能可提升10倍 | 最前线
...、交换。高性能计算网络连接了大量的服务器,组成算力集群。网络、服务器互联互通,才能共同完成AI的训练任务。但大集群并不等同于大算力。计算集群越大,产生的额外通信损耗越多。因此,对AI大模型的网络而言,大带...……更多
昇思MindSpore 2.3全新发布
...练。通过原创的多副本、多流水交织等8种并行技术,使集群线性度达到90%(业界不足60%),通过整图优化及下沉执行等,使得算力利用率达到55%(业界不足40%);针对集群故障率高,恢复时间长的普遍问题,通过编译快照,确...……更多
中国智算建设潮背后,谁在推动十万卡集群
在打造十万卡集群上,几家国内头部企业已有动作。在11月12日举办的百度世界2024大会上,百度集团执行副总裁、百度智能云事业群总裁沈抖透露,为了支撑大模型进一步的高速发展,百度在打磨十万卡集群能力方面,已在两大...……更多
所谓AI革命,到现在为止,是能源的一场“灾难”
...的LLM都采用了并行化的方式进行计算,所以对高性能的GPU集群有着大量的要求。高性能的GPU的运作不仅消耗大量的能源,同时也对冷却系统提出了很高的要求。 LLM的推理阶段,用户每一次查询都涉及能源的消耗。这些因素共同...……更多
替代NVIDIA,摩尔线程&无问芯穹联手首次实现国产GPU端到端AI大模型实训
...用的平台就是摩尔线程国产全功能GPU MTT S4000组成的千卡集群,以及无问芯穹的AIStudio PaaS平台。这次实训充分验证了夸娥千卡智算集群在大模型训练场景下的可靠性,同时也在行业内率先开启了国产大语言模型与国产GPU千卡智算...……更多
权威AI开源标准1.0版发布:Llama也不算开源
...支持库(如分词器和超参数搜索代码)、推理代码和模型架构。 参数:模型参数,例如权重或其他配置。参数应根据 OSI 批准条款提供。 例如,训练中间阶段的检查点以及优化器状态。对于机器学习系统,模型权重也是一个重...……更多
国云注智 聚力向新 第七届数字中国建设峰会·电信生态成果体验馆盛大开馆
...算布局,实现智算规模达到13EFLOPS。在上海,已经建成单集群的万卡智算资源池,同时在全国范围设立多个具备千亿参数以上训练能力的公共智算中心。在京津冀、长三角、粤港澳、成渝等区域中心,已建成大规模的天翼云4.0资...……更多
摩尔线程万卡GPU集群新进展!性能可提升20倍
...极智正式建立战略合作关系,旨在加速国产大规模GPU智算集群的产业化进程,推动AI算力生态的快速发展,为大模型行业提供更强大、灵活且高效的基础设施支持。摩尔线程近期宣布了从千卡至万卡的全功能GPU智算集群扩展方案...……更多
我,花3天时间做了这件事 | 普通人视角下的WAIC
...企业在进行大模型开发过程中的几个核心问题:切换硬件集群、适配底层硬件以及模型微调优化等全都是复杂的问题。所以我理解,华为是给企业做大模型开发这事制作了一个SOP化的企业级方案,可以让很多中小企业想做、想下...……更多
比Stable Diffusion便宜118倍!1890美元训出11.6亿参数高质量文生图模型
...幸存的patch中,从而显著减少高mask带来的性能下降。在本架构中,patch-mixer是通过注意力层和前馈层的组合来实现的,使用二进制掩码进行mask,整个模型的损失函数为:与MaskDiT相比,这里不需要额外的损失函数,整体设计和训...……更多
vivo发布自研大模型,为用户和开发者带来诸多惊喜
...能推理的问题,能秒级生成图片;搭建了坚如磐石的万卡集群,算力能持续稳定输出。这一体系全面支撑了vivo各模态、模型的训练与推理,广泛应用于vivo的AI产品中。vivoAI工程架构专家陈崇沛展望未来,vivo要打造出强有力的个人...……更多
重磅!TeleAI 完成首个全国产化万卡万参大模型训练
...智能研究院(TeleAI)成功完成国内首个基于全国产化万卡集群训练的万亿参数大模型(万卡万参),并正式对外开源首个基于全国产化万卡集群和国产深度学习框架训练的千亿参数大模型——星辰语义大模型 TeleChat2-115B。这是由...……更多
Meta大模型LLaMA 3即将登场,参数量或达1400亿
...币)。在这份文档中,Meta也透露了一些用于训练LLaMA3的集群细节,该集群由24576个英伟达H100GPU构成。据市场跟踪公司Omdia去年发布的一份报告,Meta和微软是英伟达H100GPU的最大买家。据其估算,上述两家公司在2023年各自采购了150...……更多
更多关于社会的资讯:
代小红做客访谈:用匠心守护情绪安宁
弘扬工匠精神,厚植工匠文化,在这个快节奏高压力的社会当中,心理健康问题日益凸显,越来越多的人开始关注自己的内心世界,心理健康不仅关乎个人的幸福感和生活质量
2024-11-16 15:00:00
中新社西宁11月16日电 (记者 孙睿)记者从青海冷湖科创园区管委会获悉,中山大学80厘米望远镜建成仪式15日在中山大学珠海校区举行
2024-11-16 15:08:00
杭州机场淋浴服务广受好评 如何体验?
好消息,近日杭州萧山国际机场服务又上新!机场淋浴房内提供免费便民洗漱套装,第一批体验过的乘客集体点赞!“人在机场,刚洗完澡
2024-11-16 15:08:00
杭州新开了一条免费乘坐的公交专线,串起运河边的几十个景点
橙柿互动消息 你在运河边游玩的时候,是否碰到过这样的问题:逛完拱宸桥和桥西历史文化街区,想去大兜路一带走走,发现走过去挺远
2024-11-16 15:08:00
极目新闻记者 姚赟 刘琴 丁鹏11月16日,湖南张家界桑植县官方发布通报称,16日5时2分许,张家界市桑植县一民房发生火灾致7人遇难
2024-11-16 15:15:00
“跨越六十年:人工智能的创意之火”展览在泰康美术馆开幕
11月15日,泰康美术馆“跨越六十年:人工智能的创意之火”展览开展。这场由泰康美术馆艺术总监唐昕、英国金匠学院教授威廉·雷森
2024-11-16 15:27:00
热搜第一!郑钦文突然将它解散
11月16日,微博话题#郑钦文已解散粉丝群#冲上热搜第一。11月15日,有网友反映@郑 钦文Ana 解散了关联到她主页的微博粉丝群
2024-11-16 15:27:00
将电极植入大脑,癫痫治疗再添新利器!贵医附院成功实施立体定向脑电图手术
日前,贵州医科大学附属医院癫痫MDT团队为一位药物难治性癫痫患者成功实施立体定向脑电图(SEEG)手术,该手术的成功开展为药物难治性癫痫患者带来了新的希望
2024-11-16 15:28:00
11月16日清晨5时2分,湖南张家界市桑植县一栋五层居民楼发生火灾,有事发地周边居民介绍,一家7口未能及时逃脱,不幸遇难
2024-11-16 15:45:00
近日,消费者宋先生向澎湃公众互动平台“服务湃”反映,他通过顺丰速运“全额保价”的形式分别向广西和四川快递两份黄金,共计370克
2024-11-16 15:45:00
58岁“拳王”泰森复出,输给27岁美国网红拳手
中新网北京11月16日电 (记者 邢蕊)北京时间16日,58岁的“拳王”泰森与27岁的网红拳手杰克·保罗之间的交锋,吸引了全世界的关注
2024-11-16 15:57:00
中新网南宁11月16日电 (记者 黄艳梅)广西北流市公安局15日发布警情通报称,经接报警调查,“北流教育局局长患艾滋病并传播多人”的谣言系李某
2024-11-16 15:57:00
这部纪录片荣获全国金奖!透过镜头探索蘑菇奥秘
据浙江省林业局“浙江林业”:近日,中国科普作家协会公布第八届“中国科普作家协会优秀科普作品奖”,钱江源—百山祖国家公园候选区生物多样性纪录片《菌物王国》在科普影视动画类中荣获金奖
2024-11-16 16:10:00
山东商务发布|消费者最高可享受1.6万元家电以旧换新补贴
11月16日,山东省政府新闻办“惠企利民政策在身边”主题系列现场新闻发布会在济南黄金99景城举行,政策发布走进社区一线
2024-11-16 16:12:00
善待每一个敢于发声的孩子,允许他们“不平则鸣”,允许他们有不同看法,这是更温良的教育方式近日,一条内容为云南富宁县一中一学生在科技节活动现场质问学校的视频引发关注
2024-11-16 16:15:00