• 我的订阅
  • 头条热搜
从0到1:国产化千卡集群的一小步,AI算力主动权的一大步
...。供求关系紧张是产生算力焦虑的根源所在。一方面,大模型训练与推理需求呈几何级数爆发——自2022年以来,人工智能算力需求每3~4个月就翻一番,每年训练AI模型所需算力增幅高达10倍,而生成式AI使上升曲线进一步陡峭,...……更多
谷歌开源最强端侧小模型:2B参数越级跑赢GPT-3.5-Turbo
谷歌也来卷「小」模型了,一出手就是王炸,胜过了比自己参数多得多的GPT-3.5、Mixtral竞品模型。今年 6 月底,谷歌开源了 9B、27B 版 Gemma 2 模型系列,并且自亮相以来,27B 版本迅速成为了大模型竞技场 LMSYS Chatbot Arena 中排名最...……更多
替代NVIDIA,摩尔线程&无问芯穹联手首次实现国产GPU端到端AI大模型实训
...出大招,联合宣布正式完成MT-infini-3B 3B(30亿参数)规模大模型的实训,而使用的平台就是摩尔线程国产全功能GPU MTT S4000组成的千卡集群,以及无问芯穹的AIStudio PaaS平台。这次实训充分验证了夸娥千卡智算集群在大模型训练场景下...……更多
16384块NVIDIA H100训练Meta Llama3 4050亿参数大模型:3小时报错一次
快科技7月29日消息,如今的AI大模型规模越来越庞大,动辄成百上千亿参数,训练过程不仅需要数万甚至十几万块GPU加速卡,出错的几率也越来越高。Meta(Facebook)就披露了一份惊人的报告。Meta在报告中披露,为了训练自己的Llama ...……更多
轻量化模型架构catvton的优势在哪里
...在话下。 来自中山大学、Pixocial等机构联合发布轻量化模型架构CatVTON。他们是以StableDiffusionv1.5inpainitng为基础模型。来看看更多效果。用扩散模型进行虚拟试衣CatVTON可以实现传统平铺服装图到人物的换装。不管是上衣、裤子、...……更多
大模型应用疯狂加速,洗牌却在静悄悄进行了
...场,正面临着这个关键的过渡。 截至8月底,首批8家AI大模型企业通过备案。与上半年“甚嚣尘上”的行业境况不同,具备实力且具备满腔“产业抱负”的实力型玩家,总是姗姗来迟,但却总是能够一鸣惊人,为产业的大规模应...……更多
...:德宏团结报性能提升30%!中国电信进一步开源12B星辰大模型本报讯 近日,中国电信开源12B参数规模星辰语义大模型TeleChat-12B,相较1月开源7B版本,内容、性能和应用等方面整体效果提升30%,其中,多轮推理、安全问题等领域...……更多
大模型重构生命科学!最大基础模型面世,解锁DNA超长序列
生命科学领域,已经率先进入到基础模型时代!今年,化学诺贝尔奖授予了AlphaFold,AI+Science受到空前的关注。人们惊叹于,仅仅是一个蛋白质结构预测模型,就能释放出如此巨大的行业潜力。就在当下,在第三届中国生物计算...……更多
全球首个亿级参数量的地震波大模型在蓉正式发布,年底公测
...国地震局地球物理研究所以及清华大学联合开发的谛听大模型发布会”在国家超算成都中心举行。现场,全球首个亿级参数量的专业地震数据处理大模型——“谛听”地震波大模型正式发布,标志着中国在地震监测、预警和前兆...……更多
重磅!TeleAI 完成首个全国产化万卡万参大模型训练
...功完成国内首个基于全国产化万卡集群训练的万亿参数大模型(万卡万参),并正式对外开源首个基于全国产化万卡集群和国产深度学习框架训练的千亿参数大模型——星辰语义大模型 TeleChat2-115B。这是由中国电信集团 CTO、首...……更多
大模型时代的阿里云,将云计算进行到底
文|葛覃大模型与云计算,正在成为新时代的淘金者和卖铲人。自ChatGPT刷屏之后的数月时间,微软Azure与OpenAI的示范效应传导至全球,基本所有能做大模型的厂商都尝试“淘金”,其中,云厂商是一股重要力量,云计算天然适...……更多
ai绘画侵权实锤,扩散模型可能记住你的照片
AI绘画侵权,实锤了!最新研究表明,扩散模型会牢牢记住训练集中的样本,并在生成时“依葫芦画瓢”。也就是说,像StableDiffusion生成的AI画作里,每一笔背后都可能隐藏着一次侵权事件。不仅如此,经过研究对比,扩散模型...……更多
免训练大模型知识编辑,吸收新数据更高效|EMNLP\\\'24
让大模型能快速、准确、高效地吸收新知识!被EMNLP 2024收录的一项新研究,提出了一种检索增强的连续提示学习新方法,可以提高知识终身学习的编辑和推理效率。模型编辑旨在纠正大语言模型中过时或错误的知识,同时不需...……更多
Meta大模型LLaMA 3即将登场,参数量或达1400亿
在推出开源大模型LLaMA2近一年之后,Meta的新一代大模型LLaMA3即将面世。在4月9日伦敦举行的一次活动中,Meta确认计划在下个月内首次发布LLaMA3。据了解,该模型将有多个具有不同功能的版本。但Meta并没有披露LLaMA3的参数规模。...……更多
挑战Scaling Law,Meta发布移动端350M小模型MobileLLM,性能比肩7B LLaMA-v2
【新智元导读】Scaling Law还没走到尽头,「小模型」逐渐成为科技巨头们的追赶趋势。Meta最近发布的MobileLLM系列,规模甚至降低到了1B以下,两个版本分别只有125M和350M参数,但却实现了比更大规模模型更优的性能。从5月和6月...……更多
百川智能、阿里云等进入开源大模型领域,开启商业化前奏
闭源商业化的“百模大战”暂告段落,开源大模型仍旧热闹。今年7月Meta推出开源且免费的大型语言模型LLama2后,基于该模型微调的大模型不断涌现。此外,阿联酋阿布扎比技术创新研究所推出大参数模型Falcon180B,国内8、9月份...……更多
让大模型“外挂硬盘”,百川智能发布新API系列,企业定制成本大大降低
...爆全球AI浪潮以来,AI圈子已经迅速走过了造出了通用大模型的第一道关卡,如今最关键的问题在于——如何让大模型高效地在实际应用场景中落地?百川智能的最新实践是:用大模型+增强技术,可以大大提升企业应用大模型的...……更多
苹果开源7B模型,训练过程数据集一口气全给了,网友:很不像苹果
苹果最新杀入开源大模型战场,而且比其他公司更开放。推出7B模型,不仅效果与Llama 3 8B相当,而且一次性开源了全部训练过程和资源。要知道,不久前Nature杂志编辑Elizabeth Gibney还撰文批评:许多声称开源的AI模型,实际上在...……更多
权威AI开源标准1.0版发布:Llama也不算开源
大模型开源的口号,不是随便说说的。该来的终于来了。本周,人工智能领域迎来了对于「开源」的官方定义。开放源代码促进会(Open Source Initiative,OSI)发布了「开源 AI 定义」的 1.0 正式版。此举旨在澄清 Open Source 这一术语...……更多
碾压所有对手?谷歌发布轻量化开源大模型,笔记本电脑就可跑
开源大模型赛道迎来重磅新品。当地时间2月21日,谷歌宣布正式推出全新的开源大语言模型(LLM)“Gemma”, 旨在帮助开发人员和研究人员负责任地构建人工智能。据介绍,Gemma大模型与谷歌规模最大、能力最强的人工智能模型...……更多
Token化一切,甚至网络!北大&谷歌&马普所提出TokenFormer
...者是汪海洋,北京大学20级博士生,目前主要关注是通用模型的架构设计和学习算法。指导教授主要包括王立威,北京大学智能学院教授;Bernt Schiele,德国马普计算所教授;Federico Tombari 谷歌人工智能科学家等。新一代通用灵活...……更多
...科技企业或科研机构面向公众正式开放自研的人工智能大模型,标志着国内大模型从小范围内测开始走向大规模应用。大模型将如何为个人和产业赋能?这轮开放服务将为行业竞争带来什么影响?国内大模型未来的发展趋势又将...……更多
谷歌DeepMind推Imagen2;ChatGPT Plus恢复订阅;OpenAI提出用小模型监督大模型 | 本周硅谷发生了什么?
...览本周AI领域涌现多项重要进展。Runway宣布开展通用世界模型研发,旨在通过研究通用世界模型改进其视频生成系统,使其更好地模拟现实世界的互动。谷歌Deepmind推出Imagen 2,一款高质量、逼真的人工智能图像生成器。Mistral AI...……更多
刚刚,Llama 3.2 来了!支持图像推理,还有可在手机上运行的版本
...又又动荡了,另一边被誉为「真・Open AI」的 Meta 对 Llama 模型来了一波大更新:不仅推出了支持图像推理任务的新一代 Llama 11B 和 90B 模型,还发布了可在边缘和移动设备上的运行的轻量级模型 Llama 3.2 1B 和 3B。不仅如此,Meta 还...……更多
teleai星辰语音大模型:多方言能力再次突破
...?你听得懂各地方言吗?时隔不到半年,TeleAI星辰语音大模型的多方言能力再次突破,不仅攻克了湛江话、宜宾话、洛阳话、烟台话等,将方言种类从30种提升至40种的同时,还引入对英文的识别,构建起AI时代的沟通桥梁。当前...……更多
3天把Llama训成Mamba,性能不降,推理更快!
...尔、普林斯顿等机构的研究人员成功将Llama提炼成了Mamba模型,并且设计了新的推测解码算法,加速了模型的推理。先来看一张其乐融融的图片(一眼AI):右边的小羊驼代表Llama,而左边的蛇(Mamba)也是我们的老熟人了。至于...……更多
谷歌员工曝AI改进速度放缓,Gemini已成立新团队解决问题
...为提升其聊天机器人产品Gemini的性能而努力,该公司希望模型性能提升的速度可以与去年相当,这促使研究人员专注于其他方法来勉强取得效果。这种情况和OpenAI的遭遇类似。此前有报道称,OpenAI模型性能提升速度有所放缓,该...……更多
“言出必行”马斯克,全球最大开源模型Grok真的来了
刚刚开源的 Grok,一举拿下迄今为止“全球最大开源模型”称号。马斯克又搞了个全球第一。Grok开源美东时间3月17日,xAI 正式宣布开源大模型Grok-1的权重和网络架构。xAI 表示,开源版大模型Grok-1是一个由 xAI 从头开始训练的 314...……更多
李开复回应旗下AI独角兽陷“套壳”争议:起步受益于开源,会进步
...前“套壳”争议的官方回应,并在配文中写道:“全球大模型架构一路从GPT2-->Gopher-->Chinchilla-->Llama2->Yi,行业逐渐形成大模型的通用标准(就像做一个手机APP开发者,不会去自创iOS、Android 以外的全新基础架构)。01.AI.……更多
本文转自:经济参考报“随着AI从1.0进入2.0大模型技术阶段,我们迎来了有史以来最重要的科技革命和平台革命。”零一万物CEO、创新工场董事长李开复日前在接受记者采访时表示,算力作为AI 2.0发展的关键环节,需要采用更务...……更多
更多关于科技的资讯:
RTX 5090公版太奢华了!16+6+7相供电、14层PCB
快科技12月27日消息,RTX 5090显卡的PCB电路板、GPU核心先后曝光,现在又得到了更多细节,尤其是供电、功耗等
2024-12-27 19:08:00
张雪峰公司开年会“撒”现金:图书4个月线上卖了5000万
快科技12月27日消息,据媒体报道,近日,张雪峰公司“峰学蔚来”举办年会活动。活动现场,张雪峰现场摇奖,开启了多轮抽现金红包活动
2024-12-27 19:08:00
埃及两男子从海底偷数百件文物被捕 网友:考古队省心了
快科技12月27日消息,据报道,埃及最近逮捕两名男子,他们从海底盗取古代文物448件,其中包括硬币、雕像、斧头、青铜杯
2024-12-27 19:08:00
尊界S800为何用1.5T增程器 余承东:考虑过2.0T、但车头太重
快科技12月27日消息,鸿蒙智行首款百万级豪华轿车尊界S800已经申报,将提供纯电和增程两种动力类型,均分为双电机和三电机
2024-12-27 19:08:00
蔚来萤火虫三眼灯引争议 网友爆改出15款前脸!你觉得哪款更好看
快科技12月27日消息,在蔚来2024 NIO Day上,蔚来发布第三品牌首款车型萤火虫。萤火虫前脸采用了“三重奏”的理念
2024-12-27 19:08:00
台积电3nm拿下高通骁龙8 Elite 2订单!三星无奈瞄准骁龙8 Elite 3
快科技12月27日消息,据媒体报道,台积电近日成功夺得高通下一代处理器“骁龙8 Elite 2”的代工订单,将采用其先进的3纳米制程技术“N3P”进行量产
2024-12-27 19:08:00
《小小的我》豆瓣早期评价:易烊千玺扮脑瘫突破演技
今日,由易烊千玺主演的电影《小小的我》全国正式上映。在豆瓣早期评价中,观众们给予了不错的评价。不少观众被易烊千玺饰演的“脑瘫”主角刘春和所感动
2024-12-27 19:08:00
极越欠款3700万供应商讨债:1000多万是抵押的房子 2000多万是借的
快科技12月27日消息,据媒体报道,近期,极越欠款3700万的供应商星塘文化负责人李红星发视频疑似在线讨债。在视频中,李红星表示
2024-12-27 19:38:00
节电率53%!国内首台自主研发磁悬浮地源热泵机组投运
快科技12月27日消息,据“天瑞磁悬浮”官微发文,天瑞重工自主研发的国内首台磁悬浮离心式地源热泵机组,在山东省潍坊市某住宅小区成功开机运行
2024-12-27 19:38:00
游戏性能最高提升14%!七彩虹Z890主板迎来0x114微码更新
快科技12月27日消息,今天七彩虹宣布,旗下Z890系列主板迎来最新的0x114微码更新,为酷睿Ultra 200S系列处理器提供全新功能和性能提升
2024-12-27 19:38:00
涂鸦智能携手星环科技、思码光,重塑全屋智能影音新体验
近日,全球化云开发者平台涂鸦智能(NYSE:TUYA,HKEX:2391)与国内知名影音品牌星环科技、智能照明行业领先品牌思码光达成合作
2024-12-27 20:00:00
陕西迈入万兆时代:首位全光万兆园区用户诞生
快科技12月27日消息,近日,西安市碑林科技产业园内的陕西红顶名医堂药业有限公司成功开通了万兆宽带服务,成为陕西省首个采用50G PON解决方案的全光万兆园区用户
2024-12-27 20:08:00
万亿“宁王” 官宣赴港二次上市
万亿“宁王”,正式公布赴港上市计划。12月26,宁德时代召开第四届董事会第一次会议,逐项审议通过《关于公司发行H股股票并在香港联合交易所有限公司上市方案的议案》(下称
2024-12-27 20:08:00
小号问界M9来了!问界M8实车路试曝光:前后和M9一个样
快科技12月27日消息,今日有网友曝光了问界M8实车的路试视频。从视频中来看,问界M8的尾部造型,与“大哥”问界M9一脉相承
2024-12-27 20:08:00
NVIDIA、苹果多年恩怨纠葛大起底:从乔布斯在任就开始
快科技12月27日消息,如今随着AI的不断发展,各大公司都纷纷投入巨资抢购NVIDIA的GPU,但苹果却非NVIDIA的主要客户
2024-12-27 20:08:00