• 我的订阅
  • 头条热搜
全球最强开源大模型Llama 3发布:使用15T数据预训练,最大模型参数将超4000亿
就在刚刚,Meta 发布了其最先进开源大型语言模型的下一代产品——Llama 3。据介绍,Llama 3 在 24K GPU 集群上训练,使用了 15T 的数据,提供了 8B 和 70B 的预训练和指令微调版本,可以支持广泛的应用。同时,Llama 3 在广泛的行业...……更多
全球首个亿级参数量的地震波大模型在蓉正式发布,年底公测
...国地震局地球物理研究所以及清华大学联合开发的谛听大模型发布会”在国家超算成都中心举行。现场,全球首个亿级参数量的专业地震数据处理大模型——“谛听”地震波大模型正式发布,标志着中国在地震监测、预警和前兆...……更多
全球首次!时序大模型突破十亿参数,华人团队发布Time-MoE,预训练数据达3000亿个时间点
...而,构建一个兼具强大性能与高效运算的大规模时序预测模型始终是一个巨大的挑战。此外,高质量的大型公共时间序列数据库的匮乏进一步加剧了这一难题。近日,由来自普林斯顿大学、格里菲斯大学等全球多地的华人国际科...……更多
小模型正在成为AI界的新宠
大模型的发展已经进入了万亿级参数时代。DeepMind 联合创始人穆斯塔法・苏莱曼(Mustafa Suleyman)预测, 仅在未来三年内,大模型规模以惊人的速度继续扩张,将增长 1000 倍。一方面,模型的参数量与其能够处理和学习的复杂性...……更多
马斯克打脸OpenAI!全球最大模型Grok-1开源
...:林志佳马斯克(Elon Musk)真的实现了他的承诺——把大模型Grok-1开源了。钛媒体App获悉,北京时间3月18日早上,“硅谷钢铁侠”、亿万富翁马斯克旗下AI初创公司xAI宣布,其研发的大模型Grok-1正式对外开源开放,用户可直接通...……更多
大模型新趋势之MoE:现状、挑战及研究方向
2024年,全球主流企业加快推出MoE大模型,1-5月发布千亿以上大模型均采用MoE优化架构,且数量超过近三年总和。MoE大模型架构凭借平衡大模型训推成本和计算效率等优势,更适合处理大规模数据和复杂任务,已成谷歌、OpenAI、...……更多
李彦宏称开源赶不上闭源?Meta发布最强开源模型,马斯克评价“还不错”
...家坚持开源的社交巨头,又默默放出了最新一代的开源大模型Llama3。美当地时间4月18日,Meta在官网上发布了两款开源大模型,参数分别达到80亿和700亿,是目前同体量下性能最好的开源模型。马斯克对此评价称“还不错”。Meta...……更多
中国最大开源MoE模型,255B参数无条件免费商用,元象发布
元象XVERSE发布中国最大MoE开源模型:XVERSE-MoE-A36B,该模型总参数255B,激活参数36B,达到100B模型性能的「跨级」跃升。同时训练时间减少30%,推理性能提升100%,使每token成本大幅下降。在多个权威评测中,元象MoE效果大幅超越多...……更多
林达华谈大模型发展之路:未来会有更高效的模型结构出现
大模型的上下文长度快速增长,超长上下文解锁新应用,但推理计算代价高昂,上下文本身对于信息不会进行压缩,不能直接捕捉其中的深层知识和规律。上海人工智能实验室领军科学家林达华。过去一年,人工智能领域风起...……更多
“言出必行”马斯克,全球最大开源模型Grok真的来了
刚刚开源的 Grok,一举拿下迄今为止“全球最大开源模型”称号。马斯克又搞了个全球第一。Grok开源美东时间3月17日,xAI 正式宣布开源大模型Grok-1的权重和网络架构。xAI 表示,开源版大模型Grok-1是一个由 xAI 从头开始训练的 314...……更多
百川智能、阿里云等进入开源大模型领域,开启商业化前奏
闭源商业化的“百模大战”暂告段落,开源大模型仍旧热闹。今年7月Meta推出开源且免费的大型语言模型LLama2后,基于该模型微调的大模型不断涌现。此外,阿联酋阿布扎比技术创新研究所推出大参数模型Falcon180B,国内8、9月份...……更多
...合鹏城实验室,正式发布自主研制的百亿级遥感解译基础模型——“空天·灵眸”3.0版,这是迄今为止全球首个百亿参数级空天一体遥感解译基础模型。近年来,我国遥感数据获取能力不断增强,已进入遥感大数据时代,人工智...……更多
高文院士:鹏城实验室已训练3个大模型,今年底将拥有两万多块卡
...城实验室主任高文发表演讲,分享了鹏城实验室在打造大模型平台上的进展。他表示,大模型训练首先需要一个平台。“现在要想训练一个大模型,需要有几千块卡,甚至上万块卡。”他介绍到,鹏城实验室在2020年就搭建了这...……更多
AI大模型行业报告:大模型发展迈入爆发期,开启AI新纪元(附下载)
技术:大模型发展呈现“规模定律”,Transformer为技术基座1.1 大模型“大力出奇迹”的背后:Scaling Law大规模语言模型(Large Language Models,LLM)泛指具有超大规模参数或者经过超大规模数据训练所得到的语言模型。与传统语言模...……更多
大模型观察|从训练到落地金融业,大模型“升级之路”面临哪些挑战?
迎着技术风口,2024年将是AI大模型应用的浪潮年。业界认为,大模型将对金融业产生长远的、深刻的影响。1月28日,针对大模型在各业务场景的应用成效、对大模型算力的开发和提升,多机构向北京商报记者透露了自研大模型...……更多
权威AI开源标准1.0版发布:Llama也不算开源
大模型开源的口号,不是随便说说的。该来的终于来了。本周,人工智能领域迎来了对于「开源」的官方定义。开放源代码促进会(Open Source Initiative,OSI)发布了「开源 AI 定义」的 1.0 正式版。此举旨在澄清 Open Source 这一术语...……更多
苹果300亿参数大模型首亮相,还买了家AI公司|焦点分析
...武静静编辑|邓咏仪放弃造车后的苹果,正在加速入局大模型战争。当地时间3月15日,苹果就披露了两个关键大模型动作。其中一个值得关注的是苹果的收购事件。彭博社报道称,苹果已经收购了一家加拿大AI初创公司DarwinAI。...……更多
国产模型指令跟随全球第一!来自LeCun亲推的最难作弊LLM新榜单
What???一直低调行事的国内初创公司,旗下模型悄悄地跃升成国内第一、世界第五(仅排在o1系列和Claude 3.5之后)!而且是前十名中的唯一一家国产公司。(该榜上国产第二名是阿里开源的qwen2.5-72b-instruct,总榜第13)。而且...……更多
自主研制!我国发布“全球首个”
...技术大会在山东济南开幕:全球首个百亿级遥感解译基础模型“空天·灵眸”3.0版正式发布;“北斗精准导航与高分遥感综合服务平台”正式发布。全球首个百亿级遥感解译基础模型发布中国科学院空天信息创新研究院科研团队...……更多
首个多模态连续学习综述,港中文、清华、UIC联合发布
...态连续学习的最新进展连续学习(CL)旨在增强机器学习模型的能力,使其能够不断从新数据中学习,而无需进行所有旧数据的重新训练。连续学习的主要挑战是灾难性遗忘:当任务按顺序训练时,新的任务训练会严重干扰之前...……更多
人均年薪100万,手机厂商数百亿开卷大模型
端侧大模型正在成为手机行业创新的新增量。文|《中国企业家》记者 赵东山编辑|李薇头图来源|视觉中国人均年薪100万,什么样的行业具备如此优渥的待遇?答案是AI大模型。这是vivo副总裁周围接受《中国企业家》等媒体...……更多
Token化一切,甚至网络!北大&谷歌&马普所提出TokenFormer
...者是汪海洋,北京大学20级博士生,目前主要关注是通用模型的架构设计和学习算法。指导教授主要包括王立威,北京大学智能学院教授;Bernt Schiele,德国马普计算所教授;Federico Tombari 谷歌人工智能科学家等。新一代通用灵活...……更多
观察|手机厂商“卷”大模型,人工智能会是下一个竞争赛道吗
手机厂商也加入了“大模型”赛道。11月1日,vivo在开发者大会上正式发布了自研通用大模型矩阵——蓝心大模型BlueLM,以及智能辅助应用“蓝心小V”和以公版App形式推出的自然语言对话机器人“蓝心千询”。科技公司不能错失...……更多
昆仑万维发布开源13B高质量商用大模型 领先Llama2和Baichuan2
10月30日,昆仑万维宣布开源百亿级大语言模型「天工」Skywork-13B系列,并配套开源了600GB、150B Tokens的超大高质量开源中文数据集。昆仑万维「天工」Skywork-13B系列目前包括130亿参数的两大模型:Skywork-13B-Base模型、Skywork-13B-Mat……更多
零一万物大模型Yi-34B夺得全球开源评测“双料冠军”,已在阿里云魔搭开源
...带队创办的AI2.0公司零一万物正式开源发布首款预训练大模型Yi-34B,模型开放商用申请,已在阿里云魔搭社区ModelScope首发。魔搭第一时间推出了模型部署相关教程,供开发者参考并快速上手。零一万物此次开源的Yi系列模型包含3...……更多
第一个100%开源的MoE大模型,7B的参数,1B的推理成本
... checkpoint、训练日志和训练数据都已经开源。尽管大语言模型 (LM) 在各种任务上取得了重大进展,但在训练和推理方面,性能和成本之间仍然需要权衡。对于许多学者和开发人员来说,高性能的 LM 是无法访问的,因为它们的构建...……更多
所谓AI革命,到现在为止,是能源的一场“灾难”
6月底,谷歌新一代开源模型Gemma2发布,相比今年早些时候推出的轻量级开源模型Gemma,Gemma2有了90亿(9B)和270亿(27B)两种参数规模可用。就在谷歌摩拳擦掌准备与OpenAI一较高下时,前几天其发布的一份报告却引来了媒体的“...……更多
大模型重构生命科学!最大基础模型面世,解锁DNA超长序列
生命科学领域,已经率先进入到基础模型时代!今年,化学诺贝尔奖授予了AlphaFold,AI+Science受到空前的关注。人们惊叹于,仅仅是一个蛋白质结构预测模型,就能释放出如此巨大的行业潜力。就在当下,在第三届中国生物计算...……更多
Yandex推出开源大语言模型训练工具,称可节省高达20%的图形处理器资源
...球科技公司Yandex推出了YaFSDP,这是一种用于训练大型语言模型(LLM)的开源方法。据介绍,YaFSDP是目前在大型语言模型训练中增强图形处理器(GPU)通信并减少内存使用量的公开可用的最有效工具,与FSDP相比,根据架构和参数数量...……更多
AI与人争资源怎么破解
...nAI公司发布的聊天机器人ChatGPT的爆红,各国都加快了AI大模型的训练,需要的算力也急速增加。马斯克最近在公开采访中表示,现在AI对算力的需求差不多每半年就会增加10倍,AI算力的瓶颈是可以预见的:“一年前,短缺的是芯...……更多
更多关于科技的资讯:
安聪慧透露品牌新战略:极氪向上发展、领克拓宽市场
快科技12月23日消息,吉利控股集团总裁、吉利汽车集团董事长、极氪智能科技CEO安聪慧在群访中透露,极氪与领克已于今年11月完成战略整合
2024-12-23 16:03:00
造物数科PCB Layout设计揭秘:多层厚铜PCB起泡原因
多层厚铜PCB在电子产品中扮演着至关重要的角色,尤其是在高电流和高可靠性应用中。然而,制造过程中,厚铜PCB有时会出现起泡现象
2024-12-23 16:03:00
滁州学院成立人工智能学院
本文转自:人民网-安徽频道近日,滁州学院公布校内机构调整设置显示,该校人工智能学院(应急管理学院)正式成立。此前,在11月23日举行的滁州学院高质量特色发展研讨会上
2024-12-23 16:11:00
从加盟到运营,塔斯汀中国汉堡的一站式培训服务
在众多加盟品牌中,塔斯汀中国汉堡以其独特的培训体系脱颖而出。通过7大培训基地和14省份标准培训店的覆盖,塔斯汀为创业者提供全周期服务
2024-12-23 16:12:00
缅甸网费不断上涨,民众负担加重
缅甸国内网络使用费用上涨,因此很多通过上网学习和工作的人遇到困难。一名需要通过网上学习的女性称,以前每月购买的无限流量是15000缅币30G
2024-12-23 16:12:00
本文转自:人民网-黑龙江频道人民网哈尔滨12月23日电 (尚城)12月23日,2025年第九届亚冬会执委会召开哈尔滨2025年第九届亚洲冬季运动会第二场筹办工作新闻发布会
2024-12-23 16:13:00
本文转自:人民网-安徽频道天线转台,是用于支撑和调整雷达天线或反射面的位置和方向的大型传动构件。它主要由转盘,电机、减速器
2024-12-23 16:20:00
连续7年销量领先,百草味2025年货礼盒全新升级
春节申遗成功,进一步增强了大众对春节文化的认同感和自信感,也让无数人对春节满怀憧憬与期待。据艾媒咨询发布的《2024年中国新春礼盒消费者行为洞察报告》显示
2024-12-23 16:20:00
吾尚乳酸菌新工厂投产 引领中国乳酸菌饮品行业新风尚
消费日报网讯(记者 马佳丽)12月19日至21日,第二届中国乳酸菌饮品向上盛典暨吾尚新工厂正式投产仪式在杭州隆重举行。此次盛会汇聚了来自全国各地的数百名吾尚优秀经销商代表与行业大咖
2024-12-23 16:21:00
中国移动提出首个系统性6G网络架构
本文转自:人民雄安网人民网雄安12月23日电 (记者李雪晴)2024开源无线生态峰会日前在雄安新区举办,中国移动集团研究院技术专家王楚天在会上提到
2024-12-23 16:26:00
“客服来电”怀疑有诈?抖音上线“验证助手”帮助用户防范诈骗
23日,抖音为进一步保障用户安全,推出一款名为“验证助手”的小工具,旨在帮助用户精准识别和验证来电号码、短信内容以及网址链接是否来自抖音官方
2024-12-23 16:32:00
“三眼灯”遭调侃:蔚来萤火虫有争议是好事
过去两天,蔚来再次成为话题制造机。NIO Day 2024现场,蔚来发了两款新车,其一是价格78.8万的ET9,这款车是蔚来造车十年的旗舰产品
2024-12-23 16:33:00
微信新功能+1!视频号评论区可以斗图了:动图、静图都能发
快科技12月23日消息,今日,“微信派”公众号宣布,微信新功能——视频号评论区斗图上线,在评论区可以发表情包了。据了解
2024-12-23 16:33:00
王腾宣布REDMI Turbo 4全球首发天玑8400-Ultra:1月见
快科技12月23日消息,今天下午,天玑8400正式亮相。REDMI总经理王腾登台并宣布,REDMI Turbo 4全球首发天玑8400-Ultra移动平台
2024-12-23 16:33:00
潜水员在水下被海鳗咬伤:他流的血竟变成了绿色
蒂姆 · 鲍威尔(Tim Powell)是一位潜水爱好者,在 2010 年的时候,他上传了一个视频,在约 20 米的海洋里
2024-12-23 16:33:00