• 我的订阅
  • 头条热搜
全面开源 浪潮信息发布千亿参数基础大模型“源2.0”
...浪潮电子信息产业股份有限公司在京发布“源2.0”基础大模型,并宣布全面开源。“源2.0”包括102B(1026亿)、51B(518亿)、2B(21亿)三种参数规模的模型,在编程、推理、逻辑等方面展示出了先进的能力。基础大模型的关键能...……更多
英伟达发布80亿参数的ai模型
...伟达(NVIDIA)宣布,其已成功研发并发布了一款全新的AI模型,该模型拥有高达80亿的参数规模,具备精度高、计算效率高等优点,可在GPU加速的数据中心、云和工作站上运行。据介绍,这款新发布的AI模型是基于英伟达在深度学...……更多
GenAI如何颠覆大学?哈佛90%学生用LLM,教授追捧引发AI学术浪潮
【新智元导读】哈佛大学的一项最新研究表明,大语言模型已经深入学生的日常生活。为何学生们对AI的兴趣如此浓厚,背后的原因恐怕是这所大学的教授们。ChatGPT等生成式人工智能技术正在彻底改变世界,教育也不例外。由...……更多
中国最大开源MoE模型,255B参数无条件免费商用,元象发布
元象XVERSE发布中国最大MoE开源模型:XVERSE-MoE-A36B,该模型总参数255B,激活参数36B,达到100B模型性能的「跨级」跃升。同时训练时间减少30%,推理性能提升100%,使每token成本大幅下降。在多个权威评测中,元象MoE效果大幅超越多...……更多
微调大模型,AMD MI300X就够了!跟着这篇博客微调Llama 3.1 405B
随着 AI 模型的参数量越来越大,对算力的需求也水涨船高。比如最近,Llama-3.1 登上了最强开源大模型的宝座,但超大杯 405B 版本的内存就高达 900 多 GB,这对算力构成了更加苛刻的挑战。如何降低算力的使用成本和使用门槛,...……更多
人均年薪100万,手机厂商数百亿开卷大模型
端侧大模型正在成为手机行业创新的新增量。文|《中国企业家》记者 赵东山编辑|李薇头图来源|视觉中国人均年薪100万,什么样的行业具备如此优渥的待遇?答案是AI大模型。这是vivo副总裁周围接受《中国企业家》等媒体...……更多
不同量级参数模型性能同样优秀 夸克大模型再登行业评测榜首
【CNMO新闻】“大模型时代,夸克有巨大机会创造出革新性搜索产品。”11月22日,夸克大模型公布了其面向搜索、生产力工具和资产管理助手的大模型技术布局。数据显示,夸克千亿级参数大模型登顶C-Eval和CMMLU两大权威榜单,...……更多
amd推出10亿参数语言模型系列amdolmo
...10月31日发布博文,宣布推出首个完全开放的10亿参数语言模型系列AMDOLMo,为开发者和研究人员提供强大的AI研究工具。AMDOLMo模型使用从零开始训练的10亿参数语言模型系列(LMs),在AMDInstinct™MI250GPU集群上训练,使用了超过1.3...……更多
chatgpt低成本复现流程开源
首个开源的ChatGPT低成本复现流程来了!预训练、奖励模型训练、强化学习训练,一次性打通。最小demo训练流程仅需1.62GB显存,随便一张消费级显卡都能满足了。单卡模型容量最多提升10.3倍。相比原生PyTorch,单机训练速度最高...……更多
huggingface公布“smollm”小语言模型家族
7月20日消息,如今小语言模型开始升温,许多厂商开始推出适用于手机等轻量级设备的“小模型”,本周HuggingFace便公布了“SmolLM”小语言模型家族,其中包含1.35亿、3.6亿及17亿参数模型。据介绍,这些模型号称是以精心策划的...……更多
阿里巴巴即将开源目前国内参数规模最大的大模型 【阿里巴巴即将开源目前国内参数规模最大的大模型】《科创板日报》9日讯,阿里巴巴集团CEO吴泳铭今日在2023年世界互联网大会乌镇峰会上透露,阿里巴巴即将开源720亿参数...……更多
中国电信何忠江发布千亿参数大模型
...科技总经理何忠江正式发布了\"星辰语义\"千亿参数的大模型。据介绍,星辰语义大模型是中国电信自研大模型的升级,由此前的百万参数量级升至千亿,并且各项能力均有显著提升。何忠江表示,星辰语义拥有超12亿风格数据、...……更多
OpenAI CEO宣布转向,“大模型时代”即将结束?
...然在这个月几乎每周都至少有一家科技大公司入局训练大模型,但OpenAI 却突然改变了方向声称,大模型时代已经要结束了。上周末在麻省理工学院,OpenAI 的 CEO 在演讲中警告称:我们已经处在大模型时代的尾声,并表示如今的 A...……更多
全球首个亿级参数量的地震波大模型在蓉正式发布,年底公测
...国地震局地球物理研究所以及清华大学联合开发的谛听大模型发布会”在国家超算成都中心举行。现场,全球首个亿级参数量的专业地震数据处理大模型——“谛听”地震波大模型正式发布,标志着中国在地震监测、预警和前兆...……更多
阿里巴巴智能信息事业群发布千亿级参数夸克大模型 【阿里巴巴智能信息事业群发布千亿级参数夸克大模型】财联社11月14日电,记者今日获悉,阿里巴巴智能信息事业群正式发布全栈自研、千亿级参数夸克大模型,将应用于通...……更多
微软被曝正自研AI大模型:5000亿个参数,与谷歌和OpenAI竞争
...巨头微软或正在研发参数达5000亿的全新AI(人工智能)大模型,将正面叫板谷歌和OpenAI。当地时间5月6日,据外媒报道,微软正在研发一款名为MAI-1的最新AI大模型,其规模远超出微软此前推出的一些开源模型,在性能上或能与谷...……更多
Intel三条线优化阿里云通义千问2模型:720亿参数轻松拿捏
?Intel三条线优化阿里云通义千问2模型:720亿参数轻松拿捏快科技6月7日消息,Intel官方宣布,旗下数据中心、客户端、边缘AI解决方案均已经为阿里云通义千问2(Qwen2)的全球发布提供支持,已取得ModelScope、阿里云PAI、OpenVINO等...……更多
微软开源爆火1bit大模型推理框架!千亿参数模型量化后单CPU可跑
微软开源1bit大模型推理框架!现在1000亿参数大模型量化后单CPU可跑,速度可达每秒5-7个token。就是今年爆火论文The Era of 1-bit LLMs的官方代码实现,开源不到一周GitHub已揽获7.9k Star。传统大模型参数以16位浮点数(如FP16或BF16)形...……更多
...:人民日报客户端曹玲娟国内首个千亿参数多模态金融大模型——“财跃F1金融大模型”3月23日在2024全球开发者先锋大会(GDC)上首发。该大模型由财跃星辰自研推出,上海报业集团旗下界面财联社与通用大模型公司阶跃星辰共...……更多
AI大模型行业报告:大模型发展迈入爆发期,开启AI新纪元(附下载)
技术:大模型发展呈现“规模定律”,Transformer为技术基座1.1 大模型“大力出奇迹”的背后:Scaling Law大规模语言模型(Large Language Models,LLM)泛指具有超大规模参数或者经过超大规模数据训练所得到的语言模型。与传统语言模...……更多
...人 、新加坡国立大学校长青年教授尤洋发表了题为《大模型训练的关键技术》的主题演讲。尤洋指出,庞大的AI模型规模对模型训练提出了挑战,现有的硬件设备已无法满足训练所需的大量计算资源和储存空间需求。为解决上述...……更多
...绩报告,财报指出:“腾讯混元已经发展成为领先的基础模型,在数学推导、逻辑推理以及多轮对话中性能卓越。”并首度披露腾讯混元采用混合专家模型结构,已扩展为万亿参数规模。自亮相以来,腾讯混元大模型持续迭代升...……更多
chatgpt低成本复现流程来了
首个开源的ChatGPT低成本复现流程来了!预训练、奖励模型训练、强化学习训练,一次性打通。最小demo训练流程仅需 1.62GB 显存,随便一张消费级显卡都能满足了。单卡模型容量最多提升 10.3倍。相比原生PyTorch,单机训练速度最...……更多
我国发布首个亿级参数量地震波大模型:名为“谛听”
...,据成都科技局官方公众号介绍,日前“谛听”地震波大模型在四川成都发布。“谛听”由国家超级计算成都中心、中国地震局地球物理研究所以及清华大学联合开发,是首个亿级参数量的地震波大模型。同时,“谛听”也是目...……更多
腾讯发布最大开源MoE模型,3890亿参数免费可商用
...家本领,来挤开源赛道,突然发布了市面上最大的开源MoE模型。Hunyuan-Large,3890亿总参数,520亿激活参数。跑分超过Llama 3.1 405B等开源旗舰,上下文长度支持也高出一档来到256k。虽然Hunyuan-Large还不算腾讯内部的旗舰模型,但腾讯...……更多
360智脑7b参数模型采用3.4万亿tokens训练
...12日消息,360公司日前在GitHub上开源了360智脑7B(70亿参数模型)。360智脑大模型采用3.4万亿Tokens的语料库训练,以中文、英文、代码为主,开放4K、32K、360K三种不同文本长度。360表示,360K(约50万字)是当前国产开源模型文本长...……更多
马斯克官宣Grok-2测试版!xAI将继续拥抱开源路线吗?
继旗下xAI公司宣布正式开源大模型Grok-1后,特斯拉CEO马斯克再次在大模型市场扔下一颗重磅炸弹。当地时间8月11日晚,马斯克在X平台上透露人工智能模型Grok-2测试版将在不久后发布。事实上,马斯克在7月份就在X平台上确认,Gr...……更多
马斯克承诺开源版大模型 来了!Grok-1:3140亿参数迄今最大,权重架构全开放
...之心开源社区有福了。说到做到,马斯克承诺的开源版大模型 Grok 终于来了!今天凌晨,马斯克旗下大模型公司 xAI 宣布正式开源 3140 亿参数的混合专家(MoE)模型‘Grok-1’,以及该模型的权重和网络架构。这也使得Grok-1成为当...……更多
...:德宏团结报性能提升30%!中国电信进一步开源12B星辰大模型本报讯 近日,中国电信开源12B参数规模星辰语义大模型TeleChat-12B,相较1月开源7B版本,内容、性能和应用等方面整体效果提升30%,其中,多轮推理、安全问题等领域...……更多
AI大模型“国标”首批测试结果公布,人工智能成市场新焦点
12月22日,国内首个官方“大模型标准符合性评测”结果公布,百度文心一言、腾讯混元大模型、360智脑、阿里云通义千问四款国产大模型首批通过测试。测试结果称,上述四款模型符合《人工智能大规模预训练模型第2部分:评...……更多
更多关于科技的资讯:
“5G+工业互联网”孕育新发展
本文转自:人民日报海外版叶 子 宋佳航《人民日报海外版》(2024年11月29日第 08 版)在安徽省滁州市南谯区500千伏变电站
2024-11-29 04:23:00
vivo S20系列手机亮相
本文转自:人民日报《 人民日报 》( 2024年11月29日 第 12 版)在全球化日益深入的今天,中国品牌更需在传承弘扬中华优秀传统文化中凝聚发展动力
2024-11-29 06:18:00
国网安徽电力  深化量子技术应用  推进新型电力系统建设
本文转自:人民日报《 人民日报 》( 2024年11月29日 第 11 版)11月29日,2024量子科技和产业大会在安徽省合肥市召开
2024-11-29 06:18:00
南方电网互联网服务有限公司:激活数据要素潜能  赋能新质生产力发展  打造全链路数字化的能源产业互联网平台
本文转自:人民日报《 人民日报 》( 2024年11月29日 第 16 版)南方电网互联网服务有限公司(简称“南网互联网公司”)积极响应国家号召
2024-11-29 06:24:00
在“一瞬间”感受科技突破(看台人语)
本文转自:人民日报《 人民日报 》( 2024年11月29日 第 20 版)纪录片《科学的七个瞬间》海报提到科学家,人们往往联想起漫长的科研过程
2024-11-29 06:25:00
胖东来回应1件羽绒服利润仅3毛:促销让利商品
11月29日消息,据媒体报道,网友发现胖东来每件羽绒服都标有进货价,甚至一件鹅绒羽绒服进货价对比售价显示利润仅3毛。胖东来回应称
2024-11-29 07:03:00
电动汽车的“移动充电宝”、手术后的无创“缝合卫士”、全自动猪场废水处理系统……你能想象吗,这些充满创意的“黑科技”,都来自在校大学生
2024-11-29 07:15:00
昨日,在杭州平台经济发展20年巡礼活动上,一组数据见证了杭州20年间平台经济从“无”到“有”、从“0”到“N”的全过程
2024-11-29 07:15:00
20个跨境电商平台到场,100家跨境电商优质服务商和500家全国产业带源头工厂参展,60位跨境大咖现场分享,数万名跨境电商从业者观展
2024-11-29 07:15:00
打破垄断!我国推动电信、互联网等领域有序扩大开放
快科技11月29日消息,据国内媒体报道称,我国将大力发展数字技术贸易。加强关键核心技术创新,加快发展通信、物联网、云计算
2024-11-29 07:33:00
小米总裁卢伟冰:「人车家全生态」加速全球化,五年内将在海外开1万家小米之家
11月28日,小米集团合伙人、总裁卢伟冰在36氪主办的“WSIE商业之王”大会上做了题为《「人车家全生态」如何走向全球》的分享
2024-11-28 23:58:00
近年来,大丰农商银行围绕省联社金融科技发展规划,紧扣数字化转型步伐,践行社会责任,发挥金融科技支撑,探索利用“大中台+小前台”的架构模式来提升数据服务效率和客户体验
2024-11-28 22:54:00
《王者荣耀》S38赛季重磅更新:一次可加三颗星 被演不掉星
快科技11月28日消息,《王者荣耀》S38新赛季体验优化现已上线体验服。官方带来了一图速览,有三大重磅优化:1、守护对局——新增局内实时监测和处罚
2024-11-28 23:03:00
超期服役20年 日本核燃料公司数百台设备从未全面拆解检修
当地时间11月28日,日本核燃料公司的社长增田尚宏在记者会上透露了一个惊人的消息。该公司位于青森县六所村的铀浓缩工厂自建成30多年来
2024-11-28 23:33:00
科技引领未来,圆桌对话探讨智媒与文化新业态的融合之道
齐鲁晚报·齐鲁壹点 管悦 史安琪 郭辰昊 王媛 王鑫11月28日下午,“深改在山东——高质量发展调研行”暨“智驱未来 拥抱变革”齐鲁壹点十周年战略发布活动举行
2024-11-29 00:03:00