• 我的订阅
  • 头条热搜
微调大模型,AMD MI300X就够了!跟着这篇博客微调Llama 3.1 405B
随着 AI 模型的参数量越来越大,对算力的需求也水涨船高。比如最近,Llama-3.1 登上了最强开源大模型的宝座,但超大杯 405B 版本的内存就高达 900 多 GB,这对算力构成了更加苛刻的挑战。如何降低算力的使用成本和使用门槛,...……更多
中国石油发布700亿参数昆仑大模型建设成果
...月28日,以“AI领航·智绘能源”为主题的700亿参数昆仑大模型建设成果发布会在京举办,标志着中国石油在人工智能领域又迈出坚实一步。发布会上,中国石油介绍了与中国移动、华为、科大讯飞联手打造的700亿参数昆仑大模型...……更多
...晓莉)日前,中国移动助力中国石油的3000亿参数昆仑大模型建设成果发布。中国移动总经理何飚表示,中国移动作为中国石油昆仑大模型项目的总集成方,组建了14个专项工作组,全力保障项目高质量交付。在算力供给上,建成...……更多
人均年薪100万,手机厂商数百亿开卷大模型
端侧大模型正在成为手机行业创新的新增量。文|《中国企业家》记者 赵东山编辑|李薇头图来源|视觉中国人均年薪100万,什么样的行业具备如此优渥的待遇?答案是AI大模型。这是vivo副总裁周围接受《中国企业家》等媒体...……更多
不同量级参数模型性能同样优秀 夸克大模型再登行业评测榜首
【CNMO新闻】“大模型时代,夸克有巨大机会创造出革新性搜索产品。”11月22日,夸克大模型公布了其面向搜索、生产力工具和资产管理助手的大模型技术布局。数据显示,夸克千亿级参数大模型登顶C-Eval和CMMLU两大权威榜单,...……更多
amd推出10亿参数语言模型系列amdolmo
...10月31日发布博文,宣布推出首个完全开放的10亿参数语言模型系列AMDOLMo,为开发者和研究人员提供强大的AI研究工具。AMDOLMo模型使用从零开始训练的10亿参数语言模型系列(LMs),在AMDInstinct™MI250GPU集群上训练,使用了超过1.3...……更多
金融大模型应用需量力而行
随着人工智能技术的飞速发展,大模型已经成为全球关注的焦点。尤其在金融领域,大模型的发展呈现迅猛增长趋势,短短两年时间,从百亿级别参数已经成长到了千亿级别参数,引发人们的高度关注。金融业因其具有大规模...……更多
chatgpt低成本复现流程开源
首个开源的ChatGPT低成本复现流程来了!预训练、奖励模型训练、强化学习训练,一次性打通。最小demo训练流程仅需1.62GB显存,随便一张消费级显卡都能满足了。单卡模型容量最多提升10.3倍。相比原生PyTorch,单机训练速度最高...……更多
7月11日,百川智能发布了其最新的大模型Baichuan-13B,这是一款拥有130亿参数的开源可商用大规模语言模型。据官方介绍,Baichuan-13B在中英文基准测试中取得了同尺寸模型中最好的效果。此次发布的模型包含预训练(Baichuan-13B-Base...……更多
ai公司mosaicml推出300亿参数模型
6月25日消息,AI创业公司MosaicML近日发布了其语言模型MPT-30B,该模型具有300亿参数,训练成本“仅有其他同类竞品模型的零头”,有望促进行业逐步降低此类模型训练成本,扩大AI模型在更广泛领域的运用。▲图源MosaicMLMosaicML公...……更多
英伟达发布新AI芯片,马斯克小扎“笼中格斗”或在意大利上演
...表示,“你几乎可以在GH200上运行任何你想要的大型语言模型,它会疯狂地进行推理。大型语言模型的推理成本将大幅下降。”新的芯片将于明年第二季度起供货,并在今年年底前提供样品。目前这款芯片的价格仍未公布。点评...……更多
美国科技大佬齐聚国会闭门商讨AI,「对文明的未来非常重要」
...Meta首席执行官马克·扎克伯格谈到了封闭与开源人工智能模型。他称Meta的开源人工智能是确保广泛使用该技术的一种方式,不过Meta“对此并不狂热”。“我们并不开源一切。我们认为封闭的模式也很好,但我们也认为更开放的...……更多
阿里巴巴即将开源目前国内参数规模最大的大模型 【阿里巴巴即将开源目前国内参数规模最大的大模型】《科创板日报》9日讯,阿里巴巴集团CEO吴泳铭今日在2023年世界互联网大会乌镇峰会上透露,阿里巴巴即将开源720亿参数...……更多
GenAI如何颠覆大学?哈佛90%学生用LLM,教授追捧引发AI学术浪潮
【新智元导读】哈佛大学的一项最新研究表明,大语言模型已经深入学生的日常生活。为何学生们对AI的兴趣如此浓厚,背后的原因恐怕是这所大学的教授们。ChatGPT等生成式人工智能技术正在彻底改变世界,教育也不例外。由...……更多
huggingface公布“smollm”小语言模型家族
7月20日消息,如今小语言模型开始升温,许多厂商开始推出适用于手机等轻量级设备的“小模型”,本周HuggingFace便公布了“SmolLM”小语言模型家族,其中包含1.35亿、3.6亿及17亿参数模型。据介绍,这些模型号称是以精心策划的...……更多
中国电信何忠江发布千亿参数大模型
...能科技总经理何忠江正式发布了"星辰语义"千亿参数的大模型。据介绍,星辰语义大模型是中国电信自研大模型的升级,由此前的百万参数量级升至千亿,并且各项能力均有显著提升。何忠江表示,星辰语义拥有超12亿风格数据...……更多
据悉,OpenAI正在开发一款新的开源模型,以对抗微软和Meta合作开发的开源模型Llama2。这款新模型的内部代号为“G3PO”,目前尚未确定发布日期。值得注意的是,Llama2模型拥有700亿个参数,不仅开源,还支持商业许可证,允许任...……更多
扎克伯格筹建海底通信网络 计划“绕地球一圈”
...直接在印度建设数据中心,专门用来训练和处理人工智能模型,而海底电缆可能在这一努力中发挥作用。Tagare指出,印度的计算带宽成本,仅仅只是美国的一小部分,同时近期英伟达CEO黄仁勋访问印度,也引发了市场的高度关注...……更多
阿里云通义千问开源!70亿参数模型上线魔搭社区
【CNMO新闻】8月3日,AI模型社区魔搭ModelScope上架两款开源模型Qwen-7B和Qwen-7B-Chat,阿里云确认其为通义千问70亿参数通用模型和对话模型,两款模型均开源、免费、可商用。在多个权威测评中,通义千问7B模型取得了远超国内外同...……更多
深度学习在AI教育中的应用及其关键技术探究
...标准化和归一化以及特征选择和降维技术。最后,介绍了模型构建和训练的关键步骤,包括深度学习模型的选择和设计、模型初始化和参数调整、批量梯度下降和优化算法以及学习率调整和模型评估。通过这些步骤,可以提高深...……更多
OpenAI CEO宣布转向,“大模型时代”即将结束?
...然在这个月几乎每周都至少有一家科技大公司入局训练大模型,但OpenAI 却突然改变了方向声称,大模型时代已经要结束了。上周末在麻省理工学院,OpenAI 的 CEO 在演讲中警告称:我们已经处在大模型时代的尾声,并表示如今的 A...……更多
阿里云开源通义千问 70 亿参数模型,免费、可商用
据36氪报道,今日阿里云开源通义千问70亿参数模型,包括通用模型Qwen-7B和对话模型Qwen-7B-Chat,两款模型均已上线魔搭社区,开源、免费、可商用。此举让阿里云成为国内首个加入大模型开源行列的大型科技企业。今年4月,阿...……更多
杨仝团队发布FairyR1模型:5%参数量数学和代码能力超越满血DeepSeek
北京大学杨仝教授团队近期发布了其在高效大型语言模型研究方向的一项新成果——FairyR1-32B模型。该模型基于DeepSeek-R1-Distill-Qwen-32B基座,通过结合微调与模型合并技术构建。研究探索了在参数量大幅减少的情况下,模型在特...……更多
阿里巴巴智能信息事业群发布千亿级参数夸克大模型 【阿里巴巴智能信息事业群发布千亿级参数夸克大模型】财联社11月14日电,记者今日获悉,阿里巴巴智能信息事业群正式发布全栈自研、千亿级参数夸克大模型,将应用于通...……更多
全球首个亿级参数量的地震波大模型在蓉正式发布,年底公测
...国地震局地球物理研究所以及清华大学联合开发的谛听大模型发布会”在国家超算成都中心举行。现场,全球首个亿级参数量的专业地震数据处理大模型——“谛听”地震波大模型正式发布,标志着中国在地震监测、预警和前兆...……更多
Intel三条线优化阿里云通义千问2模型:720亿参数轻松拿捏
?Intel三条线优化阿里云通义千问2模型:720亿参数轻松拿捏快科技6月7日消息,Intel官方宣布,旗下数据中心、客户端、边缘AI解决方案均已经为阿里云通义千问2(Qwen2)的全球发布提供支持,已取得ModelScope、阿里云PAI、OpenVINO等...……更多
微软开源爆火1bit大模型推理框架!千亿参数模型量化后单CPU可跑
微软开源1bit大模型推理框架!现在1000亿参数大模型量化后单CPU可跑,速度可达每秒5-7个token。就是今年爆火论文The Era of 1-bit LLMs的官方代码实现,开源不到一周GitHub已揽获7.9k Star。传统大模型参数以16位浮点数(如FP16或BF16)形...……更多
微软被曝正自研AI大模型:5000亿个参数,与谷歌和OpenAI竞争
...巨头微软或正在研发参数达5000亿的全新AI(人工智能)大模型,将正面叫板谷歌和OpenAI。当地时间5月6日,据外媒报道,微软正在研发一款名为MAI-1的最新AI大模型,其规模远超出微软此前推出的一些开源模型,在性能上或能与谷...……更多
...:人民日报客户端曹玲娟国内首个千亿参数多模态金融大模型——“财跃F1金融大模型”3月23日在2024全球开发者先锋大会(GDC)上首发。该大模型由财跃星辰自研推出,上海报业集团旗下界面财联社与通用大模型公司阶跃星辰共...……更多
小米大语言模型MiLM-6B首次现身!同参数量级排名第一
快科技8月11日消息,近日,小米的大语言模型MiLM-6B首次现身C-Eval、CMMLU两大AI模型评测榜单。截至本文成稿,MiLM-6B在C-Eval总榜单排名第10、同参数量级排名第1,在CMMLU中文向大模型排名第1。根据C-Eval给出的信息,MiLM-6B模型在各...……更多
更多关于科技的资讯:
四特天工·拾贰荣膺2025中国酒业金盛奖“最具代理价值产品”
8月8日,由酒业家传媒主办的2025中国酒业金盛奖颁奖盛典在山东国际会展中心隆重举行。在星光璀璨的中国酒业年度盛典上,四特酒倾力打造的高端战略新品“天工·拾贰”
2025-08-19 11:44:00
大众网通讯员 崔智慧 烟台报道近日,芝罘区企业服务中心联合海礴AI增长学社,在政务服务中心举办“AI驱动增长·共启商业未来”主题会议
2025-08-19 08:45:00
中新经纬8月18日电 据微信号“中国消费者协会”消息,针对部分网络平台热销的儿童安全座垫产品在碰撞测试中瞬间解体,难以保障乘车对象安全及少数网售儿童安全座椅类产品的操作演示信息存在常识性错误等问题
2025-08-19 08:07:00
□南京日报/紫金山新闻记者孙秉印 实习生赵璇通讯员麒轩8月18日,在麒麟科创园南京创蓝科技有限公司,一块大屏上展示着南京地图
2025-08-19 07:40:00
8月17日,“网上国网”App发布消息,该平台升级了“用能分析”服务中的“用电预测”功能,旨在帮助用户更精准地掌握用电情况
2025-08-19 07:55:00
□裴桐这段时间,在互联网各大社交平台,各类“主理人”店铺遭到群嘲,“主理人主打不理人”“叫声服务员,能气疯一群主理人”等段子层出不穷
2025-08-18 08:47:00
厦门网讯(厦门日报记者 李晓平)近日,工信部公布符合环保装备制造业规范的企业名单(2025版),三家厦企入选最新“国家队”阵容
2025-08-18 08:50:00
2025世界人形机器人运动会闭幕 世界人形机器人运动联合会宣告成立
大皖新闻讯 8月17日,2025年世界人形机器人运动会在北京圆满闭幕。同时,世界人形机器人运动联合会(简称"WHRGF"或"联合会")正式宣告成立
2025-08-18 09:02:00
23天跑出“炎和速度”:全球首条消费类钙钛矿电池全自动化生产线成功贯通出片
8月16日,炎和科技全球首条消费类钙钛矿电池全自动化生产线在常德正式投产。从7月24日启动产线调通到全线贯通出片仅用时23天
2025-08-18 09:03:00
暑假期间,很多人带着孩子走进商场、汽车4S店,有的家庭准备换家电,有的想换车。推动顾客将商品带回家的重要因素之一,就是消费品以旧换新政策
2025-08-18 09:20:00
“城市骑士”升级后续!阿里和蚂蚁旗下22个品牌共推橙意计划
8月18日,饿了么和淘宝闪购宣布升级“城市骑士”之后仅一天,第一个举措来了!阿里和蚂蚁旗下的22个品牌,共同宣布推出“城市骑士·橙意计划”
2025-08-18 09:42:00
2025 “乐业浔城” 共话创业之路 启迪未来商机 —— 九江 HR 沙龙活动成功举办
为积极响应国家“大众创业、万众创新”号召,赋能九江地区企业高质量发展,搭建人力资源从业者与创业者之间的交流合作平台,2025年 8月 15日
2025-08-18 10:40:00
潍坊寿光:3000亩“蔬菜硅谷”里的智慧革命
大众网记者 刘晓雨 潍坊报道在潍坊寿光市,一座占地3000亩的“蔬菜硅谷”正以科技为笔,书写着现代农业的新范式。这里是部
2025-08-18 10:41:00
旅游直播亟待从价格竞技场转向服务体验馆
皖中客据《工人日报》报道,“下单立减,数量有限”“全年无加价,落地0自费”“一家三口出行,酒店免费升级”……正值暑期旅游旺季
2025-08-18 11:04:00
用“奢侈品思维”重塑高价值人生 耿帆携《女主力》亮相济南贵和
齐鲁晚报·齐鲁壹点 张唯8月16日下午,济南泉城路贵和购物中心二楼书香涌动,一场以“奢侈品思维”为切入点的女性成长主题分享会引发热议
2025-08-18 11:21:00