• 我的订阅
  • 科技

微软打造 13 亿参数小型 LLM AI 模型

类别:科技 发布时间:2023-06-27 22:27:00 来源:浅语科技

AI模型盲堆体积实际上效果并不见得更好,更多要看训练数据的质量,微软日前最近发布了一款13亿参数的语言模型phi-1,采用“教科书等级”的高品质资料集训练而成,据称“实际效果胜于千亿参数的GPT3.5”。

微软打造 13 亿参数小型 LLM AI 模型

▲图源Arxiv

注意到,该模型以Transformer架构为基础,微软团队使用了包括来自网络的“教科书等级”数据和以GPT-3.5经过处理的“逻辑严密的内容”,以及8个英伟达A100GPU,在短短4天内完成训练。

微软打造 13 亿参数小型 LLM AI 模型

▲图源Arxiv

微软团队表示,比起增加模型的参数量,通过提高模型的训练数据集质量,也许更能强化模型的准确率和效率,于是,他们利用高质量数据训练出了phi-1模型。在测试中,phi-1的分数达到50.6%,比起1750亿参数的GPT-3.5(47%)还要好。

微软打造 13 亿参数小型 LLM AI 模型

▲图源Arxiv

微软表示,phi-1接下来会在HuggingFace中开源,而这不是微软第一次开发小型LLM,此前,他们打造一款130亿参数的Orca,使用了GPT-4合成的数据训练而成,表现也同样比ChatGPT更好。

目前关于phi-1的论文已经在arXiv中发布,可以在这里找到论文的相关内容。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-06-28 06:45:31

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

微软被曝正自研AI大模型:5000亿个参数,与谷歌和OpenAI竞争
科技巨头微软或正在研发参数达5000亿的全新AI(人工智能)大模型,将正面叫板谷歌和OpenAI。当地时间5月6日,据外媒报道,微软正在研发一款名为MAI-1的最新AI大模型,其
2024-05-07 14:33:00
微软连发3款Phi-3.5模型:128K上下文,首用MoE架构,部分性能超GPT-4o mini
智东西8月21日消息,今天,微软一口气甩出3款超强轻量级模型!微软本次发布的轻量级模型系列名为Phi-3.5,适合在内存和算力受限的环境中运行
2024-08-22 09:49:00
微软论文一张截图,曝出GPT-3.5仅有200亿参数?AI圈巨震,网友大呼太离谱!
新智元报道编辑:编辑部【新智元导读】微软最近一篇论文爆料,GPT-3.5的参数量只有20B,远远小于之前GPT-3公布175B
2023-11-04 14:46:00
钮祜禄·Meta:发布最强开源新模型Llama 2,拉拢微软做盟友 | 最前线
...究用途,如今的Llama 2会催生新一波的AI大模型创业热潮。微软表示,Llama 2已经针对 Windows进行优化
2023-07-19 18:04:00
微软发布旗下最小语言模型phi-2
11月17日消息,微软Ignite2023大会已拉开帷幕,微软在本次活动中发布了旗下最小的语言模型Phi-2,共有27亿参数
2023-11-17 14:00:00
微软、英伟达纷纷押注小模型,大模型不香了?
...着过去“越大越好”的观念。视觉中国当地时间8月21日,微软和英伟达相继发布了最新的小型语言模型——Phi-3.5-mini-instruct和 Mistral- NeMo- Minitron8B
2024-08-26 14:17:00
微软推出14b参数“最先进”小型语言模型
12月13日消息,微软今天宣布推出14B参数“最先进”小型语言模型(SLM)Phi-4,除了传统的语言处理外,它还擅长数学等领域的复杂推理
2024-12-14 00:08:00
专家模型不要专家并行!微软开源MoE新路径
【新智元导读】近日,来自微软的研究人员开源了使用全新方法训练的MoE大模型,不走寻常路,且编码和数学表现出色。继Phi家族之后
2024-11-12 09:57:00
微软开源爆火1bit大模型推理框架!千亿参数模型量化后单CPU可跑
微软开源1bit大模型推理框架!现在1000亿参数大模型量化后单CPU可跑,速度可达每秒5-7个token。就是今年爆火论文The Era of 1-bit LLMs的官方代码实现
2024-10-23 12:05:00
更多关于科技的资讯:
昨日,A股继续发动攻势,其中上证指数盘中突破2025年11月中旬4034点的阶段性高点,收在全天最高点4083.67点
2026-01-07 08:06:00
中新经纬1月6日电 6日晚,小米公司发言人官方微博公布了团队与相关KOL接触一事的处罚结果。全文如下:昨天关于团队与相关KOL接触一事
2026-01-07 08:08:00
杭州日报讯 创新往往来自年轻人。“我要特别致敬青年人,青年人始终站在时代前列,他们代表着社会前进的方向。”1月3日,杭州浙江大学校友会会长
2026-01-07 07:05:00
■程璐摘要:在高中英语学习中,词汇掌握质量直接影响阅读理解与表达能力。传统词汇教学多停留在机械记忆层面,学生难以形成稳定且可迁移的词汇表征
2026-01-07 04:52:00
江西如何跑稳“谷子经济”千亿赛道(图)
“‘谷子’不仅是Goods的谐音,对于我们来说,也是一种精神食粮。”刚从二手集市收摊的高中生小甜(化名)对“吃谷”这件事有着自己的理解
2026-01-07 04:52:00
喜旺春节礼盒上市!把年味与福气,一键打包带回家
辞暮尔尔,烟火年年。当街头的红灯笼渐渐挂起,当归家的车票开始抢订,藏在心底的年味也愈发浓烈。年,是团圆的相聚,是味蕾的盛宴
2026-01-07 05:00:00
烟台高新区:中关村烟台协同创新中心举办航空航天专场—烟台优质企业北京场景应用对接会
胶东在线1月5日讯(通讯员 郭健 实习编辑 单煜媛)近日,中关村·烟台协同创新中心联合烟台绿丞先进材料创新服务中心在北京举办烟台优质企业场景应用(航空航天专场)对接会
2026-01-07 05:00:00
河北新闻网讯(赵静静、陈立君)日前,开滦集团铁拓公司(简称“开滦铁拓公司”)自主研制出一台液压支架连杆焊接机器人,并在支护设备厂生产车间正式投入应用
2026-01-06 21:24:00
中新经纬1月6日电 据极目新闻报道,1月5日下午,三星电子会长李在镕现身北京京东MALL双井店购物。此前,李在镕出席了由中国贸促会
2026-01-06 21:31:00
江南时报讯 近日,第五届江苏资本市场峰会在南京召开。本次峰会围绕“聚合资本力量,助力产业创新”主题展开,通过多维度量化评价
2026-01-06 22:12:00
河北新闻网讯(闫丽颖、唐福刚)1月2日,在开滦股份范各庄矿井下600多米深处的三水平中央变电所,一位特殊的“新员工”——轨道式智能巡检机器人正式上岗
2026-01-06 21:35:00
1月6日,记者从盒马鲜生总部获悉,山西首店开业筹备已进入最后冲刺阶段。自7日起,线上配送服务陆续开启,这意味着以“盒区房生活”为代表的新零售方式正式步入太原人的生活日常
2026-01-06 20:06:00
2026成长新启示:张德芬《遇见未知的自己》解锁“爱你老己”,让自我陪伴成为终身底气
“亲爱的,外面没有别人,只有你自己。”张德芬在《遇见未知的自己》中写下的这句经典箴言,于2026年岁末年初再度引爆社交平台
2026-01-06 17:17:00
中国消费者报海口讯(记者董芳忠)近日,在海南省海口市举办的全国信标委人工智能分委会“标准周”活动期间,国内首张大模型高阶通用能力国家标准符合性测试证书正式颁发
2026-01-06 18:25:00
更名、AI巨头探访、股价大幅上涨,喜临门开门红!
近期,喜临门宣布更名“睡眠科技”,在资本市场与全球舆论场同步引发回响。国内市场方面,其股价稳步上扬并获资金持续买入,新年开盘第一个交易日打开涨停
2026-01-06 19:42:00