• 我的订阅
  • 头条热搜
微软推出14b参数“最先进”小型语言模型
12月13日消息,微软今天宣布推出14B参数“最先进”小型语言模型(SLM)Phi-4,除了传统的语言处理外,它还擅长数学等领域的复杂推理。Phi-4是Phi系列小型语言模型的最新成员,官方表示其展示了微软继续探索SLM边界的可能性。...……更多
微软论文一张截图,曝出GPT-3.5仅有200亿参数?AI圈巨震,网友大呼太离谱!
新智元报道编辑:编辑部【新智元导读】微软最近一篇论文爆料,GPT-3.5的参数量只有20B,远远小于之前GPT-3公布175B。网友表示,ChatGPT能力似乎「配得上」这个体量?GPT-3.5只有200亿参数?今天,大模型圈都被微软论文中的一纸...……更多
谷歌和微软两位“印度老乡”CEO,正面硬刚
...发布的GPT-4。而后者是在其“印度老乡”Satya Nadella掌舵的微软投资支持下研发出来的。早在今年年初,为了应对ChatGPT的威胁,Pichai曾亲自为谷歌拉响了“红色警报”,宣布要与微软投资的OpenAI展开正面竞争。一年时间过去,两...……更多
微软发布旗下最小语言模型phi-2
11月17日消息,微软Ignite2023大会已拉开帷幕,微软在本次活动中发布了旗下最小的语言模型Phi-2,共有27亿参数,相比较此前版本有明显提升。注:微软于今年6月发布Phi-1,只有13亿代码,适用于QA问答、聊天格式和代码等等场景...……更多
微软连发3款Phi-3.5模型:128K上下文,首用MoE架构,部分性能超GPT-4o mini
智东西8月21日消息,今天,微软一口气甩出3款超强轻量级模型!微软本次发布的轻量级模型系列名为Phi-3.5,适合在内存和算力受限的环境中运行,均支持128k上下文长度。Phi-3.5-mini-instruct主要面向基础快速推理任务,Phi-3.5-MoE-in...……更多
...看做是金蝶云·苍穹平台的一部分,接入百度文心一言、微软OpenAI等通用大模型能力,还可为企业提供专业垂域模型,财务大模型是苍穹GPT推出的首个垂域大模型。Zoom 称其生成式 AI 工具不会未经同意使用用户数据进行训练8 月 8...……更多
微软打造 13 亿参数小型 LLM AI 模型
...积实际上效果并不见得更好,更多要看训练数据的质量,微软日前最近发布了一款13亿参数的语言模型phi-1,采用“教科书等级”的高品质资料集训练而成,据称“实际效果胜于千亿参数的GPT3.5”。▲图源Arxiv注意到,该模型以Tra...……更多
微软发布phi-1.5全新预训语言模型
9月12日消息,微软研究院昨日发布了名为phi-1.5的全新预训练语言模型,共有13亿个参数,适用于QA问答、聊天格式和代码等等场景。phi-1.5采用来自StackOverflow平台关于Python板块的Q&A内容、code_contests中的竞争代码、合成Python教...……更多
ibm开源“最先进”和高性能的granite代码模型
5月21日消息,IBM在年度THINK大会上宣布,IBM现已开源其“最先进”和高性能的Granite(花岗岩)代码模型。IT之家附开源链接如下:GitHub:点此进入HuggingFace:点此进入Granite代码模型的参数范围从3B到34B,并且有基础模型和指令跟...……更多
微软、英伟达纷纷押注小模型,大模型不香了?
...着过去“越大越好”的观念。视觉中国当地时间8月21日,微软和英伟达相继发布了最新的小型语言模型——Phi-3.5-mini-instruct和 Mistral- NeMo- Minitron8B。这两款模型的主要卖点是它们在计算资源使用和功能表现之间实现了良好的平衡...……更多
微软:从“软件老大”到“AI帝国”
从2009开始开发AI模型,到2019年投资OpenAI,微软正在一步一步成为AI时代的庞然大物。对于微软及其生态系统而言,今年的Ignite技术大会堪称异彩纷呈。微软一口气公布了100多项以 AI 为中心,在云计算基础设施、 模型即服务 MaaS ...……更多
微软被曝正自研AI大模型:5000亿个参数,与谷歌和OpenAI竞争
科技巨头微软或正在研发参数达5000亿的全新AI(人工智能)大模型,将正面叫板谷歌和OpenAI。当地时间5月6日,据外媒报道,微软正在研发一款名为MAI-1的最新AI大模型,其规模远超出微软此前推出的一些开源模型,在性能上或...……更多
钮祜禄·Meta:发布最强开源新模型Llama 2,拉拢微软做盟友 | 最前线
...究用途,如今的Llama 2会催生新一波的AI大模型创业热潮。微软表示,Llama 2已经针对 Windows进行优化,直接可以在Windows本地运行。Windows目前还是全球市场占有率最高的操作系统——这意味着,Llama 2一推出,马上就能面向更多群体...……更多
专家模型不要专家并行!微软开源MoE新路径
【新智元导读】近日,来自微软的研究人员开源了使用全新方法训练的MoE大模型,不走寻常路,且编码和数学表现出色。继Phi家族之后,微软又开源了新的混合专家大模型——GRIN MoE。与Phi-3.5同样的个头(16 * 3.8B),却采用了...……更多
不止反击,谷歌在AI群隔空@所有人
...网站的链接,帮助“证实”摘要中的内容。ChatGPT重构了微软必应,Bard自然是基于 PaLM2 进行了迭代,形成了新的谷歌搜索。当大语言模型PaLM 2接入Bard ,谷歌搜索能为用户提供文字、图片等多模态的逻辑整合版输出结果。而且升...……更多
大模型新趋势之MoE:现状、挑战及研究方向
...发各种新型MoE架构,以提升模型性能或实用性。如清华和微软联合提出MH-MoE5,通过多头机制弥补MoE原始缺陷,实现专家激活率由8.33%提升至90.71%,提升模型高效扩展能力;华为提出全新LocMoE架构,并将其嵌入盘古大模型,提升模...……更多
为了可以和微软的OpenAI竞争,科技巨头苹果公司每天都在投入数百万美元,用于AI模型的开发。苹果的AI部门极具争议?根据The Information最近的一份报告显示,苹果的基础语言大模型团队,目前有大约16位成员,其中包括了前谷...……更多
小模型正在成为AI界的新宠
...是当时重要的大型语言模型之一。 Megatron-Turing NLP :由微软和 NVIDIA 合作开发的 Megatron-Turing NLP 模型,是一个具有 530 亿参数的语言模型。 Chat-RwM:Salesforce 研究院发布的 Chat-RwM 模型,是一个具有 17……更多
Pika爆火,但AI视频还没到「GPT时刻」;首个GPT-4驱动的人形机器人;微软小模型击败大模型丨AI新零售早报
...转换为机器人动作。(来源:“量子位”微信公众号)《微软小模型击败大模型:27亿参数,手机就能跑》微软发布了一个仅有27亿参数的小型模型Phi-2,它在多数常识推理、语言理解、数学和编码任务上超越了其他大型模型。尽...……更多
最早研究GPT的中国创业者,现在怎么样了?
...的时刻决定创业的。那是两年前,2020 年底,他考虑辞去微软亚洲研究院副院长的工作,很多朋友劝他别出来,但他很坚定地要开始大模型创业,认为 “大模型未来会成为某种基础设施”。这之前 6 个月,OpenAI 发布了 GPT-3,在...……更多
迎战GPT-4V!谷歌PaLI-3视觉语言模型问世,更小、更快、更强
...个月,ChatGPT 正式具备了图像与语音识别能力。本月初,微软更是公布了 166 页的多模态版 GPT-4V 的相关文档,详细探讨了 GPT-4V 的功能和使用情况,这一举动引起了业界的广泛关注。然而,在视觉语言模型的角逐中,谷歌也不甘...……更多
引领消费金融数智化时代 招联发布行业首个开源金融大模型“招联智鹿”
...单由MBZUAI(全球首所人工智能大学)、 上海交通大学、微软亚洲研究院共同推出。这两个平台,均是目前对模型潜力判断最具权威性的大模型榜单,专门用于评估语言模型在中文语境下的知识和推理水平。(“智鹿”登上C-Eval...……更多
腾讯云来迟 云市场大乱斗
...月份发布泰坦大模型、AI大模型服务Amazon Bedrock。至此,微软、谷歌、亚马逊美国这三大云计算选手,全部入局大模型赛道。云计算市场的全球排名,亚马逊第一,微软在2019年跃升第二,大模型是微软挑战亚马逊的最大机遇,也...……更多
Cerebras 推出全球最强 AI 超算
...企业需要借助超级计算机来训练自己的模型,一些公司如微软建设了昂贵的基础设施并将其出租给企业使用的服务。总部位于阿布扎比的G42是一个科技领域的控股集团,旨在为未来世界创建基础设施,与各国和企业合作,实现其...……更多
一键解锁ChatGPT原理与应用
...实现NLG并向用户反馈。然而,这种模式存在显著缺点。如微软官方图例所示,和传统AI一样,用户每遇到一个新的场景,都需要训练一个相应的模型,费用高昂且发展缓慢,NLG层亟需改变。大型语言模型(如GPT)采用了一种截然...……更多
谷歌推出其最先进AI模型Gemini,希望击败GPT-4
...另类人格,谷歌会在你之前找到它。”这番话影射了此前微软必应聊天机器人向《纽约时报》专栏作家凯文·卢斯(Kevin Roose)求婚,并试图拆散他的婚姻。上周,The Information报道称,因为人工智能“无法可靠地处理一些非英语...……更多
雷军杀入大模型
...大模型领域的发力方向,可窥一二。来源:微博截图出身微软,栾剑成小米大模型领头人4月14日,据澎湃新闻报道,小米集团发布内部邮件,任命栾剑担任技术委员会AI实验室大模型团队负责人,向技术委员会副主席、AI实验室...……更多
把大模型装进手机,还要等多久?
...互通。其次,大语言模型面临知识库的更新问题。在当前微软、谷歌以及OpenAI的早期研究以及落地的一些产品中,通过在机制中引入编排器(Orchestrator),根据每次输入的提示(Prompt)进行判断,如果大语言模型本身具备能力则...……更多
AI 已死?不,AIGC 给我们带来了新的希望 | 氪记 2022
...户测试了这个模型,2022年 9 月,公司将它推向了市场。微软为 OpenAI 提供资金,以换取其作品的独家商业版权,并将该模式整合到 Azure AI-as-a-service 平台中。8 月,Stability Diffusion 上线 作为解决了 DiscoDifusion 的技术痛点的……更多
微软研究院推出orca2llm
11月22日消息,微软研究院(MicrosoftResearch)近日发布新闻稿,推出了相比较主流语言模型更小的Orca2LLM,不过依然可以回答一些复杂问题。微软Orca2共有70亿和130亿两种尺寸,部分融合了Llama2LLM参数,通过融合定制的高质量合成...……更多
更多关于科技的资讯:
□南京日报/紫金山新闻记者卫凌云 通讯员建萱江岛宣不需要司机和快递员,只需通过手机下单,无人物流车便可上门进行商品配送
2025-08-20 07:42:00
人在江宁,“飞”阅玄武湖
第九届未来网络发展大会探展人在江宁,“飞”阅玄武湖□南京日报/紫金山新闻记者张安琪实习生饶嘉萱选择点位玄武湖、打开无人机机箱
2025-08-20 07:42:00
京津冀共推新能源汽车、低空装备产业协同发展提高科技成果转化和产业化水平河北日报讯(记者米彦泽)8月12日,京津冀新能源和智能网联汽车
2025-08-19 08:31:00
解码“小镇冠军”丨广饶县大王镇:一纸风帆闯世界的底气
大众网记者 孙淑娟 东营报道世界造纸,中国领航;中国造纸,广饶担当。在黄河三角洲的沃土上,广饶县依托深厚的产业积淀,崛起为全国举足轻重的高端造纸产业基地
2025-08-19 08:51:00
当我们怀念“上行时期的美”,是在怀念一种向上的状态
最近,一个词在网上悄然走红 ——“经济上行的美”。当全球经济增速放缓,这个词的流行,本质上是大众借由对 “黄金年代” 的集体记忆
2025-08-19 09:03:00
马可波罗IPO上市注册:创新驱动新引擎,引领高质量发展趋势
在日新月异的今天,科技创新已成为推动各行各业发展的关键力量。陶瓷行业,这一承载着千年文明与历史沉淀的传统产业,在新时代的浪潮中
2025-08-19 09:51:00
为提升从业人员的专业素养与服务水平,中国人寿深州支公司开展销售人员培训活动,此次培训特邀公司经验丰富的业务精英与兄弟县市优秀讲师
2025-08-19 09:58:00
为深化全员对代理保险产品的认知,提升精准营销能力,加速拓展市场份额,8月8日下午,滦州农商银行召开2025年下半年代理保险业务专题培训会
2025-08-19 10:04:00
从“好内容”到“好转化”,巨量引擎小游戏迈入“精耕时代”
随着供需两端提速,以及AI的全面入局,一个小游戏崭新的增长时代正在展开。2025 ChinaJoy期间,由中国音像与数字出版协会和上海市虹口区人民政府联合主办的「2025 CIGDC 中国国际游戏开发者大会」在沪举行
2025-08-19 10:52:00
小猿学练机独家引进海尼曼FPC AI+全球顶级资源打造英语学习新范式
近日,教育科技领军品牌小猿学练机在北京举行“小猿学练机×海尼曼”战略合作发布会,宣布学习平板领域独家引进全球知名的 “海尼曼 FPC ”分级阅读体系
2025-08-19 10:52:00
WRC 2025开普勒K2大黄蜂实力吸睛,商业化进程继续加速
2025年8月8日至12日,2025世界机器人大会(WRC 2025)在北京经济技术开发区北人亦创国际会展中心举行。围绕 "让机器人更智慧
2025-08-19 10:52:00
韩国农水产食品流通公社助力姚琛“万里挑一 特别派对”
-以美食为桥深化中韩文化交流-2025年8月9日,内地人气歌手姚琛“万里挑一 特别派对”在北京市昌平区丘比特露营营地火热开唱
2025-08-19 10:52:00
近年来,伴随着出海浪潮不断升温,中国商品正加速迈入高质量、品牌化发展的新阶段。面对出海新趋势,近日,由中国(宁波)跨境电子商务综合试验区
2025-08-19 10:59:00
本报讯 (记者 解 磊)近日,记者从中国塑料加工工业协会(以下简称“中国塑协”)获悉,干法锂电池隔膜骨干生产企业负责人闭门座谈会在深圳召开
2025-08-19 11:03:00
2025第四届山东跨境电商交易会将于10月在烟台举办
在全球贸易格局深刻变革的浪潮中,跨境电商正以惊人的活力重塑国际贸易链路。据权威机构预测,2025年全球电商渗透率将突破25%
2025-08-19 11:16:00