• 我的订阅
  • 头条热搜
微软论文一张截图,曝出GPT-3.5仅有200亿参数?AI圈巨震,网友大呼太离谱!
新智元报道编辑:编辑部【新智元导读】微软最近一篇论文爆料,GPT-3.5的参数量只有20B,远远小于之前GPT-3公布175B。网友表示,ChatGPT能力似乎「配得上」这个体量?GPT-3.5只有200亿参数?今天,大模型圈都被微软论文中的一纸...……更多
微软开源爆火1bit大模型推理框架!千亿参数模型量化后单CPU可跑
微软开源1bit大模型推理框架!现在1000亿参数大模型量化后单CPU可跑,速度可达每秒5-7个token。就是今年爆火论文The Era of 1-bit LLMs的官方代码实现,开源不到一周GitHub已揽获7.9k Star。传统大模型参数以16位浮点数(如FP16或BF16)形...……更多
马斯克xAI发布首款大模型;苹果发布M3芯片;ChatGPT被曝仅200亿参数|本周硅谷发生了什么?
...3nm工艺加持的“M3芯片”,顺带展示了搭载M3的MacBook Pro。微软的一篇论文则意外曝光ChatGPT实际参数仅有200亿,引起一片哗然。大模型这边,马斯克旗下众星云集的xAI发布了首款大模型“Gork”,与其他模型不同,Grok不仅能通过X...……更多
微软打造 13 亿参数小型 LLM AI 模型
...积实际上效果并不见得更好,更多要看训练数据的质量,微软日前最近发布了一款13亿参数的语言模型phi-1,采用“教科书等级”的高品质资料集训练而成,据称“实际效果胜于千亿参数的GPT3.5”。▲图源Arxiv注意到,该模型以Tra...……更多
OpenAI举办“AI春晚”;李开复大模型破纪录 | 图灵周报
...A股、美股的“超导概念股”都曾受影响,大幅波动。 03微软以安全问题为由限制员工访问ChatGPT图源:Pixabay在当地时间周四的一段时间内,微软员工被禁止使用OpenAI产品ChatGPT。微软在内部网站上的最新消息中表示,“出于安全...……更多
微软推出14b参数“最先进”小型语言模型
12月13日消息,微软今天宣布推出14B参数“最先进”小型语言模型(SLM)Phi-4,除了传统的语言处理外,它还擅长数学等领域的复杂推理。Phi-4是Phi系列小型语言模型的最新成员,官方表示其展示了微软继续探索SLM边界的可能性。...……更多
大模型新趋势之MoE:现状、挑战及研究方向
...发各种新型MoE架构,以提升模型性能或实用性。如清华和微软联合提出MH-MoE5,通过多头机制弥补MoE原始缺陷,实现专家激活率由8.33%提升至90.71%,提升模型高效扩展能力;华为提出全新LocMoE架构,并将其嵌入盘古大模型,提升模...……更多
微软发布旗下最小语言模型phi-2
11月17日消息,微软Ignite2023大会已拉开帷幕,微软在本次活动中发布了旗下最小的语言模型Phi-2,共有27亿参数,相比较此前版本有明显提升。注:微软于今年6月发布Phi-1,只有13亿代码,适用于QA问答、聊天格式和代码等等场景...……更多
挑战Scaling Law,Meta发布移动端350M小模型MobileLLM,性能比肩7B LLaMA-v2
...是唯一的路径,模型「以小搏大」的故事不断上演。先有微软更新;后有谷歌用。硬件方面,我们看到了AI功能逐渐与电子产品进行深度集成。比如微软臭名昭著的Recall功能,正是他们的重要组成部分;苹果也在Apple Intelligence的...……更多
专家模型不要专家并行!微软开源MoE新路径
【新智元导读】近日,来自微软的研究人员开源了使用全新方法训练的MoE大模型,不走寻常路,且编码和数学表现出色。继Phi家族之后,微软又开源了新的混合专家大模型——GRIN MoE。与Phi-3.5同样的个头(16 * 3.8B),却采用了...……更多
被追捧的ChatGPT:可以使用它,但别依赖它
...热门的话题。”能让比尔·盖茨如此看重,一方面是因为微软与OpenAI的合作关系,据悉,OpenAI的机器学习和运算部署在微软Azure云上,另一方面也是因为ChatGPT超强的能力。公开资料显示,ChatGPT是由人工智能研究实验室OpenAI发布的...……更多
据悉,OpenAI正在开发一款新的开源模型,以对抗微软和Meta合作开发的开源模型Llama2。这款新模型的内部代号为“G3PO”,目前尚未确定发布日期。值得注意的是,Llama2模型拥有700亿个参数,不仅开源,还支持商业许可证,允许任...……更多
科学家提出情景学习新范式,让学霸大模型向学弱大模型输送能力
...、低算力需求的模型,并取得了一定成果。2023 年 6 月,微软发布 13 亿参数的语言模型 Phi,同年 9 月 Phi-2 的参数扩大到 27 亿。据报道,微软的“小模型”已经在金融客户和银行客户中测试。此后,国内厂商也逐步跟进小模型的...……更多
日亏500万的OpenAI想搞钱了
...是一款名为Biomes的游戏。Biomes官网显示,该游戏视觉上和微软旗下游戏产品《我的世界》类似。收购一家开源版《我的世界》,OpenAI在AI产品和商业化上都带来了遐想。ChatGPT作为今年上半年最火的AI产品,风头无二。但由于训练C...……更多
马斯克打脸OpenAI!全球最大模型Grok-1开源
...利性开源组织创建的,目的是抗衡谷歌。但此后它变成了微软控制下的一家闭源、以利润为导向的公司。“OpenAI已经成为一家利润最大化的公司……这根本不是他的初衷。”马斯克还谴责OpenAI遭到微软的控制。他表示,世界需要...……更多
本周硅谷发生了什么?|苹果Vision Pro正式开售;Neuralink完成人类脑机接口植入;字节Coze国内版上线;
...人助手苹果发布2024年Q1财报,库克称AI是“巨大的机会”微软、Alphabet等AI相关企业总市值一天蒸发1.3万亿元360 AI搜索移动App已上线Sam Altman弟弟的风投公司募资1.5亿美元,将重点关注AI初创人形机器人初创公司Figure AI与微软、OpenAI...……更多
o1突发内幕曝光?谷歌更早揭示原理 大模型光有软件不存在护城河
...现在英伟达直接掌控谁能拥有更多算力。那么如果谷歌/微软开发出了效果更好的定制芯片,情况又会如何呢?o1突发内幕曝光?谷歌更早揭示原理,大模型光有软件不存在护城河值得一提的是,前段时间OpenAI首颗芯片曝光,将采...……更多
语音克隆达到人类水平,微软全新VALL-E 2模型让DeepFake堪比配音员
【新智元导读】继去年初的第一代VALL-E模型之后,微软最近又上新了VALL-E 2模型,标志着第一个在合成语音稳健性、相似度、自然程度等方面达到人类水平的文本到语音模型。最近,微软发布了零样本的文本到语音(TTS)模型VAL...……更多
小米大模型交成绩单
...然有明显进步空间。CMMLU,则是由MBZUAI、上海交通大学、微软亚洲研究院合作完成的,一个全面的中文大模型基准。它涵盖了67个主题,涉及自然科学、社会科学、工程、人文、以及常识等,可以全面地评估大模型在中文知识储...……更多
苹果300亿参数大模型首亮相,还买了家AI公司|焦点分析
...下来,苹果的重心都在加速大模型进程上,来追赶谷歌、微软、亚马逊。目前,整体大模型进展,苹果对外的信息较少,看上去已经落后其竞争对手一大截。在年初的苹果季度财报电话会议上,蒂姆·库克表示,苹果正在投入大...……更多
全球市值第一背后的AI算力焦虑
...。本月内,人工智能芯片公司英伟达市值先后超过苹果、微软,登顶全球市值第一的公司。而在这个“第一”背后,是众多大模型厂商的“算力焦虑”。英伟达股价截图当算力成为人工智能的关键当地时间6月18日美股收盘,英伟...……更多
Meta提出“可持续思维链”,让大模型在连续潜空间中推理
...视频」目标控制方法Moxin-7B:一个完全开源的大语言模型微软研究院:创建多用途、高质量 3D 资产智源推出视觉条件多视角扩散模型Turbo3D:超快速文本到 3D 生成Meta 提出“可持续思维链”:让大语言模型在连续潜空间中推理GameA...……更多
微软Win11中发现国产开源大模型!RWKV官方:没给钱啊?现在赶趟
微软正尝试在Office中集成国产开源大模型RWKV!RWKV官方甚至直接发了个推文表示:RWKV.cpp,现已在全球五亿系统中部署。之所以这么说,是因为他们发现最新版Windows 11系统的Office文件夹中有以rwkv命名的DLL文件,包含GPU、CPU版本...……更多
OpenAI掀小模型血战!苹果DCLM强势登场,碾压Mistral 7B全开源
...越好。其实一直以来,AI社区中,并不缺少小模型,比如微软Phi系列模型多次迭代,以及6月末谷歌刚刚更新的Gemma 2 7B。这周,OpenAI突然发布GPT-4o mini,Mistral AI联手英伟达发布Mistral NeMo,HuggingFace的SmoLLM等小模型的发布,为小模……更多
Meta大模型LLaMA 3即将登场,参数量或达1400亿
...把子”,Meta在AI基础设施上的投入亦不可小觑,目前只有微软拥有与之相当的计算能力储备。Meta发布的一篇技术博客称,到2024年底,该公司将再购350000个英伟达H100GPU,算上其他GPU,其算力相当于近600000个H100。LLaMA3即将登场参...……更多
掰开安卓手机 满屏都是三个字:大模型
...,从大模型厂商巨头的技术储备栈变化可以窥见一斑。以微软为例,这家科技巨头和云厂商,近期开始注重起AI软硬件结合的技术,如大模型训练等。在微软前不久的一篇训练研究中,就系统阐述了大模型在FP8精度下训练的效果...……更多
浙大这本AI狂热分子们编写的免费电子书,火了
...南威尔士大学继续深造,主攻机器学习领域,其间,也在微软亚洲研究院等公司机构从事研发工作。兜兜转转,2022年那年,他选择回到浙大。“浙大一直有这样的氛围,产学研深度融合,科研成果能上‘书架’也能上‘货架’...……更多
5620亿参数!谷歌发布史上最大“通才”ai模型
...发更多关于多模态AI的应用。曾报道,身为谷歌AI劲敌的微软近期也发表了「ChatGPTforRobotics」的论文,以类似的方式结合视觉数据和大型语言模型来控制机器人。 ……更多
mistralai公司推出mixtral8x22b开源模型
...“6人团队,7页PPT,8亿融资”不断缔造传奇,而且在得到微软的投资之后更是进入发展快车道。该公司今天发布的Mixtral8x22B开源模型是个开源模型,官方目前放出了Torrent种子链接,文件大小为281GB。用户可以通过磁性链接直接下...……更多
谷歌DeepMind推Imagen2;ChatGPT Plus恢复订阅;OpenAI提出用小模型监督大模型 | 本周硅谷发生了什么?
...展通用世界模型研发Mistral AI发布专家混合模型Mixtral 8x7B微软发布27亿参数基座模型Phi-2因拿到更多GPU,ChatGPT Plus重新开放订阅OpenAI首席科学家llya和ChatGPT入选Nature年度十大科学人物OpenAI推Converge 2加速器计划,参……更多
更多关于科技的资讯:
参半出席中国口腔新健康行动“全国爱牙日”活动 共筑国民口腔健康防护基石
9月19日,“中国口腔新健康行动・2025年全国爱牙日”活动在人民网演播厅举办。活动现场,中国口腔清洁护理用品工业协会
2025-09-22 11:44:00
CICAS组委会联合知乎开启第三届全国人工智能应用场景创新挑战赛AGI专项赛
9月20日,以“AI之下,科技重构”为主题的知乎首届TechClub新知科技大会在杭州拉开帷幕。学界专家、企业高管、AI开发者
2025-09-22 11:52:00
于都“织”出老区振兴新图景
本报讯 (全媒体记者李思成) 9月的赣南大地,秋意正浓。近日,记者随“高质量发展中国行·焕新江西”专题活动采访团一行走进赣州市于都县
2025-09-22 07:15:00
近日从太钢获悉,太钢供应用于国家能源局首台(套)重大技术装备项目——扎拉水电站的900兆帕超高强磁轭钢顺利通过叠检试验
2025-09-22 07:26:00
南京微短剧有流量更有“料”
微短剧《平凡警事》海报。微短剧《金箔奇缘》海报。百川短剧剧组在拍摄现场。 中国(南京)游戏谷。□芮天舒韶静王懿闫葛菲地铁里
2025-09-22 07:40:00
为什么越来越多的女生,恋爱前要交换体检报告?
“亲亲许可证”在即将接上吻的那一刻,女友的脑袋往后一躲,闪开了。紧接着,她抬起头,认真地盯着老王,问他,“你有没有幽门螺旋杆菌
2025-09-22 00:56:00
河北日报讯(见习记者康晓博)AI工业内窥镜、无针注射笔、分布式储能路灯、风滚草仿生播种机器人……9月20日,2025河北国际工业设计周活动开幕
2025-09-21 08:12:00
厦门网讯(厦门日报记者 林钦圣 通讯员 江安娜 徐燕) 最近,不少厦门市民都注意到这样一个现象:上班高峰期,正当大家为等候BRT快速公交车而焦急时
2025-09-21 09:00:00
乐陵杨安镇香辛料数智化交易平台正式启动
9月20日,乐陵市杨安镇以“智链未来・香聚全球”为主题的香辛料数智化交易平台启动仪式暨黄河商品交易市场香辛料品种上线仪式隆重举行
2025-09-21 09:25:00
现场签约金额达115亿元!中国制造业民营企业合作交流对接会聚焦“AI+”
大皖新闻讯 9月20日,2025世界制造业大会中国制造业民营企业合作交流对接会在合肥举行。活动现场签约项目10个,总额115
2025-09-21 10:14:00
留交会上首次设立“新招引企业专区”,200多个岗位虚席以待——这里有一份令人“新”动的邀约□南京日报/紫金山新闻记者张甜甜在9月20日举行的留交会现场
2025-09-21 10:24:00
“+”上去,活下来——2025世界制造业大会采访引发的思考
大河网讯 9月20日,2025世界制造业大会在安徽合肥开幕。河南省作为主宾省参会,30家企业参展。在人们的印象中,河南农业可圈可点
2025-09-21 14:48:00
十堰成功举办2025新能源汽车零部件交易会项目路演 十大前沿技术项目集中亮相
十堰广电讯(全媒体记者 耿吉国 通讯员 刘爱理)9月21日上午,2025新能源汽车零部件交易会项目路演活动在十堰国际会展中心成功举办
2025-09-21 15:32:00
河北新闻网讯(王丽英)近日,宁晋县晶龙餐饮管理总公司凭借市场化转型与外向型发展战略的深入实施,成功签约宁晋县产融区学生食堂
2025-09-21 15:53:00
中新经纬9月20日电 题:L2新国标将给智能驾驶立“铁律”作者 江瀚 盘古智库高级研究员智能网联汽车组合驾驶辅助系统或将迎来国家标准
2025-09-21 19:36:00