• 我的订阅
  • 头条热搜
微软论文一张截图,曝出GPT-3.5仅有200亿参数?AI圈巨震,网友大呼太离谱!
新智元报道编辑:编辑部【新智元导读】微软最近一篇论文爆料,GPT-3.5的参数量只有20B,远远小于之前GPT-3公布175B。网友表示,ChatGPT能力似乎「配得上」这个体量?GPT-3.5只有200亿参数?今天,大模型圈都被微软论文中的一纸...……更多
微软开源爆火1bit大模型推理框架!千亿参数模型量化后单CPU可跑
微软开源1bit大模型推理框架!现在1000亿参数大模型量化后单CPU可跑,速度可达每秒5-7个token。就是今年爆火论文The Era of 1-bit LLMs的官方代码实现,开源不到一周GitHub已揽获7.9k Star。传统大模型参数以16位浮点数(如FP16或BF16)形...……更多
马斯克xAI发布首款大模型;苹果发布M3芯片;ChatGPT被曝仅200亿参数|本周硅谷发生了什么?
...3nm工艺加持的“M3芯片”,顺带展示了搭载M3的MacBook Pro。微软的一篇论文则意外曝光ChatGPT实际参数仅有200亿,引起一片哗然。大模型这边,马斯克旗下众星云集的xAI发布了首款大模型“Gork”,与其他模型不同,Grok不仅能通过X...……更多
OpenAI举办“AI春晚”;李开复大模型破纪录 | 图灵周报
...A股、美股的“超导概念股”都曾受影响,大幅波动。 03微软以安全问题为由限制员工访问ChatGPT图源:Pixabay在当地时间周四的一段时间内,微软员工被禁止使用OpenAI产品ChatGPT。微软在内部网站上的最新消息中表示,“出于安全...……更多
微软推出14b参数“最先进”小型语言模型
12月13日消息,微软今天宣布推出14B参数“最先进”小型语言模型(SLM)Phi-4,除了传统的语言处理外,它还擅长数学等领域的复杂推理。Phi-4是Phi系列小型语言模型的最新成员,官方表示其展示了微软继续探索SLM边界的可能性。...……更多
大模型新趋势之MoE:现状、挑战及研究方向
...发各种新型MoE架构,以提升模型性能或实用性。如清华和微软联合提出MH-MoE5,通过多头机制弥补MoE原始缺陷,实现专家激活率由8.33%提升至90.71%,提升模型高效扩展能力;华为提出全新LocMoE架构,并将其嵌入盘古大模型,提升模...……更多
微软发布旗下最小语言模型phi-2
11月17日消息,微软Ignite2023大会已拉开帷幕,微软在本次活动中发布了旗下最小的语言模型Phi-2,共有27亿参数,相比较此前版本有明显提升。注:微软于今年6月发布Phi-1,只有13亿代码,适用于QA问答、聊天格式和代码等等场景...……更多
挑战Scaling Law,Meta发布移动端350M小模型MobileLLM,性能比肩7B LLaMA-v2
...是唯一的路径,模型「以小搏大」的故事不断上演。先有微软更新;后有谷歌用。硬件方面,我们看到了AI功能逐渐与电子产品进行深度集成。比如微软臭名昭著的Recall功能,正是他们的重要组成部分;苹果也在Apple Intelligence的...……更多
专家模型不要专家并行!微软开源MoE新路径
【新智元导读】近日,来自微软的研究人员开源了使用全新方法训练的MoE大模型,不走寻常路,且编码和数学表现出色。继Phi家族之后,微软又开源了新的混合专家大模型——GRIN MoE。与Phi-3.5同样的个头(16 * 3.8B),却采用了...……更多
被追捧的ChatGPT:可以使用它,但别依赖它
...热门的话题。”能让比尔·盖茨如此看重,一方面是因为微软与OpenAI的合作关系,据悉,OpenAI的机器学习和运算部署在微软Azure云上,另一方面也是因为ChatGPT超强的能力。公开资料显示,ChatGPT是由人工智能研究实验室OpenAI发布的...……更多
科学家提出情景学习新范式,让学霸大模型向学弱大模型输送能力
...、低算力需求的模型,并取得了一定成果。2023 年 6 月,微软发布 13 亿参数的语言模型 Phi,同年 9 月 Phi-2 的参数扩大到 27 亿。据报道,微软的“小模型”已经在金融客户和银行客户中测试。此后,国内厂商也逐步跟进小模型的...……更多
马斯克打脸OpenAI!全球最大模型Grok-1开源
...利性开源组织创建的,目的是抗衡谷歌。但此后它变成了微软控制下的一家闭源、以利润为导向的公司。“OpenAI已经成为一家利润最大化的公司……这根本不是他的初衷。”马斯克还谴责OpenAI遭到微软的控制。他表示,世界需要...……更多
本周硅谷发生了什么?|苹果Vision Pro正式开售;Neuralink完成人类脑机接口植入;字节Coze国内版上线;
...人助手苹果发布2024年Q1财报,库克称AI是“巨大的机会”微软、Alphabet等AI相关企业总市值一天蒸发1.3万亿元360 AI搜索移动App已上线Sam Altman弟弟的风投公司募资1.5亿美元,将重点关注AI初创人形机器人初创公司Figure AI与微软、OpenAI...……更多
o1突发内幕曝光?谷歌更早揭示原理 大模型光有软件不存在护城河
...现在英伟达直接掌控谁能拥有更多算力。那么如果谷歌/微软开发出了效果更好的定制芯片,情况又会如何呢?o1突发内幕曝光?谷歌更早揭示原理,大模型光有软件不存在护城河值得一提的是,前段时间OpenAI首颗芯片曝光,将采...……更多
语音克隆达到人类水平,微软全新VALL-E 2模型让DeepFake堪比配音员
【新智元导读】继去年初的第一代VALL-E模型之后,微软最近又上新了VALL-E 2模型,标志着第一个在合成语音稳健性、相似度、自然程度等方面达到人类水平的文本到语音模型。最近,微软发布了零样本的文本到语音(TTS)模型VAL...……更多
苹果300亿参数大模型首亮相,还买了家AI公司|焦点分析
...下来,苹果的重心都在加速大模型进程上,来追赶谷歌、微软、亚马逊。目前,整体大模型进展,苹果对外的信息较少,看上去已经落后其竞争对手一大截。在年初的苹果季度财报电话会议上,蒂姆·库克表示,苹果正在投入大...……更多
全球市值第一背后的AI算力焦虑
...。本月内,人工智能芯片公司英伟达市值先后超过苹果、微软,登顶全球市值第一的公司。而在这个“第一”背后,是众多大模型厂商的“算力焦虑”。英伟达股价截图当算力成为人工智能的关键当地时间6月18日美股收盘,英伟...……更多
Meta提出“可持续思维链”,让大模型在连续潜空间中推理
...视频」目标控制方法Moxin-7B:一个完全开源的大语言模型微软研究院:创建多用途、高质量 3D 资产智源推出视觉条件多视角扩散模型Turbo3D:超快速文本到 3D 生成Meta 提出“可持续思维链”:让大语言模型在连续潜空间中推理GameA...……更多
微软Win11中发现国产开源大模型!RWKV官方:没给钱啊?现在赶趟
微软正尝试在Office中集成国产开源大模型RWKV!RWKV官方甚至直接发了个推文表示:RWKV.cpp,现已在全球五亿系统中部署。之所以这么说,是因为他们发现最新版Windows 11系统的Office文件夹中有以rwkv命名的DLL文件,包含GPU、CPU版本...……更多
OpenAI掀小模型血战!苹果DCLM强势登场,碾压Mistral 7B全开源
...越好。其实一直以来,AI社区中,并不缺少小模型,比如微软Phi系列模型多次迭代,以及6月末谷歌刚刚更新的Gemma 2 7B。这周,OpenAI突然发布GPT-4o mini,Mistral AI联手英伟达发布Mistral NeMo,HuggingFace的SmoLLM等小模型的发布,为小模……更多
Meta大模型LLaMA 3即将登场,参数量或达1400亿
...把子”,Meta在AI基础设施上的投入亦不可小觑,目前只有微软拥有与之相当的计算能力储备。Meta发布的一篇技术博客称,到2024年底,该公司将再购350000个英伟达H100GPU,算上其他GPU,其算力相当于近600000个H100。LLaMA3即将登场参...……更多
掰开安卓手机 满屏都是三个字:大模型
...,从大模型厂商巨头的技术储备栈变化可以窥见一斑。以微软为例,这家科技巨头和云厂商,近期开始注重起AI软硬件结合的技术,如大模型训练等。在微软前不久的一篇训练研究中,就系统阐述了大模型在FP8精度下训练的效果...……更多
浙大这本AI狂热分子们编写的免费电子书,火了
...南威尔士大学继续深造,主攻机器学习领域,其间,也在微软亚洲研究院等公司机构从事研发工作。兜兜转转,2022年那年,他选择回到浙大。“浙大一直有这样的氛围,产学研深度融合,科研成果能上‘书架’也能上‘货架’...……更多
5620亿参数!谷歌发布史上最大“通才”ai模型
...发更多关于多模态AI的应用。曾报道,身为谷歌AI劲敌的微软近期也发表了「ChatGPTforRobotics」的论文,以类似的方式结合视觉数据和大型语言模型来控制机器人。 ……更多
谷歌DeepMind推Imagen2;ChatGPT Plus恢复订阅;OpenAI提出用小模型监督大模型 | 本周硅谷发生了什么?
...展通用世界模型研发Mistral AI发布专家混合模型Mixtral 8x7B微软发布27亿参数基座模型Phi-2因拿到更多GPU,ChatGPT Plus重新开放订阅OpenAI首席科学家llya和ChatGPT入选Nature年度十大科学人物OpenAI推Converge 2加速器计划,参……更多
mistralai公司推出mixtral8x22b开源模型
...“6人团队,7页PPT,8亿融资”不断缔造传奇,而且在得到微软的投资之后更是进入发展快车道。该公司今天发布的Mixtral8x22B开源模型是个开源模型,官方目前放出了Torrent种子链接,文件大小为281GB。用户可以通过磁性链接直接下...……更多
惊掉下巴!被字节起诉800万实习生,拿下NeurIPS 2024最佳论文
...其实是加了payload进去,然后就可以远程执行代码,修改参数了。这种攻击方式,可以通过修改或注入恶意代码,使模型在加载时被篡改模型权重、修改训练参数或截取模型数据。根据大V「Jack Cui」猜测,这位实习生所用的大概...……更多
微软被曝正自研AI大模型:5000亿个参数,与谷歌和OpenAI竞争
科技巨头微软或正在研发参数达5000亿的全新AI(人工智能)大模型,将正面叫板谷歌和OpenAI。当地时间5月6日,据外媒报道,微软正在研发一款名为MAI-1的最新AI大模型,其规模远超出微软此前推出的一些开源模型,在性能上或...……更多
谷歌版贾维斯即将问世,最强Gemini 2.0加持!AI自主操控电脑时代来临
...称谷歌同类Project Jarvis预计年底亮相。AI操控电脑已成为微软、苹果等巨头,下一个发力的战场。AI接管人类电脑,就是下一个未来!几天前,Anthropic向所有人展示了,Claude 3.5自主看屏幕操作光标完成复杂任务,足以惊掉下巴。...……更多
Scaling Law百度最早提出!OpenAI/Claude受它启发,致谢中有Ilya
...并在训练集的更大子集(碎片)上训练这些模型的 “超参数缩减 ”版本,以观察模型的准确性如何随着训练集的大小而增长。因此针对这四个领域,机器翻译、语言建模、图像分类和语音识别,找到了他们在大型数据集上显示...……更多
更多关于科技的资讯:
峰瑞资本创始合伙人李丰:新时代早期基金投资机遇丨WAVES新浪潮2025
WAVES新浪潮2025邀你一起走向中国创投的「新纪元」。这是属于中国创投的新纪元。当下的中国创投市场,既是周期筑底的转折点
2025-06-21 07:07:00
“专业对口”依然是就业优势,电子科学技术和信息安全专业薪酬高
高考志愿填报作为人生的关键抉择点,关系着考生未来的职业发展。专业适配度、行业成长性、岗位潜力值,成为考生与家长的核心关切
2025-06-20 23:09:00
大众网记者 宋学敏 通讯员 刘煜 刘志新 潍坊报道“以前办理许可证要跑三次窗口,现在只需要点点手机就能办成了,真是越来越便民了
2025-06-20 23:40:00
【多彩新论】打开市场要有自己的“一招鲜”
近期,泡泡玛特以及潮玩产品拉布布成了舆论热点,引起广泛议论。一个来自中国的小怪兽在全球杀疯了,从东南亚到欧美,粉丝彻夜排队抢购拉布布
2025-06-21 02:05:00
【聚焦】渤海湾畔,一场“脑机森林”的拔节生长 扫码阅读手机版
“我2005年开始从事脑机接口的课题研究,算算至今正好20年了,最近两三年里脑机产业在天津高新区发展得特别快,获得转化的研究成果非常多
2025-06-21 00:51:00
华为Pura 80 系列影像好搭档,华为云空间让影像创作告别空间限制
华为Pura 80 系列在6月14日正式开售,首批华为Pura 80 Pro/Pro+新机用户已经用上了一英寸超大底摄像头和红枫原色摄像头记录身边的每一个“出色”瞬间
2025-06-20 14:08:00
木纤维纸增强材料HiWood荣获SAMPE 2025年度材料类创新奖,重塑复材行业标准
6月18日,SAMPE 中国2025年会暨第二十届国际先进复合材料制品、原材料、工装及工程应用展览会(以下简称 SAMPE 展会)于北京开幕
2025-06-20 14:08:00
战略定位驱动AI教育未来,松鼠Ai×顾均辉战略定位召开人工智能财富峰会
在教育科技领域的发展浪潮中,行业面临着诸多需要突破的瓶颈。随着教育改革的持续深化,教育模式正经历革新转变,在减轻孩子课业压力的同时
2025-06-20 14:10:00
创新“1345”动态管控体系: 破解数据治理难题,赋能全域数字化转型
6月13日,由中国信息协会主办的2025数字城市论坛在北京成功举办。本届论坛以“全域数字化转型”为核心议题,汇聚政府、产业界
2025-06-20 14:11:00
小牧入选中国品牌500强:年轻化战略如何重塑卫浴价值坐标
近日,小牧卫浴成功跻身2025年《中国500最具价值品牌》榜单,品牌估值再创新高,超182亿。这是小牧卫浴连续第三年荣登该榜单
2025-06-20 14:12:00
年轻人的新中式养生,中科中创亚麻籽解锁养生计划
在快节奏的现代生活中,“新中式养生”正悄然成为年轻一代追求健康的新风尚。越来越多年轻人摒弃了传统养生的繁复操作,更青睐于在日常饮食中融入自然
2025-06-20 14:13:00
高考结束,“后高考经济”悄然升温,旅游、餐饮、娱乐等行业纷纷推出针对应届毕业生的优惠政策。准考证变身“通行证”,各种优惠纷至沓来
2025-06-20 14:15:00
投融界分析:145店年收23亿,巴奴如何破解火锅“高端局”?
6月16日,巴奴国际控股有限公司正式向港交所递交招股书,计划登陆主板市场。若成功上市,巴奴将成为继呷哺呷哺、海底捞之后第三家港股上市的火锅企业
2025-06-20 14:34:00
树根互联:九方面助力制造业绿色化转型
目前,国家层面累计培育了6430家绿色工厂,产值占制造业总产值的比重超20%,培育绿色工业园区491家。产业链将继续优化绿色制造标杆培育机制
2025-06-20 14:37:00
每年618电商大促都是观察平台经济的重要节点。从“疯狂内卷”走向“理性竞合”,时至今天,行业已经开始回归价值“竞争”,纷纷下沉至“产业带”
2025-06-20 14:41:00