• 我的订阅
  • 头条热搜
微软论文一张截图,曝出GPT-3.5仅有200亿参数?AI圈巨震,网友大呼太离谱!
新智元报道编辑:编辑部【新智元导读】微软最近一篇论文爆料,GPT-3.5的参数量只有20B,远远小于之前GPT-3公布175B。网友表示,ChatGPT能力似乎「配得上」这个体量?GPT-3.5只有200亿参数?今天,大模型圈都被微软论文中的一纸...……更多
微软开源爆火1bit大模型推理框架!千亿参数模型量化后单CPU可跑
微软开源1bit大模型推理框架!现在1000亿参数大模型量化后单CPU可跑,速度可达每秒5-7个token。就是今年爆火论文The Era of 1-bit LLMs的官方代码实现,开源不到一周GitHub已揽获7.9k Star。传统大模型参数以16位浮点数(如FP16或BF16)形...……更多
马斯克xAI发布首款大模型;苹果发布M3芯片;ChatGPT被曝仅200亿参数|本周硅谷发生了什么?
...3nm工艺加持的“M3芯片”,顺带展示了搭载M3的MacBook Pro。微软的一篇论文则意外曝光ChatGPT实际参数仅有200亿,引起一片哗然。大模型这边,马斯克旗下众星云集的xAI发布了首款大模型“Gork”,与其他模型不同,Grok不仅能通过X...……更多
OpenAI举办“AI春晚”;李开复大模型破纪录 | 图灵周报
...A股、美股的“超导概念股”都曾受影响,大幅波动。 03微软以安全问题为由限制员工访问ChatGPT图源:Pixabay在当地时间周四的一段时间内,微软员工被禁止使用OpenAI产品ChatGPT。微软在内部网站上的最新消息中表示,“出于安全...……更多
大模型新趋势之MoE:现状、挑战及研究方向
...发各种新型MoE架构,以提升模型性能或实用性。如清华和微软联合提出MH-MoE5,通过多头机制弥补MoE原始缺陷,实现专家激活率由8.33%提升至90.71%,提升模型高效扩展能力;华为提出全新LocMoE架构,并将其嵌入盘古大模型,提升模...……更多
微软发布旗下最小语言模型phi-2
11月17日消息,微软Ignite2023大会已拉开帷幕,微软在本次活动中发布了旗下最小的语言模型Phi-2,共有27亿参数,相比较此前版本有明显提升。注:微软于今年6月发布Phi-1,只有13亿代码,适用于QA问答、聊天格式和代码等等场景...……更多
挑战Scaling Law,Meta发布移动端350M小模型MobileLLM,性能比肩7B LLaMA-v2
...是唯一的路径,模型「以小搏大」的故事不断上演。先有微软更新;后有谷歌用。硬件方面,我们看到了AI功能逐渐与电子产品进行深度集成。比如微软臭名昭著的Recall功能,正是他们的重要组成部分;苹果也在Apple Intelligence的...……更多
专家模型不要专家并行!微软开源MoE新路径
【新智元导读】近日,来自微软的研究人员开源了使用全新方法训练的MoE大模型,不走寻常路,且编码和数学表现出色。继Phi家族之后,微软又开源了新的混合专家大模型——GRIN MoE。与Phi-3.5同样的个头(16 * 3.8B),却采用了...……更多
科学家提出情景学习新范式,让学霸大模型向学弱大模型输送能力
...、低算力需求的模型,并取得了一定成果。2023 年 6 月,微软发布 13 亿参数的语言模型 Phi,同年 9 月 Phi-2 的参数扩大到 27 亿。据报道,微软的“小模型”已经在金融客户和银行客户中测试。此后,国内厂商也逐步跟进小模型的...……更多
马斯克打脸OpenAI!全球最大模型Grok-1开源
...利性开源组织创建的,目的是抗衡谷歌。但此后它变成了微软控制下的一家闭源、以利润为导向的公司。“OpenAI已经成为一家利润最大化的公司……这根本不是他的初衷。”马斯克还谴责OpenAI遭到微软的控制。他表示,世界需要...……更多
本周硅谷发生了什么?|苹果Vision Pro正式开售;Neuralink完成人类脑机接口植入;字节Coze国内版上线;
...人助手苹果发布2024年Q1财报,库克称AI是“巨大的机会”微软、Alphabet等AI相关企业总市值一天蒸发1.3万亿元360 AI搜索移动App已上线Sam Altman弟弟的风投公司募资1.5亿美元,将重点关注AI初创人形机器人初创公司Figure AI与微软、OpenAI...……更多
o1突发内幕曝光?谷歌更早揭示原理 大模型光有软件不存在护城河
...现在英伟达直接掌控谁能拥有更多算力。那么如果谷歌/微软开发出了效果更好的定制芯片,情况又会如何呢?o1突发内幕曝光?谷歌更早揭示原理,大模型光有软件不存在护城河值得一提的是,前段时间OpenAI首颗芯片曝光,将采...……更多
语音克隆达到人类水平,微软全新VALL-E 2模型让DeepFake堪比配音员
【新智元导读】继去年初的第一代VALL-E模型之后,微软最近又上新了VALL-E 2模型,标志着第一个在合成语音稳健性、相似度、自然程度等方面达到人类水平的文本到语音模型。最近,微软发布了零样本的文本到语音(TTS)模型VAL...……更多
苹果300亿参数大模型首亮相,还买了家AI公司|焦点分析
...下来,苹果的重心都在加速大模型进程上,来追赶谷歌、微软、亚马逊。目前,整体大模型进展,苹果对外的信息较少,看上去已经落后其竞争对手一大截。在年初的苹果季度财报电话会议上,蒂姆·库克表示,苹果正在投入大...……更多
全球市值第一背后的AI算力焦虑
...。本月内,人工智能芯片公司英伟达市值先后超过苹果、微软,登顶全球市值第一的公司。而在这个“第一”背后,是众多大模型厂商的“算力焦虑”。英伟达股价截图当算力成为人工智能的关键当地时间6月18日美股收盘,英伟...……更多
微软Win11中发现国产开源大模型!RWKV官方:没给钱啊?现在赶趟
微软正尝试在Office中集成国产开源大模型RWKV!RWKV官方甚至直接发了个推文表示:RWKV.cpp,现已在全球五亿系统中部署。之所以这么说,是因为他们发现最新版Windows 11系统的Office文件夹中有以rwkv命名的DLL文件,包含GPU、CPU版本...……更多
OpenAI掀小模型血战!苹果DCLM强势登场,碾压Mistral 7B全开源
...越好。其实一直以来,AI社区中,并不缺少小模型,比如微软Phi系列模型多次迭代,以及6月末谷歌刚刚更新的Gemma 2 7B。这周,OpenAI突然发布GPT-4o mini,Mistral AI联手英伟达发布Mistral NeMo,HuggingFace的SmoLLM等小模型的发布,为小模……更多
Meta大模型LLaMA 3即将登场,参数量或达1400亿
...把子”,Meta在AI基础设施上的投入亦不可小觑,目前只有微软拥有与之相当的计算能力储备。Meta发布的一篇技术博客称,到2024年底,该公司将再购350000个英伟达H100GPU,算上其他GPU,其算力相当于近600000个H100。LLaMA3即将登场参...……更多
掰开安卓手机 满屏都是三个字:大模型
...,从大模型厂商巨头的技术储备栈变化可以窥见一斑。以微软为例,这家科技巨头和云厂商,近期开始注重起AI软硬件结合的技术,如大模型训练等。在微软前不久的一篇训练研究中,就系统阐述了大模型在FP8精度下训练的效果...……更多
谷歌DeepMind推Imagen2;ChatGPT Plus恢复订阅;OpenAI提出用小模型监督大模型 | 本周硅谷发生了什么?
...展通用世界模型研发Mistral AI发布专家混合模型Mixtral 8x7B微软发布27亿参数基座模型Phi-2因拿到更多GPU,ChatGPT Plus重新开放订阅OpenAI首席科学家llya和ChatGPT入选Nature年度十大科学人物OpenAI推Converge 2加速器计划,参……更多
mistralai公司推出mixtral8x22b开源模型
...“6人团队,7页PPT,8亿融资”不断缔造传奇,而且在得到微软的投资之后更是进入发展快车道。该公司今天发布的Mixtral8x22B开源模型是个开源模型,官方目前放出了Torrent种子链接,文件大小为281GB。用户可以通过磁性链接直接下...……更多
谷歌版贾维斯即将问世,最强Gemini 2.0加持!AI自主操控电脑时代来临
...称谷歌同类Project Jarvis预计年底亮相。AI操控电脑已成为微软、苹果等巨头,下一个发力的战场。AI接管人类电脑,就是下一个未来!几天前,Anthropic向所有人展示了,Claude 3.5自主看屏幕操作光标完成复杂任务,足以惊掉下巴。...……更多
微软被曝正自研AI大模型:5000亿个参数,与谷歌和OpenAI竞争
科技巨头微软或正在研发参数达5000亿的全新AI(人工智能)大模型,将正面叫板谷歌和OpenAI。当地时间5月6日,据外媒报道,微软正在研发一款名为MAI-1的最新AI大模型,其规模远超出微软此前推出的一些开源模型,在性能上或...……更多
微软连发3款Phi-3.5模型:128K上下文,首用MoE架构,部分性能超GPT-4o mini
智东西8月21日消息,今天,微软一口气甩出3款超强轻量级模型!微软本次发布的轻量级模型系列名为Phi-3.5,适合在内存和算力受限的环境中运行,均支持128k上下文长度。Phi-3.5-mini-instruct主要面向基础快速推理任务,Phi-3.5-MoE-in...……更多
LLM数学性能暴涨168%,微软14人团队力作!合成数据2.0秘诀曝光,智能体生成教学
【新智元导读】合成数据2.0秘诀曝光了!来自微软的研究人员们提出了智能体框架AgentInstruct,能够自动创建大量、多样化的合成数据。经过合成数据微调后的模型Orca-3,在多项基准上刷新了SOTA。全世界高质量数据几乎枯竭。AI...……更多
本周硅谷发生了什么?| 高通第三代骁龙8;谷歌20亿美元追投Anthropic;联想拿出能跑大模型个人PC
...子轮融资。本轮融资由 Gradient Ventures、TR Ventures、Nvidia和微软Azure AI副总裁Misha Bilenko参投。资金将用于加强CentML 的产品开发和研究工作,同时扩大初创公司的工程团队和分布在美国和加拿大的30人员工队伍。CentML是一家开发工具……更多
Llama 4训练已开启!Meta科学家最新采访,揭秘Llama 3.1是如何炼成的
...目。 以下是采访内容的节选。Llama 3.1研发思路如何决定参数规模其实LLM的参数规模的选择需要考虑多种因素,包括scaling law、训练时间、GPU和硬件的约束等等。而且,不能只考虑Meta所用的硬件,还有整个AI社区,并不是每个人...……更多
微软为msn天气引入ai预测模型
5月5日消息,微软为MSN 天气引入一项最新的天气预测模型,该模型基于微软旗下Start团队近日在 arXiv 发表的论文,结合了5种不同的人工智能模型和3种深度学习架构,据称能够准确预测 30 天内天气预报,IT之家查询论文信息,整...……更多
谷歌立秋新品发布会:Pixel 9系列整齐亮相 还有一些AI新花样
...截图内容,并与日历等app进行联动操作。这个功能与之前微软给Windows做的Recall功能非常像,但区别在于微软的功能因为“时时刻刻在截图”,被视为侵犯隐私而“回炉重造”,谷歌的功能只分析用户手动进行的截图。谷歌还发...……更多
微软宣布可以提前30天预测天气
...发团队\"世界上最准确的全球天气预报提供商\"的称号。微软开始团队似乎并不满足于此。本周,微软宣布该团队提出了一种更准确的方法,可以提前30天预测天气。在必应博客上的一篇文章中,微软称其\"Start\"团队在康奈尔大学...……更多
更多关于科技的资讯:
影驰GeForce RTX 5080圣刃OC显卡评测:小尺寸高性能 高端玩家完美之选
一、前言:更贴近游戏玩家需求的准旗舰显卡NVIDIA在2025年开年推出了全新的GeForce RTX 50系显卡,旗舰级别的GeForce RTX 5090 D价格直接来到了16000元之上
2025-01-30 22:38:00
中国人是不是都会功夫 甄子丹这回答再也解释不清了
快科技1月30日消息,这下再也解释不清了,甄子丹喊话外国人中国人人都会功夫。在刚刚过去的蛇年春晚,“功夫巨星”甄子丹 带来武术节目《笔走龙蛇》
2025-01-30 22:38:00
五彩斑斓的黑!技嘉RTX 5080 MASTER显卡图赏
快科技1月30日消息,今日技嘉RTX 5080 MASTER显卡正式发布。现在这款新品已经来到我们评测室,下面为大家带来图赏
2025-01-30 22:38:00
丧心病狂!针对DeepSeek网络攻击暴增上百倍:职业打手开始下场攻击
快科技1月30日消息,随着DeepSeek的爆火,老外开始对它的攻击加大,而且力度也是越来越强。1月30日凌晨,即农历大年初二
2025-01-30 23:08:00
EA解散《龙腾世纪》团队
EA正在清理门户,《质量效应5》交由另一批人掌控,所有资深编剧及写手要么离开了BioWare,要么被调往其它单位。曾于2011至2016年间在BioWare任编剧的Ann Lemay在社交平台发帖称
2025-01-30 23:08:00
18.05亿元前所未有!蛇年大年初一票房创造历史新纪录
快科技1月30日消息,根据国家电影局统计,2025年春节大年初一(1月29日)票房为18.05亿元,观影人次为3515
2025-01-30 11:08:00
台湾嘉义县发生5.2级地震 福建多地震感明显
快科技1月30日消息,据中国地震台网正式测定:01月30日10时11分在台湾嘉义县(北纬23.25度,东经120.57度)发生5
2025-01-30 11:38:00
又一车企妥协:阿尔法·罗密欧即将放弃2027年全面电动化目标
快科技1月30日消息,日前,阿尔法·罗密欧宣布将放弃2027年在北美全面实现电动化的目标,转而采用多种动力形式并举的战略
2025-01-30 12:08:00
索尼PSN政策再度生变
如果没有发生PSN风波,地狱里的老司机应该比现在更多——索尼去年在PC平台同步推出GaaS游戏《地狱潜行者2》时,请君入瓮后又强制要求玩家登录PSN账号
2025-01-30 12:08:00
美国一架客机与一架直升机空中相撞坠河 客机上有约60名乘客
快科技1月30日消息,据美国联邦航空管理局消息,1月29日晚,在接近罗纳德·里根华盛顿国家机场跑道时,一架客机与一架直升机相撞
2025-01-30 12:08:00
余承东称将引发全国人民抢购!华为重磅新品3月发布:或是全新折叠产品
快科技1月30日消息,近日余承东直播时又主动爆料称,华为即将发布重磅新品。直播中,余承东透露了华为即将发布的一款意想不到的新品
2025-01-30 13:38:00
韩国客机烧出一个大洞:可能因充电宝 行李架蹿出火花
快科技1月30日消息,据报道,28日晚,釜山航空BX391次航班在准备起飞阶段突发火灾。在紧急撤离过程中,由于吸入烟气等原因
2025-01-30 13:38:00
为降低成本:日产宣布三家工厂裁员并减少班次
快科技1月30日消息,日产汽车宣布正在削减美国三家工厂的部分生产班次,并向田纳西州士麦那和密西西比州坎顿的整车装配厂以及田纳西州德彻德的发动机厂员工提供离职补偿方案
2025-01-30 15:38:00
赵雅芝 蛇年最忙的女人:73岁高龄身材、颜值依然抗打 网友感慨
1月30日消息,中国香港女演员赵雅芝可能是蛇年最忙碌的艺人之一。据悉,71岁的赵雅芝受国内9家电视台邀请,现身它们的“春晚”舞台
2025-01-30 15:38:00
法国耗资540亿欧元AI推出3天后下架:错误频出 建议用户吃牛蛋
快科技1月30日消息,据报道,法国近期斥资540亿欧元推出了一款名为Lucie的法语AI聊天机器人,然而,由于其表现过于离谱
2025-01-30 16:08:00