• 我的订阅
  • 头条热搜
微软论文一张截图,曝出GPT-3.5仅有200亿参数?AI圈巨震,网友大呼太离谱!
新智元报道编辑:编辑部【新智元导读】微软最近一篇论文爆料,GPT-3.5的参数量只有20B,远远小于之前GPT-3公布175B。网友表示,ChatGPT能力似乎「配得上」这个体量?GPT-3.5只有200亿参数?今天,大模型圈都被微软论文中的一纸...……更多
微软开源爆火1bit大模型推理框架!千亿参数模型量化后单CPU可跑
微软开源1bit大模型推理框架!现在1000亿参数大模型量化后单CPU可跑,速度可达每秒5-7个token。就是今年爆火论文The Era of 1-bit LLMs的官方代码实现,开源不到一周GitHub已揽获7.9k Star。传统大模型参数以16位浮点数(如FP16或BF16)形...……更多
马斯克xAI发布首款大模型;苹果发布M3芯片;ChatGPT被曝仅200亿参数|本周硅谷发生了什么?
...3nm工艺加持的“M3芯片”,顺带展示了搭载M3的MacBook Pro。微软的一篇论文则意外曝光ChatGPT实际参数仅有200亿,引起一片哗然。大模型这边,马斯克旗下众星云集的xAI发布了首款大模型“Gork”,与其他模型不同,Grok不仅能通过X...……更多
OpenAI举办“AI春晚”;李开复大模型破纪录 | 图灵周报
...A股、美股的“超导概念股”都曾受影响,大幅波动。 03微软以安全问题为由限制员工访问ChatGPT图源:Pixabay在当地时间周四的一段时间内,微软员工被禁止使用OpenAI产品ChatGPT。微软在内部网站上的最新消息中表示,“出于安全...……更多
微软推出14b参数“最先进”小型语言模型
12月13日消息,微软今天宣布推出14B参数“最先进”小型语言模型(SLM)Phi-4,除了传统的语言处理外,它还擅长数学等领域的复杂推理。Phi-4是Phi系列小型语言模型的最新成员,官方表示其展示了微软继续探索SLM边界的可能性。...……更多
大模型新趋势之MoE:现状、挑战及研究方向
...发各种新型MoE架构,以提升模型性能或实用性。如清华和微软联合提出MH-MoE5,通过多头机制弥补MoE原始缺陷,实现专家激活率由8.33%提升至90.71%,提升模型高效扩展能力;华为提出全新LocMoE架构,并将其嵌入盘古大模型,提升模...……更多
微软发布旗下最小语言模型phi-2
11月17日消息,微软Ignite2023大会已拉开帷幕,微软在本次活动中发布了旗下最小的语言模型Phi-2,共有27亿参数,相比较此前版本有明显提升。注:微软于今年6月发布Phi-1,只有13亿代码,适用于QA问答、聊天格式和代码等等场景...……更多
挑战Scaling Law,Meta发布移动端350M小模型MobileLLM,性能比肩7B LLaMA-v2
...是唯一的路径,模型「以小搏大」的故事不断上演。先有微软更新;后有谷歌用。硬件方面,我们看到了AI功能逐渐与电子产品进行深度集成。比如微软臭名昭著的Recall功能,正是他们的重要组成部分;苹果也在Apple Intelligence的...……更多
专家模型不要专家并行!微软开源MoE新路径
【新智元导读】近日,来自微软的研究人员开源了使用全新方法训练的MoE大模型,不走寻常路,且编码和数学表现出色。继Phi家族之后,微软又开源了新的混合专家大模型——GRIN MoE。与Phi-3.5同样的个头(16 * 3.8B),却采用了...……更多
科学家提出情景学习新范式,让学霸大模型向学弱大模型输送能力
...、低算力需求的模型,并取得了一定成果。2023 年 6 月,微软发布 13 亿参数的语言模型 Phi,同年 9 月 Phi-2 的参数扩大到 27 亿。据报道,微软的“小模型”已经在金融客户和银行客户中测试。此后,国内厂商也逐步跟进小模型的...……更多
马斯克打脸OpenAI!全球最大模型Grok-1开源
...利性开源组织创建的,目的是抗衡谷歌。但此后它变成了微软控制下的一家闭源、以利润为导向的公司。“OpenAI已经成为一家利润最大化的公司……这根本不是他的初衷。”马斯克还谴责OpenAI遭到微软的控制。他表示,世界需要...……更多
本周硅谷发生了什么?|苹果Vision Pro正式开售;Neuralink完成人类脑机接口植入;字节Coze国内版上线;
...人助手苹果发布2024年Q1财报,库克称AI是“巨大的机会”微软、Alphabet等AI相关企业总市值一天蒸发1.3万亿元360 AI搜索移动App已上线Sam Altman弟弟的风投公司募资1.5亿美元,将重点关注AI初创人形机器人初创公司Figure AI与微软、OpenAI...……更多
o1突发内幕曝光?谷歌更早揭示原理 大模型光有软件不存在护城河
...现在英伟达直接掌控谁能拥有更多算力。那么如果谷歌/微软开发出了效果更好的定制芯片,情况又会如何呢?o1突发内幕曝光?谷歌更早揭示原理,大模型光有软件不存在护城河值得一提的是,前段时间OpenAI首颗芯片曝光,将采...……更多
语音克隆达到人类水平,微软全新VALL-E 2模型让DeepFake堪比配音员
【新智元导读】继去年初的第一代VALL-E模型之后,微软最近又上新了VALL-E 2模型,标志着第一个在合成语音稳健性、相似度、自然程度等方面达到人类水平的文本到语音模型。最近,微软发布了零样本的文本到语音(TTS)模型VAL...……更多
苹果300亿参数大模型首亮相,还买了家AI公司|焦点分析
...下来,苹果的重心都在加速大模型进程上,来追赶谷歌、微软、亚马逊。目前,整体大模型进展,苹果对外的信息较少,看上去已经落后其竞争对手一大截。在年初的苹果季度财报电话会议上,蒂姆·库克表示,苹果正在投入大...……更多
全球市值第一背后的AI算力焦虑
...。本月内,人工智能芯片公司英伟达市值先后超过苹果、微软,登顶全球市值第一的公司。而在这个“第一”背后,是众多大模型厂商的“算力焦虑”。英伟达股价截图当算力成为人工智能的关键当地时间6月18日美股收盘,英伟...……更多
Meta提出“可持续思维链”,让大模型在连续潜空间中推理
...视频」目标控制方法Moxin-7B:一个完全开源的大语言模型微软研究院:创建多用途、高质量 3D 资产智源推出视觉条件多视角扩散模型Turbo3D:超快速文本到 3D 生成Meta 提出“可持续思维链”:让大语言模型在连续潜空间中推理GameA...……更多
微软Win11中发现国产开源大模型!RWKV官方:没给钱啊?现在赶趟
微软正尝试在Office中集成国产开源大模型RWKV!RWKV官方甚至直接发了个推文表示:RWKV.cpp,现已在全球五亿系统中部署。之所以这么说,是因为他们发现最新版Windows 11系统的Office文件夹中有以rwkv命名的DLL文件,包含GPU、CPU版本...……更多
OpenAI掀小模型血战!苹果DCLM强势登场,碾压Mistral 7B全开源
...越好。其实一直以来,AI社区中,并不缺少小模型,比如微软Phi系列模型多次迭代,以及6月末谷歌刚刚更新的Gemma 2 7B。这周,OpenAI突然发布GPT-4o mini,Mistral AI联手英伟达发布Mistral NeMo,HuggingFace的SmoLLM等小模型的发布,为小模……更多
Meta大模型LLaMA 3即将登场,参数量或达1400亿
...把子”,Meta在AI基础设施上的投入亦不可小觑,目前只有微软拥有与之相当的计算能力储备。Meta发布的一篇技术博客称,到2024年底,该公司将再购350000个英伟达H100GPU,算上其他GPU,其算力相当于近600000个H100。LLaMA3即将登场参...……更多
掰开安卓手机 满屏都是三个字:大模型
...,从大模型厂商巨头的技术储备栈变化可以窥见一斑。以微软为例,这家科技巨头和云厂商,近期开始注重起AI软硬件结合的技术,如大模型训练等。在微软前不久的一篇训练研究中,就系统阐述了大模型在FP8精度下训练的效果...……更多
谷歌DeepMind推Imagen2;ChatGPT Plus恢复订阅;OpenAI提出用小模型监督大模型 | 本周硅谷发生了什么?
...展通用世界模型研发Mistral AI发布专家混合模型Mixtral 8x7B微软发布27亿参数基座模型Phi-2因拿到更多GPU,ChatGPT Plus重新开放订阅OpenAI首席科学家llya和ChatGPT入选Nature年度十大科学人物OpenAI推Converge 2加速器计划,参……更多
mistralai公司推出mixtral8x22b开源模型
...“6人团队,7页PPT,8亿融资”不断缔造传奇,而且在得到微软的投资之后更是进入发展快车道。该公司今天发布的Mixtral8x22B开源模型是个开源模型,官方目前放出了Torrent种子链接,文件大小为281GB。用户可以通过磁性链接直接下...……更多
惊掉下巴!被字节起诉800万实习生,拿下NeurIPS 2024最佳论文
...其实是加了payload进去,然后就可以远程执行代码,修改参数了。这种攻击方式,可以通过修改或注入恶意代码,使模型在加载时被篡改模型权重、修改训练参数或截取模型数据。根据大V「Jack Cui」猜测,这位实习生所用的大概...……更多
谷歌版贾维斯即将问世,最强Gemini 2.0加持!AI自主操控电脑时代来临
...称谷歌同类Project Jarvis预计年底亮相。AI操控电脑已成为微软、苹果等巨头,下一个发力的战场。AI接管人类电脑,就是下一个未来!几天前,Anthropic向所有人展示了,Claude 3.5自主看屏幕操作光标完成复杂任务,足以惊掉下巴。...……更多
微软被曝正自研AI大模型:5000亿个参数,与谷歌和OpenAI竞争
科技巨头微软或正在研发参数达5000亿的全新AI(人工智能)大模型,将正面叫板谷歌和OpenAI。当地时间5月6日,据外媒报道,微软正在研发一款名为MAI-1的最新AI大模型,其规模远超出微软此前推出的一些开源模型,在性能上或...……更多
Scaling Law百度最早提出!OpenAI/Claude受它启发,致谢中有Ilya
...并在训练集的更大子集(碎片)上训练这些模型的 “超参数缩减 ”版本,以观察模型的准确性如何随着训练集的大小而增长。因此针对这四个领域,机器翻译、语言建模、图像分类和语音识别,找到了他们在大型数据集上显示...……更多
超越GPT-4o!开源科研神器登场,4500万论文检索增强生成靠谱回答
...的大规模数据,并使用自定义训练的检索器、重排器和8B参数语言模型进行检索,并根据最新的科学文献内容回答问题。具体来说,OpenScholar-8B(OS-8B)系统包括以下组件:1.开放学者数据存储:包含超过4500万篇论文、以及对应的...……更多
微软连发3款Phi-3.5模型:128K上下文,首用MoE架构,部分性能超GPT-4o mini
智东西8月21日消息,今天,微软一口气甩出3款超强轻量级模型!微软本次发布的轻量级模型系列名为Phi-3.5,适合在内存和算力受限的环境中运行,均支持128k上下文长度。Phi-3.5-mini-instruct主要面向基础快速推理任务,Phi-3.5-MoE-in...……更多
LLM数学性能暴涨168%,微软14人团队力作!合成数据2.0秘诀曝光,智能体生成教学
【新智元导读】合成数据2.0秘诀曝光了!来自微软的研究人员们提出了智能体框架AgentInstruct,能够自动创建大量、多样化的合成数据。经过合成数据微调后的模型Orca-3,在多项基准上刷新了SOTA。全世界高质量数据几乎枯竭。AI...……更多
更多关于科技的资讯:
阿迪达斯“SUPERNOVA领航系列” 全新升级上市
• 全新SUPERNOVA领航系列上市,主推核心款RISE2产品升级,为日常慢跑打造,为入门跑者护航。• SUPERNOVA领航系列RISE2采用专为慢跑调校的超级泡棉DREAMSTRIKE+中底
2025-02-11 10:12:00
近日,“打工人度假的尽头是去邮轮上躺着”登上微博热搜榜。据国际邮轮协会(CLIA)数据,年轻一代正成为邮轮旅游的重要消费群体
2025-02-11 10:13:00
OPPO Find N5官宣接入DeepSeek-R1:小布语音唤醒 一句话操控
快科技2月11日消息,OPPO Find N5将于2月20日19:00正式发布,号称“全球最薄折叠屏”。今日,OPPO宣布Find N5正式接入DeepSeek-R1
2025-02-11 10:18:00
科技守护,安全同行!九测科技公交测酒仪,全力守护您的公交之旅
在繁华喧嚣的都市中,公交系统宛如城市的生命线,日复一日地输送着数以万计的乘客,连接着家的温暖与梦想的远方。然而,酒驾这一潜在的安全隐患
2025-02-11 10:18:00
阻击NVIDIA!曝RX 9000系列价格“非常犀利”:自家产品都受波及
快科技2月11日消息,根据博板堂报道,AMD即将推出的Radeon RX 9000系列显卡价格可能会非常犀利,不仅针对NVIDIA的某些型号显卡
2025-02-11 10:18:00
RTX 5090首款自制水冷头诞生:骤然降温38℃
快科技2月11日消息,迄今还没有厂商宣布为RTX 50系列适配水冷头,德国高玩Der8auer就自己动手给RTX 5090 FE公版做了一个
2025-02-11 10:18:00
新年全球爆单秘籍:来看这些出海企业如何打赢全球流量战
2024年已渐远去,留下的痕迹却值得回味:AI技术进步频频带来惊喜,社交媒体加速渗透进世界每个角落,随之而爆发的社交电商
2025-02-11 10:45:00
“数字化的展览充满未来感,非常值得一看!”春节期间,在位于江苏省南京市德基广场的德基艺术博物馆,不少市民、游客参观了当代数字艺术领军人物Beeple的全球首场个展——“Beeple
2025-02-11 10:45:00
最薄折叠屏塞进5600mAh!OPPO Find N5续航碾压iPhone 16 Pro Max
快科技2月11日消息,据OPPO官微消息,Find N5不仅做到了全球最薄,还在轻薄机身下塞进了5600mAh冰川电池
2025-02-11 10:48:00
揪心!男子玩蹦床跳进海绵池摔成9级伤残
快科技2月11日消息,据报道,35岁的陈先生在参加公司团建活动时选择了蹦床乐园作为娱乐项目。他在尝试一个炫酷的空翻动作后
2025-02-11 10:48:00
指甲月牙小、有竖纹就是不健康吗!这些真相 一定要知道
指甲不仅是手指的保护层,更是健康的“晴雨表”。它的颜色、形状、质地和生长速度,往往能透露出身体的内在状态。然而,关于指甲的“健康信号”
2025-02-11 10:48:00
超频340MHz轻轻松松!耕升RTX 5080追风OC评测:超频后性能追平RTX 4090D
一、前言:堆料合格的RTX 5080非公1月29日上市的RTX 5080最大的惊喜莫过于其强大的超频潜力,其超频后的性能甚至可以匹敌RTX 4090D
2025-02-11 10:48:00
理想L7尾窗玻璃遭醉汉砸烂:行凶过程被行车记录仪拍下
快科技2月11日消息,喝酒误事,尤其是那些喝了点酒不知道天高地厚乱撒酒疯的人。近日有理想L7女车主发布视频,称自己的爱车遭醉汉恶意破坏
2025-02-11 10:48:00
政策东风助力企业腾飞,霄云科技在闵行区茁壮成长
在上海这片充满创新活力的热土上,政策东风正为企业的成长注入强劲动力。作为分布式存储领域的佼佼者,上海霄云信息科技有限公司(以下简称“霄云科技”)在闵行区政府的政策支持和银行的金融助力下茁壮成长
2025-02-11 11:00:00
月圆人静好,降噪耳机少不了!元宵佳节,静享专属好时光
元宵节,是农历新年后的第一个月圆之夜,象征着团圆、美满和希望。大街小巷张灯结彩,热闹非凡,人们赏花灯、猜灯谜、吃元宵,沉浸在浓浓的节日氛围中
2025-02-11 11:04:00