• 我的订阅
  • 头条热搜
微软论文一张截图,曝出GPT-3.5仅有200亿参数?AI圈巨震,网友大呼太离谱!
新智元报道编辑:编辑部【新智元导读】微软最近一篇论文爆料,GPT-3.5的参数量只有20B,远远小于之前GPT-3公布175B。网友表示,ChatGPT能力似乎「配得上」这个体量?GPT-3.5只有200亿参数?今天,大模型圈都被微软论文中的一纸...……更多
马斯克xAI发布首款大模型;苹果发布M3芯片;ChatGPT被曝仅200亿参数|本周硅谷发生了什么?
...3nm工艺加持的“M3芯片”,顺带展示了搭载M3的MacBook Pro。微软的一篇论文则意外曝光ChatGPT实际参数仅有200亿,引起一片哗然。大模型这边,马斯克旗下众星云集的xAI发布了首款大模型“Gork”,与其他模型不同,Grok不仅能通过X...……更多
OpenAI举办“AI春晚”;李开复大模型破纪录 | 图灵周报
...A股、美股的“超导概念股”都曾受影响,大幅波动。 03微软以安全问题为由限制员工访问ChatGPT图源:Pixabay在当地时间周四的一段时间内,微软员工被禁止使用OpenAI产品ChatGPT。微软在内部网站上的最新消息中表示,“出于安全...……更多
微软发布旗下最小语言模型phi-2
11月17日消息,微软Ignite2023大会已拉开帷幕,微软在本次活动中发布了旗下最小的语言模型Phi-2,共有27亿参数,相比较此前版本有明显提升。注:微软于今年6月发布Phi-1,只有13亿代码,适用于QA问答、聊天格式和代码等等场景...……更多
挑战Scaling Law,Meta发布移动端350M小模型MobileLLM,性能比肩7B LLaMA-v2
...是唯一的路径,模型「以小搏大」的故事不断上演。先有微软更新;后有谷歌用。硬件方面,我们看到了AI功能逐渐与电子产品进行深度集成。比如微软臭名昭著的Recall功能,正是他们的重要组成部分;苹果也在Apple Intelligence的...……更多
科学家提出情景学习新范式,让学霸大模型向学弱大模型输送能力
...、低算力需求的模型,并取得了一定成果。2023 年 6 月,微软发布 13 亿参数的语言模型 Phi,同年 9 月 Phi-2 的参数扩大到 27 亿。据报道,微软的“小模型”已经在金融客户和银行客户中测试。此后,国内厂商也逐步跟进小模型的...……更多
马斯克打脸OpenAI!全球最大模型Grok-1开源
...利性开源组织创建的,目的是抗衡谷歌。但此后它变成了微软控制下的一家闭源、以利润为导向的公司。“OpenAI已经成为一家利润最大化的公司……这根本不是他的初衷。”马斯克还谴责OpenAI遭到微软的控制。他表示,世界需要...……更多
本周硅谷发生了什么?|苹果Vision Pro正式开售;Neuralink完成人类脑机接口植入;字节Coze国内版上线;
...人助手苹果发布2024年Q1财报,库克称AI是“巨大的机会”微软、Alphabet等AI相关企业总市值一天蒸发1.3万亿元360 AI搜索移动App已上线Sam Altman弟弟的风投公司募资1.5亿美元,将重点关注AI初创人形机器人初创公司Figure AI与微软、OpenAI...……更多
o1突发内幕曝光?谷歌更早揭示原理 大模型光有软件不存在护城河
...现在英伟达直接掌控谁能拥有更多算力。那么如果谷歌/微软开发出了效果更好的定制芯片,情况又会如何呢?o1突发内幕曝光?谷歌更早揭示原理,大模型光有软件不存在护城河值得一提的是,前段时间OpenAI首颗芯片曝光,将采...……更多
语音克隆达到人类水平,微软全新VALL-E 2模型让DeepFake堪比配音员
【新智元导读】继去年初的第一代VALL-E模型之后,微软最近又上新了VALL-E 2模型,标志着第一个在合成语音稳健性、相似度、自然程度等方面达到人类水平的文本到语音模型。最近,微软发布了零样本的文本到语音(TTS)模型VAL...……更多
苹果300亿参数大模型首亮相,还买了家AI公司|焦点分析
...下来,苹果的重心都在加速大模型进程上,来追赶谷歌、微软、亚马逊。目前,整体大模型进展,苹果对外的信息较少,看上去已经落后其竞争对手一大截。在年初的苹果季度财报电话会议上,蒂姆·库克表示,苹果正在投入大...……更多
全球市值第一背后的AI算力焦虑
...。本月内,人工智能芯片公司英伟达市值先后超过苹果、微软,登顶全球市值第一的公司。而在这个“第一”背后,是众多大模型厂商的“算力焦虑”。英伟达股价截图当算力成为人工智能的关键当地时间6月18日美股收盘,英伟...……更多
微软Win11中发现国产开源大模型!RWKV官方:没给钱啊?现在赶趟
微软正尝试在Office中集成国产开源大模型RWKV!RWKV官方甚至直接发了个推文表示:RWKV.cpp,现已在全球五亿系统中部署。之所以这么说,是因为他们发现最新版Windows 11系统的Office文件夹中有以rwkv命名的DLL文件,包含GPU、CPU版本...……更多
OpenAI掀小模型血战!苹果DCLM强势登场,碾压Mistral 7B全开源
...越好。其实一直以来,AI社区中,并不缺少小模型,比如微软Phi系列模型多次迭代,以及6月末谷歌刚刚更新的Gemma 2 7B。这周,OpenAI突然发布GPT-4o mini,Mistral AI联手英伟达发布Mistral NeMo,HuggingFace的SmoLLM等小模型的发布,为小模……更多
Meta大模型LLaMA 3即将登场,参数量或达1400亿
...把子”,Meta在AI基础设施上的投入亦不可小觑,目前只有微软拥有与之相当的计算能力储备。Meta发布的一篇技术博客称,到2024年底,该公司将再购350000个英伟达H100GPU,算上其他GPU,其算力相当于近600000个H100。LLaMA3即将登场参...……更多
掰开安卓手机 满屏都是三个字:大模型
...,从大模型厂商巨头的技术储备栈变化可以窥见一斑。以微软为例,这家科技巨头和云厂商,近期开始注重起AI软硬件结合的技术,如大模型训练等。在微软前不久的一篇训练研究中,就系统阐述了大模型在FP8精度下训练的效果...……更多
谷歌DeepMind推Imagen2;ChatGPT Plus恢复订阅;OpenAI提出用小模型监督大模型 | 本周硅谷发生了什么?
...展通用世界模型研发Mistral AI发布专家混合模型Mixtral 8x7B微软发布27亿参数基座模型Phi-2因拿到更多GPU,ChatGPT Plus重新开放订阅OpenAI首席科学家llya和ChatGPT入选Nature年度十大科学人物OpenAI推Converge 2加速器计划,参……更多
mistralai公司推出mixtral8x22b开源模型
...“6人团队,7页PPT,8亿融资”不断缔造传奇,而且在得到微软的投资之后更是进入发展快车道。该公司今天发布的Mixtral8x22B开源模型是个开源模型,官方目前放出了Torrent种子链接,文件大小为281GB。用户可以通过磁性链接直接下...……更多
微软被曝正自研AI大模型:5000亿个参数,与谷歌和OpenAI竞争
科技巨头微软或正在研发参数达5000亿的全新AI(人工智能)大模型,将正面叫板谷歌和OpenAI。当地时间5月6日,据外媒报道,微软正在研发一款名为MAI-1的最新AI大模型,其规模远超出微软此前推出的一些开源模型,在性能上或...……更多
微软连发3款Phi-3.5模型:128K上下文,首用MoE架构,部分性能超GPT-4o mini
智东西8月21日消息,今天,微软一口气甩出3款超强轻量级模型!微软本次发布的轻量级模型系列名为Phi-3.5,适合在内存和算力受限的环境中运行,均支持128k上下文长度。Phi-3.5-mini-instruct主要面向基础快速推理任务,Phi-3.5-MoE-in...……更多
LLM数学性能暴涨168%,微软14人团队力作!合成数据2.0秘诀曝光,智能体生成教学
【新智元导读】合成数据2.0秘诀曝光了!来自微软的研究人员们提出了智能体框架AgentInstruct,能够自动创建大量、多样化的合成数据。经过合成数据微调后的模型Orca-3,在多项基准上刷新了SOTA。全世界高质量数据几乎枯竭。AI...……更多
本周硅谷发生了什么?| 高通第三代骁龙8;谷歌20亿美元追投Anthropic;联想拿出能跑大模型个人PC
...子轮融资。本轮融资由 Gradient Ventures、TR Ventures、Nvidia和微软Azure AI副总裁Misha Bilenko参投。资金将用于加强CentML 的产品开发和研究工作,同时扩大初创公司的工程团队和分布在美国和加拿大的30人员工队伍。CentML是一家开发工具……更多
Llama 4训练已开启!Meta科学家最新采访,揭秘Llama 3.1是如何炼成的
...目。 以下是采访内容的节选。Llama 3.1研发思路如何决定参数规模其实LLM的参数规模的选择需要考虑多种因素,包括scaling law、训练时间、GPU和硬件的约束等等。而且,不能只考虑Meta所用的硬件,还有整个AI社区,并不是每个人...……更多
微软为msn天气引入ai预测模型
5月5日消息,微软为MSN 天气引入一项最新的天气预测模型,该模型基于微软旗下Start团队近日在 arXiv 发表的论文,结合了5种不同的人工智能模型和3种深度学习架构,据称能够准确预测 30 天内天气预报,IT之家查询论文信息,整...……更多
谷歌立秋新品发布会:Pixel 9系列整齐亮相 还有一些AI新花样
...截图内容,并与日历等app进行联动操作。这个功能与之前微软给Windows做的Recall功能非常像,但区别在于微软的功能因为“时时刻刻在截图”,被视为侵犯隐私而“回炉重造”,谷歌的功能只分析用户手动进行的截图。谷歌还发...……更多
微软宣布可以提前30天预测天气
...发团队\"世界上最准确的全球天气预报提供商\"的称号。微软开始团队似乎并不满足于此。本周,微软宣布该团队提出了一种更准确的方法,可以提前30天预测天气。在必应博客上的一篇文章中,微软称其\"Start\"团队在康奈尔大学...……更多
手机跑大模型提速4-5倍!微软亚研院开源新技术,有CPU就行
...,性能甚至超过NPU/GPU!没错,为了优化模型端侧部署,微软亚洲研究院提出了一种新技术——T-MAC。这项技术主打性价比,不仅能让端侧模型跑得更快,而且资源消耗量更少。咋做到的??在CPU上高效部署低比特大语言模型一般...……更多
“三巨头”杀疯了!开盘15分钟,微软、苹果、英伟达轮番角逐市值“一哥”!
...纳指涨0.05%,标普500指数跌0.10%。当天,美股“三巨头”微软、苹果、英伟达开盘后,在15分钟内上演了“市值第一名争夺战”。开盘不久,英伟达和微软股价冲高,其间,英伟达市值甚至一度超越苹果,并距离“股王”微软仅差...……更多
NeurIPS 2024评审结果公布!AI大佬晒出成绩单,又是被吐槽最严重的一届
...被视为一种正则化的方法,但效果非常微妙,即使在过度参数化的情况下也是如此。而对大模型而言,权重衰减则扮演者完全不同的角色。与最初一版arXiv论文相比,研究人员对其进行了很多更新。Andriushchenko表示,自己非常喜...……更多
百倍提升7B模型推理能力!颜水成团队携手新加坡南洋理工大学发布Q*算法
...,研究团队提出了Q*模型算法,帮助Llama-2-7b等小模型达到参数量比其大数十倍、甚至上百倍模型的推理能力,使模型性能迎来惊人提升。自OpenAI的Q*项目曝光后,业内相关讨论始终层出不穷。据现有信息汇总,Q*项目被视作OpenAI...……更多
更多关于科技的资讯:
【观点摘登】唐方成、靳晓曼:体现用户需求的创新导向作用
随着创新开放性的日益增强和知识生产模式的发展演变,用户需求在推动科技创新、实现价值共创共享方面的作用日益突出,以识别、辨析
2025-01-29 18:18:00
本文转自:人民网人民网记者 赵竹青2025年的春节前夕,当大街小巷挂满红灯笼、家家户户忙着备年货时,国产人工智能大模型DeepSeek在海内外突然“爆火”
2025-01-29 17:42:00
大年初一,中国记协采访了DeepSeek
亲爱的粉丝们:近期,DeepSeek成为关注焦点。为了帮助大家进一步了解DeepSeek,我们与它进行了一次简短对话,希望对大家的工作有所助益(因海报容量有限
2025-01-29 16:44:00
1月28日,深度求索(DeepSeek)官网显示,其线上服务受到大规模恶意攻击,谭主向奇安信安全专家咨询并独家了解到,DeepSeek这次受到的网络攻击,IP地址都在美国。来源
2025-01-29 15:42:00
精致餐饮品牌推抖音“年夜饭”套餐,解锁“场景营销”新思路
春节前夕,年夜饭销售紧俏,主打高品质的“精致餐饮”备受欢迎。为满足消费需求,抖音生活服务联合大董烤鸭、紫薇美力集团旗下餐饮品牌鲁采LU STYLE
2025-01-29 08:40:00
2025贺新春瓣瓣同心京津冀 欢欢喜喜过大年大年初一,天津的古文化街年味浓郁。一系列新春活动,吸引天南海北的游客前来逛街赏景
2025-01-29 09:09:00
厦门网讯(厦门日报记者 朱道衡)春节来鼓浪屿要怎么玩?一天之内能否逛完,只有两个小时该怎么玩?鼓浪屿景点众多,游客该如何串联
2025-01-29 09:37:00
阿里云首次亮相总台春晚,云技术支持全球观众看直播
1月28日晚,阿里云首次亮相中央广播电视总台蛇年春晚,云技术支持全球观众观看春晚直播。作为总台春晚云计算AI独家合作伙伴
2025-01-29 13:18:00
美国科技巨头“收割者”!国产DeepSeek干掉英伟达4.3万亿市值
快科技1月28日消息,临近春节,中国人工智能公司DeepSeek突然爆火,其发布的DeepSeek-R1大模型性能上比肩OpenAI o1
2025-01-28 09:06:00
英伟达回应股价遭DeepSeek暴击:DeepSeek是出色的AI进步
快科技1月28日消息,日前,美股收盘英伟达股价暴跌17%,市值一夜蒸发5888.62亿美元(约合人民币4.27万亿元)
2025-01-28 10:07:00
王晶监制电影《笑傲江湖》上线爱优腾:张雨绮版东方不败来了
快科技1月28日消息,今日,电影《笑傲江湖》在腾讯视频、爱奇艺、优酷三大平台上线,同时发布“春满江湖”版海报。海报中,东方不败(张雨绮饰)侧卧雪地
2025-01-28 10:07:00
7月11日上映!DC《超人》新预告发布:只身大战反派、怪兽
快科技1月28日消息,DC全新的《超人》发布了新版预告,展示了超人翱翔于冰原之上、只身大战怪兽的场景,卢瑟等反派人物也一一登场
2025-01-28 10:37:00
快来看哪个更牛!网友热捧DeepSeek创意写春联
快科技1月28日消息,据媒体综合报道,近日,随着新春佳节的临近,一股创意写春联的热潮正在网络上悄然兴起。而在这场创意盛宴中
2025-01-28 10:37:00
李子柒将首次亮相央视《春晚》:讲述服饰的非遗故事
快科技1月28日消息,据央视频官方透露,今晚李子柒将首次亮相央视《春晚》,并担任“春晚体验官”,讲述演出服饰上的非遗故事
2025-01-28 11:07:00
育碧再次大裁员!185名员工被裁 英国工作室永久关闭
据eurogamer报道,育碧近日宣布,将关闭位于英国莱明顿的工作室,并裁减公司185个职位。部分莱明顿工作的员工将通过远程合同继续留职
2025-01-28 11:07:00