• 我的订阅
  • 头条热搜
专家模型不要专家并行!微软开源MoE新路径
...和数学表现出色。继Phi家族之后,微软又开源了新的混合专家大模型——GRIN MoE。与Phi-3.5同样的个头(16 * 3.8B),却采用了截然不同的训练方法。这个「不走寻常路」如果写个太长不看版,那就是两句话:1. 使用新一代SparseMixer...……更多
系统级玩家微软、苹果先后出牌,端侧大模型路径清晰了?
...建议,这相当于在电脑中内置了一个永远不厌其烦的游戏专家,而且所能提供的建议是开放式的,远远超出了只有固定剧本的NPC(非玩家控制角色)概念。与微软形成鲜明对比,苹果则显然没有打造杀手级应用的执念。Apple Intell...……更多
微软连发3款Phi-3.5模型:128K上下文,首用MoE架构,部分性能超GPT-4o mini
...示例的MMLU测试中击败了GPT-4o mini。这是微软首次使用混合专家模型架构。这一模型系列中最小的Phi-3.5-mini-instruct在长上下文代码理解任务以明显优势击败Llama-3.1-8B-instruct和Mistral-7B-instruct,而其参数规模还不到Llama……更多
谷歌和微软两位“印度老乡”CEO,正面硬刚
...,Pichai还讲道:“在57项测试中,Gemini的表现有89%与人类专家相当。这是第一个达到这一标准的模型。”言外之意,Gemini已然超过了其最大竞争对手、OpenAI发布的GPT-4。而后者是在其“印度老乡”Satya Nadella掌舵的微软投资支持下...……更多
微软的AI赌局,谷歌为何没敢接
...,也可以叫做‘真正的语义搜索’。”一位百度搜索技术专家告诉虎嗅,隐式搜索不再是单纯的字面搜索,而是利用AI分析用户关键词语的深层意思。例如,搜索“现实版钢铁侠”,得到的搜索结果就都是马斯克相关的内容。此...……更多
大模型新趋势之MoE:现状、挑战及研究方向
...涵、优势、发展历程及主要玩家MoE(MixtureofExperts,混合专家模型)是一种用于提升深度学习模型性能和效率的技术架构。其主要由一组专家模型和一个门控模型组成,核心思想是在处理任务时只激活部分专家模型,并通过门控...……更多
...力,业内一直有不同看法。相比马斯克的乐观预测,不少专家认为这一时间还要再晚一些。谷歌旗下人工智能公司“深层思维”的联合创始人德米斯·哈萨比斯判断,通用人工智能或在2030年实现。韩国首尔大学电子与计算机工程...……更多
AI大模型产业如何突破?专家学者企业齐聚探讨发展新模式新路径
活动现场。主办方供图华龙网讯(记者 梁浩楠)11月15日,重庆市人工智能产业发展暨大模型场景应用研讨沙龙在两江新区成功举办。来自科研院所、高校、企业等70多位嘉宾,共同探讨和分享人工智能大模型在各领域落地应用...……更多
微软研究人员正在测试其他ai模型
...信赖且可以有效使用的”。我们可以向这个领域投入许多专家和资源,因此我们认为自己可以帮助阐明“应该如何负责任地使用新型AI技术”的方法,并使其他人也能够做到这一点。从技术角度来讲,AI幻觉是一种“缺乏事实依...……更多
“大模型”时代 路凯智行如何Rock AI
...ckAI路凯智行联合创始人兼CTO那崇宁博士是AI大模型领域的专家,长期从事相关领域的研究和应用。早在2018年谷歌推出BERT的时候,那崇宁博士就断定未来5年在自然语言处理领域内会实现一个通用的人工智能,只会在自然语言处理...……更多
传微软向Inflection AI支付6.5亿美元,获其AI模型授权!美国监管机构加大审查
...交易类似于“收购雇佣”,但并非收购。一些法律和行业专家指出,微软如果收购Inflection可能引发美国监管机构的反垄断担忧,美国监管机构正越来越多地审查大型科技公司的人工智能投资和合作伙伴关系。据一位知情人士透...……更多
马斯克打脸OpenAI!全球最大模型Grok-1开源
...Rust的自定义训练堆栈、从头开始训练的3140亿参数的混合专家(MOE)模型,远超OpenAI的GPT模型。而此次开源的模型是是Grok-1预训练阶段的原始基础模型,没有针对任何特定应用(例如对话)进行微调。对此,英伟达科学家Jimfan评...……更多
AI PC,联想Ready for PC | 焦点分析
...还能跑得好。”郑爱国对36氪表示,“目前AMD、英特尔的专家都在我们办公室,和我们的专家联合对他们最新的平台和芯片调优。” 当然,Framework仍然是软硬件磨合期的产物。“未来,下载安装即用的模式也一定是AI软件在PC上...……更多
大厂 XR 业务线“躁动”,AIGC 能救场吗?
...觉大模型增强认知能力、多模态大模型提高创作能力。有专家表明,大模型不仅仅有针对语言的还有针对多模态的,未来还应该有针对元宇宙的,比如空间计算大模型,现在市面上基本还没有,应该是未来两三年相关公司需要去...……更多
谷歌DeepMind推Imagen2;ChatGPT Plus恢复订阅;OpenAI提出用小模型监督大模型 | 本周硅谷发生了什么?
...量、逼真的人工智能图像生成器。Mistral AI发布Mixtral 8x7B专家混合模型,表现优越且推理速度更快。由于获得更多GPU,ChatGPT Plus重新开放订阅,提供更好的用户体验。OpenAI首席科学家Ilya Sutskever入选Nature年度十大科学人物,表彰其...……更多
OpenAI断供API 套壳公司何去何从
...服务、零成本SDK迁移工具、大模型业务迁移与使用的免费专家指导,覆盖大模型从开发到应用的全生命周期流程。腾讯云也在6月25日发布大模型迁移方案,新迁移企业用户可免费获得腾讯混元大模型1亿Tokens。目前,腾讯云提供...……更多
收到关注函依然连续涨停,中科金财AI概念到底有多硬?
...开业务合作研讨会。在会上,中科金财团队与微软中国的专家就Sora在国内银行、电商、网剧等垂类领域的多场景应用进行了广泛讨论。令市场关注的是,该公司称“微软专家表示,基于双方的友好合作,在OpenAI将Sora商用化能力...……更多
200余位顶尖学者和产业专家共议人工智能热点问题
...在中关村展示中心开幕。200余位人工智能顶尖学者和产业专家,围绕人工智能关键技术路径和应用场景等问题展开主题演讲和尖峰对话。6月14日,第六届北京智源大会在中关村展示中心开幕。中国经济网记者马常艳 摄科学技术...……更多
微软、英伟达纷纷押注小模型,大模型不香了?
...州波士顿,是一所顶尖的私立研究型大学)语言模型研究专家Aaron Mueller指出,扩展参数数量并非提高模型性能的唯一途径,使用更高质量的数据训练也可以产生类似效果。OpenAI首席执行官阿尔特曼在4月的一次活动中表示,他相...……更多
微软论文一张截图,曝出GPT-3.5仅有200亿参数?AI圈巨震,网友大呼太离谱!
....5在技术和其他方面有着什么样的联系?GPT-3.5是一个个小专家模型的集成还是一个通才模型?是通过更大模型的蒸馏还是更大数据训练?这些问题的答案只能等到真正开源的时候才能揭晓了。 ……更多
...enAI和StableDiffusion等。有些AI伦理学家担心,在信任和安全专家能够研究这些风险之前,大型科技公司匆忙进入市场可能会让数十亿人面临潜在的危害,比如分享不准确的信息、生成假图像或让学生有能力在学校考试中作弊。该领...……更多
谷歌王者归来?最新推出的大模型到底有多强,能否挑战GPT-4
...在MMLU的得分率达到90.0%,是第一个在MMLU测试中超过人类专家的模型。Gemini在MMLU的得分率首次超过人类专家。来源:官方视频 Gemini包括一套三种不同规模的模型:Gemini Ultra是最大、功能最强大的类别,被定位为GPT-4的竞争对手;...……更多
深度剖析:谷歌、微软等AI巨头承诺的“自愿监管”做到了吗?
...其进行内部和外部安全测试。这项测试的一部分将由独立专家执行,旨在防范一些最重要的人工智能风险来源,例如生物安全、网络安全以及更广泛的社会影响。所有公司(不包括 Inflection,该公司选择不予置评)均表示,他们...……更多
「海纳AI」完成数千万元A轮融资,为企业提供AI面试服务|36氪首发
...海纳产品时,将几百组AI对候选人的打分,与企业内部HR专家的打分相比对,准确度达到97.76%。其中优秀组(即70分以上)和较差组(即30分以下)的打分准确度达到100%。之所以能做到高准确度,首先是在于背后的AI技术和海量优...……更多
苹果300亿参数大模型首亮相,还买了家AI公司|焦点分析
...建筑材料”和“施工方法”。 模型架构上,使用了混合专家(Mixture of Experts, MoE)架构是MM1的亮点之一,苹果探索发现,在模型的前馈网络层中使用MoE架构,可以有效地扩展模型的容量而不牺牲推理速度。我们可以将MoE架构理...……更多
蚂蚁井贤栋:通过专业智能体的深度连接,AI会像互联网一样带来服务的代际升级
...通过知识引擎为大模型提供“专业教材”,让大模型具备专家知识水平。垂直领域、高质量的数据往往以多种模态存在,体系庞杂,比较分散,对隐私保护和资产价值保护的要求高,很难直接“喂给”通用大模型。井贤栋介绍,...……更多
回顾GPT大模型2023这一年,5大顶级公司预测2024年AI产品
...,就连那些原本习惯于“慢慢”打磨产品的大洋彼岸的AI专家们也进入了“满负荷”状态。梁正表示:“在谷歌、微软或OpenAI的办公室里,你能感受到他们的工作节奏至少比之前快了两倍。”这一切都是因为以ChatGPT为代表的大语...……更多
Pika爆火,但AI视频还没到「GPT时刻」;首个GPT-4驱动的人形机器人;微软小模型击败大模型丨AI新零售早报
...转换为机器人动作。(来源:“量子位”微信公众号)《微软小模型击败大模型:27亿参数,手机就能跑》微软发布了一个仅有27亿参数的小型模型Phi-2,它在多数常识推理、语言理解、数学和编码任务上超越了其他大型模型。尽...……更多
李彦宏称开源赶不上闭源?Meta发布最强开源模型,马斯克评价“还不错”
...天工3.0”基座开源大模型,成为全球最大的开源MoE(混合专家)大模型。不过,在最新的采访中,扎克伯格表示,Meta的目标不是与开源模型竞争,而是要超过所有人,打造最领先的人工智能。他提到,今年晚些时候发布的Llama 3-...……更多
【科技早报】联想3年投10亿美元“砸”人工智能;摩托罗拉展示可弯曲概念手机
...总裁曹鹏:京东80%的系统都完成了国产化替代4.全球24名AI专家联合发文:至少三分之一研发预算要用于确保安全5.杭州宣布禁止直播带货?杭州市商务局回应!前9月全国直播电商销售额近2万亿【大厂要闻】联想3年投10亿美元“...……更多
更多关于科技的资讯:
厦门抢占具身智能产业新赛道
第十四届中国创新创业大赛——首届具身智能专业赛成果在厦发布。厦门网讯(文/厦门日报记者 吴晓菁 通讯员 高菲 康潇潇 图/厦门日报记者 卢剑豪)昨日的厦门国际会议中心酒店
2025-09-26 08:38:00
具身智能孵化加速器在厦正式揭牌第十四届中国创新创业大赛首届具身智能专业赛昨日发布成果东南网9月26日讯(海峡导报记者 黄奕琳)昨日
2025-09-26 10:17:00
全国26家实验室参与!由雷沃支持的这场“田间论剑”举行
日前,2025年农业机械检测实验室间比对活动在山东潍坊举行。该活动由中国农业机械化协会主办、农机鉴定检测分会承办、潍柴雷沃智慧农业协助开展
2025-09-26 07:05:00
人们依托脑力开展思维活动,而人工智能则依赖算力进行“思考”。“十四五”期间,中国在算力建设上的投入力度相当大,发展成效显著
2025-09-26 07:31:00
王灿:以笔为犁 深耕“城事”
王灿。 臧翔宇 摄□胡欣玥芮天舒祁绩外出采访结束后,王灿轻轻推开南京报业传媒集团融媒中心时政新闻部的门。工位上屏幕亮起
2025-09-26 07:41:00
560余家企业携4.8万余个岗位来东大揽才“AI+”岗位热度不减,实战经验是核心指标□南京日报/紫金山新闻记者何洁 实习生黄佳琪杨久久9月25日
2025-09-26 07:41:00
厦门网讯(厦门日报记者 沈彦彦 应洁)明日,厦门岛外首家永辉“胖东来模式”调改店将在杏林万科里正式开业。作为厦门第二家
2025-09-25 08:53:00
9月24日,“青春华章・向西而歌”网络大思政课活动上,西安交通大学微电子学院集成电路工程专业博士研究生魏上杰介绍,集成电路是“国之重器”的“心脏”
2025-09-25 09:44:00
杜建英一持股公司被吊销,名下关联60家企业其中8家已注销或吊销
企查查APP显示,近日,杜建英持股的杭州芸台文化创意有限公司被吊销,原因是公司成立后无正当理由超过6个月未开业,或者开业后自行停业连续6个月以上
2025-09-25 11:20:00
雷军“五十来岁正是闯的年纪”,出生于1969年,和余承东、陈明永同龄
9月25日,雷军发文:这5年,小米一路摸爬滚打、跌宕起伏,依然启动了造车、芯片和高端化……没什么好犹豫的,五十来岁,正是闯的年纪
2025-09-25 11:20:00
贵州国企“智”变攻坚推动数实融合
赤水河畔,国内首台高温复合型仿生压曲机稳定运转,物联网实时优化发酵参数……这场酿酒的“数字革命”,也是贵州习酒公司以全链数智革新推动产业跃迁的生动缩影
2025-09-25 11:57:00
近8成职场人每周都会用AI工具 “人机互信”仍在磨合期
在人工智能技术日臻成熟的2025年,AI已是深度融入职场生态的“数字同事”,在AI辅助下的2025年职场迎来了哪些变化
2025-09-25 13:30:00
9月23日下午,2025北京文化论坛“破界共生:科技激发文化原创力”平行论坛在京举办。本场论坛由中国文联、中国作协指导
2025-09-25 13:38:00
国庆前夕,房山区物美超市“胖改店”、居然之家房山店、瑞莱广场分别于9月26日、27日、28日开业,进一步丰富了房山区消费场景
2025-09-25 13:38:00
OPPO杭州研发总部项目易主,山子高科接手公司95%股权
企查查APP显示,近日,负责OPPO项目的杭州逗酷软件科技有限公司发生工商变更,新增山子高科旗下浙江山子超影科技有限公司为股东
2025-09-25 16:25:00