• 我的订阅
  • 头条热搜
专家模型不要专家并行!微软开源MoE新路径
...和数学表现出色。继Phi家族之后,微软又开源了新的混合专家大模型——GRIN MoE。与Phi-3.5同样的个头(16 * 3.8B),却采用了截然不同的训练方法。这个「不走寻常路」如果写个太长不看版,那就是两句话:1. 使用新一代SparseMixer...……更多
系统级玩家微软、苹果先后出牌,端侧大模型路径清晰了?
...建议,这相当于在电脑中内置了一个永远不厌其烦的游戏专家,而且所能提供的建议是开放式的,远远超出了只有固定剧本的NPC(非玩家控制角色)概念。与微软形成鲜明对比,苹果则显然没有打造杀手级应用的执念。Apple Intell...……更多
微软连发3款Phi-3.5模型:128K上下文,首用MoE架构,部分性能超GPT-4o mini
...示例的MMLU测试中击败了GPT-4o mini。这是微软首次使用混合专家模型架构。这一模型系列中最小的Phi-3.5-mini-instruct在长上下文代码理解任务以明显优势击败Llama-3.1-8B-instruct和Mistral-7B-instruct,而其参数规模还不到Llama……更多
谷歌和微软两位“印度老乡”CEO,正面硬刚
...,Pichai还讲道:“在57项测试中,Gemini的表现有89%与人类专家相当。这是第一个达到这一标准的模型。”言外之意,Gemini已然超过了其最大竞争对手、OpenAI发布的GPT-4。而后者是在其“印度老乡”Satya Nadella掌舵的微软投资支持下...……更多
微软的AI赌局,谷歌为何没敢接
...,也可以叫做‘真正的语义搜索’。”一位百度搜索技术专家告诉虎嗅,隐式搜索不再是单纯的字面搜索,而是利用AI分析用户关键词语的深层意思。例如,搜索“现实版钢铁侠”,得到的搜索结果就都是马斯克相关的内容。此...……更多
大模型新趋势之MoE:现状、挑战及研究方向
...涵、优势、发展历程及主要玩家MoE(MixtureofExperts,混合专家模型)是一种用于提升深度学习模型性能和效率的技术架构。其主要由一组专家模型和一个门控模型组成,核心思想是在处理任务时只激活部分专家模型,并通过门控...……更多
...力,业内一直有不同看法。相比马斯克的乐观预测,不少专家认为这一时间还要再晚一些。谷歌旗下人工智能公司“深层思维”的联合创始人德米斯·哈萨比斯判断,通用人工智能或在2030年实现。韩国首尔大学电子与计算机工程...……更多
AI大模型产业如何突破?专家学者企业齐聚探讨发展新模式新路径
活动现场。主办方供图华龙网讯(记者 梁浩楠)11月15日,重庆市人工智能产业发展暨大模型场景应用研讨沙龙在两江新区成功举办。来自科研院所、高校、企业等70多位嘉宾,共同探讨和分享人工智能大模型在各领域落地应用...……更多
微软研究人员正在测试其他ai模型
...信赖且可以有效使用的”。我们可以向这个领域投入许多专家和资源,因此我们认为自己可以帮助阐明“应该如何负责任地使用新型AI技术”的方法,并使其他人也能够做到这一点。从技术角度来讲,AI幻觉是一种“缺乏事实依...……更多
“大模型”时代 路凯智行如何Rock AI
...ckAI路凯智行联合创始人兼CTO那崇宁博士是AI大模型领域的专家,长期从事相关领域的研究和应用。早在2018年谷歌推出BERT的时候,那崇宁博士就断定未来5年在自然语言处理领域内会实现一个通用的人工智能,只会在自然语言处理...……更多
传微软向Inflection AI支付6.5亿美元,获其AI模型授权!美国监管机构加大审查
...交易类似于“收购雇佣”,但并非收购。一些法律和行业专家指出,微软如果收购Inflection可能引发美国监管机构的反垄断担忧,美国监管机构正越来越多地审查大型科技公司的人工智能投资和合作伙伴关系。据一位知情人士透...……更多
马斯克打脸OpenAI!全球最大模型Grok-1开源
...Rust的自定义训练堆栈、从头开始训练的3140亿参数的混合专家(MOE)模型,远超OpenAI的GPT模型。而此次开源的模型是是Grok-1预训练阶段的原始基础模型,没有针对任何特定应用(例如对话)进行微调。对此,英伟达科学家Jimfan评...……更多
AI PC,联想Ready for PC | 焦点分析
...还能跑得好。”郑爱国对36氪表示,“目前AMD、英特尔的专家都在我们办公室,和我们的专家联合对他们最新的平台和芯片调优。” 当然,Framework仍然是软硬件磨合期的产物。“未来,下载安装即用的模式也一定是AI软件在PC上...……更多
大厂 XR 业务线“躁动”,AIGC 能救场吗?
...觉大模型增强认知能力、多模态大模型提高创作能力。有专家表明,大模型不仅仅有针对语言的还有针对多模态的,未来还应该有针对元宇宙的,比如空间计算大模型,现在市面上基本还没有,应该是未来两三年相关公司需要去...……更多
谷歌DeepMind推Imagen2;ChatGPT Plus恢复订阅;OpenAI提出用小模型监督大模型 | 本周硅谷发生了什么?
...量、逼真的人工智能图像生成器。Mistral AI发布Mixtral 8x7B专家混合模型,表现优越且推理速度更快。由于获得更多GPU,ChatGPT Plus重新开放订阅,提供更好的用户体验。OpenAI首席科学家Ilya Sutskever入选Nature年度十大科学人物,表彰其...……更多
200余位顶尖学者和产业专家共议人工智能热点问题
...在中关村展示中心开幕。200余位人工智能顶尖学者和产业专家,围绕人工智能关键技术路径和应用场景等问题展开主题演讲和尖峰对话。6月14日,第六届北京智源大会在中关村展示中心开幕。中国经济网记者马常艳 摄科学技术...……更多
OpenAI断供API 套壳公司何去何从
...服务、零成本SDK迁移工具、大模型业务迁移与使用的免费专家指导,覆盖大模型从开发到应用的全生命周期流程。腾讯云也在6月25日发布大模型迁移方案,新迁移企业用户可免费获得腾讯混元大模型1亿Tokens。目前,腾讯云提供...……更多
收到关注函依然连续涨停,中科金财AI概念到底有多硬?
...开业务合作研讨会。在会上,中科金财团队与微软中国的专家就Sora在国内银行、电商、网剧等垂类领域的多场景应用进行了广泛讨论。令市场关注的是,该公司称“微软专家表示,基于双方的友好合作,在OpenAI将Sora商用化能力...……更多
微软、英伟达纷纷押注小模型,大模型不香了?
...州波士顿,是一所顶尖的私立研究型大学)语言模型研究专家Aaron Mueller指出,扩展参数数量并非提高模型性能的唯一途径,使用更高质量的数据训练也可以产生类似效果。OpenAI首席执行官阿尔特曼在4月的一次活动中表示,他相...……更多
微软论文一张截图,曝出GPT-3.5仅有200亿参数?AI圈巨震,网友大呼太离谱!
....5在技术和其他方面有着什么样的联系?GPT-3.5是一个个小专家模型的集成还是一个通才模型?是通过更大模型的蒸馏还是更大数据训练?这些问题的答案只能等到真正开源的时候才能揭晓了。 ……更多
谷歌王者归来?最新推出的大模型到底有多强,能否挑战GPT-4
...在MMLU的得分率达到90.0%,是第一个在MMLU测试中超过人类专家的模型。Gemini在MMLU的得分率首次超过人类专家。来源:官方视频 Gemini包括一套三种不同规模的模型:Gemini Ultra是最大、功能最强大的类别,被定位为GPT-4的竞争对手;...……更多
...enAI和StableDiffusion等。有些AI伦理学家担心,在信任和安全专家能够研究这些风险之前,大型科技公司匆忙进入市场可能会让数十亿人面临潜在的危害,比如分享不准确的信息、生成假图像或让学生有能力在学校考试中作弊。该领...……更多
深度剖析:谷歌、微软等AI巨头承诺的“自愿监管”做到了吗?
...其进行内部和外部安全测试。这项测试的一部分将由独立专家执行,旨在防范一些最重要的人工智能风险来源,例如生物安全、网络安全以及更广泛的社会影响。所有公司(不包括 Inflection,该公司选择不予置评)均表示,他们...……更多
「海纳AI」完成数千万元A轮融资,为企业提供AI面试服务|36氪首发
...海纳产品时,将几百组AI对候选人的打分,与企业内部HR专家的打分相比对,准确度达到97.76%。其中优秀组(即70分以上)和较差组(即30分以下)的打分准确度达到100%。之所以能做到高准确度,首先是在于背后的AI技术和海量优...……更多
苹果300亿参数大模型首亮相,还买了家AI公司|焦点分析
...建筑材料”和“施工方法”。 模型架构上,使用了混合专家(Mixture of Experts, MoE)架构是MM1的亮点之一,苹果探索发现,在模型的前馈网络层中使用MoE架构,可以有效地扩展模型的容量而不牺牲推理速度。我们可以将MoE架构理...……更多
蚂蚁井贤栋:通过专业智能体的深度连接,AI会像互联网一样带来服务的代际升级
...通过知识引擎为大模型提供“专业教材”,让大模型具备专家知识水平。垂直领域、高质量的数据往往以多种模态存在,体系庞杂,比较分散,对隐私保护和资产价值保护的要求高,很难直接“喂给”通用大模型。井贤栋介绍,...……更多
回顾GPT大模型2023这一年,5大顶级公司预测2024年AI产品
...,就连那些原本习惯于“慢慢”打磨产品的大洋彼岸的AI专家们也进入了“满负荷”状态。梁正表示:“在谷歌、微软或OpenAI的办公室里,你能感受到他们的工作节奏至少比之前快了两倍。”这一切都是因为以ChatGPT为代表的大语...……更多
Pika爆火,但AI视频还没到「GPT时刻」;首个GPT-4驱动的人形机器人;微软小模型击败大模型丨AI新零售早报
...转换为机器人动作。(来源:“量子位”微信公众号)《微软小模型击败大模型:27亿参数,手机就能跑》微软发布了一个仅有27亿参数的小型模型Phi-2,它在多数常识推理、语言理解、数学和编码任务上超越了其他大型模型。尽...……更多
李彦宏称开源赶不上闭源?Meta发布最强开源模型,马斯克评价“还不错”
...天工3.0”基座开源大模型,成为全球最大的开源MoE(混合专家)大模型。不过,在最新的采访中,扎克伯格表示,Meta的目标不是与开源模型竞争,而是要超过所有人,打造最领先的人工智能。他提到,今年晚些时候发布的Llama 3-...……更多
Anthropic的Claude 3,解决了困扰OpenAI的难题
...真正有区分度的为MATH(数学问题解答能力)和GPQA(领域专家能力),后者可以体现模型在企业服务方面的能力。据悉,Claude 3选择了金融、法律、医学和哲学作为专家领域。其中,Opus的GPQA准确率达到了60%,这意味着其能力接近...……更多
更多关于科技的资讯:
简知文旅:不止旅行,亦是课堂,打造以深度学习和身心提升为核心的研学新范式
2025年7月17日,十四名参与七溪地·静心圆满瑜伽之旅的学员,跨越三小时崎岖山路,只为赴一场自发的约定——走进简知科技总部
2025-07-25 08:06:00
CTI华测检测战略收购开景集团,拓宽全球供应链审核服务能力
7月23日,华测检测认证集团股份有限公司(简称CTI华测检测,股票代码:300012)与开景集团(简称Openview)在深圳顺利举行项目交割仪式
2025-07-25 08:06:00
《孙子兵法》战略思维赋能企业进化 | 郭朝刚在上海市滁州商会专题开讲
7月19日,上海市滁州商会总部高朋满座,60余位企业家齐聚一堂,共赴一场思想盛宴。知名战略管理专家郭朝刚先生以《〈孙子兵法〉战略思维与组织进化论》为题
2025-07-25 08:06:00
AI生活离我们还有多远?人形机器人什么时候可以真正走入日常生活?日前,2025年现代科技馆体系联合行动“AI生活”主题科普主场活动在浙江省科技馆举办
2025-07-25 07:06:00
近年来,中俄贸易不断升温,俄罗斯电商增速远高于全球电商平均增速。然而,面对新阶段俄语市场“流量难、品牌弱、合规重”的挑战
2025-07-25 07:07:00
近日,杭州海关对外公布一起侵犯自主知识产权商品案件,杭州海关所属舟山海关在出口货运渠道查获一批涉嫌侵权的手机、平板电脑等
2025-07-25 07:07:00
走进航晓电器有限公司的打包区,灯火通明,工人们正加班加点熟练地把印着韩文、英文等不同语言的电蚊拍包装箱装上集装箱卡车,中国制造的“灭蚊神器”即将扬帆出海
2025-07-25 07:07:00
“作为亲历者,我在数贸会上深刻感受到了数字生态的蓬勃发展。”杭州七月你好数字科技有限公司创始人高超感叹道。从测试产品,到获取订单
2025-07-25 07:37:00
蒋正豪:“00后”极客 捕捉“黑飞”无人机
人物名片蒋正豪:重隼科技创始人,“00后”科技创业者,低空安防领域的先锋代表。大学期间研发设计无人机超千架。其主导开发的OCTO系列高机动无人机平台及光热成像视觉融合技术
2025-07-25 07:37:00
亚马逊SPN服务商网络大会在宁举办,助力构建全球贸易新生态跨境出海 乘势而上□南京日报/紫金山新闻记者 黄琳燕跨境电商是南京推动外贸转型升级
2025-07-25 07:48:00
重磅!旅服会首批800家企业参会名单曝光
来自中国旅行社协会的消息显示:“2025首届国际旅行服务大会暨交易展”首批800家企业参会名单正式揭晓,涵盖中国旅游集团
2025-07-25 07:51:00
记者7月23日从太钢获悉,太钢集团全流程在线碳管理平台正式通过国际知名组织南德公司认证。该平台由太钢集团自主建设、宝信软件自主开发
2025-07-25 07:04:00
在数字化转型加速期,项目管理系统平台已成为企业高效协同的核心基建。本次推荐聚焦平台稳定性、信创适配性及行业深度,助企业精准决策
2025-07-24 15:52:00
随着云计算、移动互联网技术的飞速发展和广泛应用,手机智能终端逐步成长,和PC端共同组成了互联网应用的主要入口。面对日益增加的互联网应用安全风险
2025-07-24 15:52:00
在全面推进健康中国建设的战略背景下,医疗行业数字化转型进入深水区。随着《关于进一步加强医疗机构电子病历信息使用管理的通知》等政策落地
2025-07-24 15:52:00