• 我的订阅
  • 头条热搜
揭秘iPhone里的Transformer:基于GPT-2架构 | MIT校友出品
...a beta翻了个底朝天,结果,还真挖出不少新鲜信息:模型架构上,Cook小哥认为苹果的语言模型更像是基于GPT-2打造的。 在分词器(tokenizer)方面,表情符号在其中十分突出。更多细节,一起来看。基于GPT-2架构先来回顾一下苹果...……更多
苹果300亿参数大模型首亮相,还买了家AI公司|焦点分析
...材”可以帮助大模型更好地适应不同类型的问题。模型的架构和训练过程,包括模型大小和训练超参数的选择,对于模型性能很重要,可以理解为在“建造大模型大楼”的过程中,需要选择“合适的建筑材料”和“施工方法”。...……更多
浙大校友自研跨模态模型,打造具身智能的“通用语法”
...训练变得极为困难甚至无法实现。而大模型中 Transformer 架构的引入,则使模型具有高效的并行计算能力与灵活性,从而可以处理大规模数据集,并能通过微调预训练模型,快速适应不同任务场景。同时,其层次化结构能做到对...……更多
苹果将推出全新ai培训课程
...新闻稿,将于今年秋季面向开发者学院的学生、导师以及校友等,推出全新的AI培训课程。新的核心课程首批将面向6个国家(巴西、印度尼西亚、意大利、沙特阿拉伯、韩国和美国)的18所开发者学院的数千名学生及校友提供,...……更多
首个“开源chatgpt”来了:基于谷歌5400亿参数大模型
...首个开源ChatGPT项目已经出现了!基于谷歌语言大模型PaLM架构,以及使用从人类反馈中强化学习的方法(RLHF),华人小哥 PhillipWang 复刻了一个ChatGPT出来。项目GitHub星已经超过1.7k了,而且还在一路飙升ing。不过一反常态的是,网...……更多
GPT-4o不会数r,被外国小哥原地逼疯! 谷歌论文揭秘Transformer「数不到n」
...所有情况下的评估均使用了1600个示例。研究者使用标准架构组件(自注意力、MLP、layer norm等)训练Transformer模型。他们使用了两层和四个头(理论上可以使用更少,但这种架构的优化速度更快)。训练使用Adam进行优化,批大小...……更多
苹果公司公布“mm1”多模态大模型
...模型的性能有不同的影响。据介绍,研究团队首先在模型架构决策和预训练数据上进行小规模消融实验。之后利用混合专家(MixtureofExperts)架构及一种名为Top-2Gating的方法构建了MM1模型,号称不仅在预训练指标中实现了最好的性...……更多
一块GPU都没用,苹果自研大模型干翻GPT-4?
...模型AFM-server,尚未公布模型参数。报告首次对AFM的模型架构、训练数据、训练过程、推理优化及评估结果进行了解读,并提到背后模型的训练采用的是累计10240颗谷歌TPU,而未提及英伟达GPU。根据论文描述,苹果自研大模型在指...……更多
“苹果智能”仅面向付费开发者,三大新模块炸裂出圈
...在于芯片级别的互联性特别高。苹果的技术论文表明,TPU架构可以开发更大、更复杂的AI模型。三大新模块炸裂出圈随着iOS18.1Beta版的上线,注册开发者从即日起就能体验到苹果AI的部分功能。据悉,本次更新只支持M系和A17Pro芯...……更多
苹果发布mm1.5-ui模型
...了300亿参数的多模态AI大模型MM1.5,该版本是在前代MM1的架构基础上发展而来的。该模型继续遵循数据驱动的训练原则,着重探究在不同训练周期中混合各类数据对模型性能产生的影响,相关模型文档已在HuggingFace上发布。MM1.5提...……更多
苹果AI震撼上线iPhone,进化版Siri却没有ChatGPT!47页技术报告揭秘自研模型
...中。48页超长论文中,覆盖了苹果LLM的设计与评估,包括架构、数据管理、预训练和后训练的recipe、优化、功能适应、和评估结果。论文地址:https://machinelearning.apple.com/papers/apple_intelligence_foundation_langua……更多
o1 基石论文火爆传阅:Ilya 仍是关键先生,核心项目清北校友闪光
...o1 则代表了“从记忆答案到记忆推理的范式转变”。清北校友 o1-mini 主要负责人除了 Ilya Sutskever,关于 o1 背后团队也引发了不少关注。官网给出的全名单,分成了推理研究和推理技术安全两块。粗略一看已经远远超一百人。 咱...……更多
国内创业者和投资人如何看待 Figure 01 机器人:距离具身智能还有多远?
...igure 做的还不错。简单聊聊这个 demo 里的细节。关于整体架构2Figure 的工程师 Corey Lynch 在 x 上公开了架构图,整个算法分为三层:上层:OpenAI model。这也就是我们常说的 High-level policy 部分,也被称为「大脑」,这部分负责处理...……更多
京东:推动大模型加快落地应用  助力培育发展新质生产力
...开发工具JoyCoder,上万名软件开发者可以更加专注于系统架构设计和关键程序开发……大模型行业应用前景广阔。根据《全球数字经济白皮书(2024年)》统计,目前,全球的人工智能大模型有1328个,中国的人工智能大模型达478...……更多
苹果发布xcode16swiftassist编程助手
...议。此外,苹果公司表示Xcode16还引入了全新的动态连接架构,允许使用同一套架构预览/运行代码,从而实现更顺畅高效的工作流程。Xcode16预览版目前现已开放下载,该版本支持适用于iOS18、iPadOS18、macOS15、AppletvOS18、visionOS2和wa...……更多
00后华裔小哥哈佛辍学组团挑战英伟达,史上最快AI芯片Sohu推理性能超H100二十倍!
...界上第一个用于Transformer的专用芯片(ASIC)。将Transformer架构烧录到Sohu芯片后,它无法运行大多数的传统AI模型:比如DLRMs、AlphaFold 2,或Stable Diffusion 2;也无法运行CNNs、RNNs或LSTMs。但对于Transformer来……更多
苹果被曝正悄悄开发大模型 创建聊天机器人“Apple GPT”
...工程小组之间的跨团队合作,以便为重要新功能提供基础架构。虽然公司还没有具体的计划,但熟悉这项工作的人士认为,苹果的目标是在明年发布与人工智能相关的重大消息。报道称,领导这项工作的是苹果机器学习和人工智...……更多
苹果开源7B模型,训练过程数据集一口气全给了,网友:很不像苹果
...单:使用一个标准化的框架来进行实验,包括固定的模型架构、训练代码、超参数和评估,最终找出哪种数据整理策略最适合训练出高性能的模型。基于上述思路,团队构建了一个高质量数据集DCLM-BASELINE,并用它从头训练了一...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...前提,是因为其拥有强大的视觉语言全局理解能力。模型架构根据介绍,Ferret 主要由用于提取图像嵌入的图像编码器;用于提取区域连续特征的空间感知视觉采样器;以及用于对图像、文本和区域特征进行联合建模的大语言模...……更多
微软一夜干翻苹果Mac!GPT-4o装进全家桶,微软把全世界PC都AI了
...夜首发Copilot+ PC,直接把钢铁侠的Jarvis带进现实!全新NPU架构,配上地表最强GPT-4o等40+模型,让Windows PC击败苹果Mac,成为有史以来最快、最智能的PC。显然,一个全新的AI时代正式开启。GPT-4o诞生刚过去一周,微软线下发布会再...……更多
阿维塔07 Ultra版将在10月下旬开始生产
...了300亿参数的多模态AI大模型MM1.5,该版本是在前代MM1的架构基础上发展而来的。该模型继续遵循数据驱动的训练原则,着重探究在不同训练周期中混合各类数据对模型性能产生的影响,相关模型文档已在HuggingFace上发布。MM1.5提...……更多
生成式AI:手机厂商高端梦最后的希望
...从10亿至千亿多种不同参数规模模型,通过“端云协同”架构实现在本地与云端协同运作的效果。此外,华为在盘古L0基座大模型的基础上,针对终端消费者场景构建了大量的场景数据和精调模型后的L1层对话模型,并将该模型用...……更多
本周硅谷发生了什么?|OpenAI推出5项更新;微软组建新的AI团队;Googe发布文生视频模型Lumiere
...频模型Lumiere正式上线。研究团队为Lumiere引入了时空U-Net架构,使得生成视频在运动幅度和一致性表现良好,同时提供多种风格选择,支持生成内容的局部修改。△图源:GoogleAdept AI发布多模态模型Fuyu-Heavy,跑分测试表现出色1月2...……更多
系统级玩家微软、苹果先后出牌,端侧大模型路径清晰了?
...有的应用形态。它为此构建了一个略显复杂的三层大模型架构,分别是本地端30亿参数级的小模型、未公布参数量的云端大模型,以及外挂大模型GPT-4o。虽然据发布会后苹果官方技术博客披露,苹果自研大模型性能相当出色——3...……更多
微软连发3款Phi-3.5模型:128K上下文,首用MoE架构,部分性能超GPT-4o mini
...U测试中击败了GPT-4o mini。这是微软首次使用混合专家模型架构。这一模型系列中最小的Phi-3.5-mini-instruct在长上下文代码理解任务以明显优势击败Llama-3.1-8B-instruct和Mistral-7B-instruct,而其参数规模还不到Llama-3.1-8……更多
ai赋能个人电脑的变革
...之百投入AI电脑的制造商。与此同时,高通也提升了其ARM架构8cxGen3芯片组的AI能力,务求凭借Nuvia架构和WindowsCopilot的整合在2024年扩充市场份额。在x86领域,AMD在2023年第二季度赶在英特尔的MeteorLake首发前,推出了其AI方案“Phoenix...……更多
英伟达地表最强,黄教主被称作AI界“霉霉”
...最强芯片亮相过去几年,英伟达曾在GTC上推出了基于Hopper架构的多款重磅明星产品,目前市面上能叫得上名字得人工智能模型几乎都是在该架构上进行训练,行业内“一芯难求”的局面迟迟得不到缓解。而今年,按照英伟达每两...……更多
1000个智能体创建首个「AI文明」!北大校友放弃MIT教职打造「西部世界」
...理、反思,并生成或改变其目标以适应快速变化的环境。架构由于「大脑」是唯一经过验证的人类级智能体模型,因此团队提出了一种全新的「系统神经科学复合架构」。其中,模型会去模拟前额叶皮层、记忆系统、社会情感状...……更多
Cortex-X5 超大核,联发科新平台现身 Geekbench
...,这颗芯片采用了 ARM 下一代公版 CPU 超大核 ——Cortex-X5 架构。虽然目前测试机数据比较一般,但它频率实际上并不高,而且目前表现出来的 IPC 已经和苹果 A17 Pro 接近。 按照 Arm 的预计,Cortex-X5 将会带来巨大的性能提升,可...……更多
讯飞输入法推出苹果macos版,支持10.15及以上系统
...发布,支持macOS10.15及以上更高系统版本,兼容ARM及IntelX86架构处理器,适配Mac设备Retina显示屏。在讯飞输入法官网了解到,讯飞输入法现已有安卓、iOS、Windows和macOS四个版本,其中安卓、iOS为最新的V12版,Windows版为V3.0版,macOS...……更多
更多关于科技的资讯:
中新经纬10月24日电 题:“十五五”时期AI+机器人融合将成产业创新主线作者 张凌燕 赛迪顾问业务总监、先进制造业研究中心总经理中国共产党第二十届中央委员会第四次全体会议公报指出
2025-10-24 18:04:00
豫见开放强音丨洛轴集团:持续拓展国际化进程 建设世界强企
大河网讯 “期待与更多客商积极合作,拓展国际化进程,共同建设世界强企。”10月23日,在国际产业投资合作对接活动·河南站举办期间
2025-10-24 18:57:00
“你好,顺丰快递,来送‘国补’数码产品。”10月21日,市民陈洁收到了网购的手机。这款手机享受“国补”和以旧换新后,比市场价便宜了不少
2025-10-24 08:05:00
集美加快布局新能源商用车赛道
“集链聚能 智驭未来”——2025厦门新能源商用车产业“四链融合”对接会吸引资源对接。(本组图/集美区 提供)企业展示的各类新能源商用车
2025-10-24 08:58:00
第三届“苏颂杯”未来产业技术创新赛圆满收官
大赛组委会为一等奖项目颁奖。台下,选手们仔细聆听台上评委点评。 海外嘉宾发来视频点评本届“苏颂杯”大赛。(本组图/市科技局 提供)厦门网讯(厦门日报记者 李晓平 通讯员 庄佩贞)经过激烈角逐
2025-10-24 08:58:00
珍爱网受邀参与“清朗网络守护者”启动大会 筑牢网络安全坚实屏障
在数字化快速发展的今天,网络安全已成为国家安全的重要组成部分。近日,由政府相关部门指导,深圳广播电影电视集团主办的以“聚焦网络空间治理 护航社会高质量发展”为主题的“清朗网络守护者”启动大会在深圳正式举行
2025-10-24 08:59:00
90 载科学传承:GNC 以城市环游诠释运动营养真谛
以骑行运动为突破口,GNC加速深耕中国运动健康市场2025年10月23日,首届环贵州公园省国际公路自行车赛圆满落幕。GNC健安喜作为铂金赞助商及官方唯一指定营养补充剂品牌
2025-10-24 08:59:00
“微米”社交APP以线下实名社交破局
近日,一款名为“微米(WEMET)”的创新型社交应用正式面世,其以“地图社交+线下实体联动”为核心模式,围绕“真实、附近
2025-10-24 08:59:00
全国首例!吉大中日联谊医院成功植入超百通道侵入式柔性脑机接口
10月22日,记者从吉林大学中日联谊医院获悉,神经外科高宇飞、张金男团队与北京智冉医疗科技有限公司联手,在全国率先成功完成首例超百通道侵入式柔性脑机接口的临床植入手术
2025-10-24 11:08:00
客如云AI碰碰贴“商业增长引擎”,让营销触手可及
在数字经济深度融入实体经济的当下,实体门店正面临“营销落地难、用户互动低效、场景覆盖有限”的共性挑战——传统推广依赖人工操作与分散物料
2025-10-24 11:20:00
继感知位置后!海尔空调将发布可感知呼吸的新品,可自适应送风
曾经,手动调节、躲避直吹是使用空调时的日常烦恼;如今,随着“主动感知”成为可能,空调正变得真正“懂你”。继10月21日首发可感知人体位置的海尔麦浪舒适风空调后
2025-10-24 11:22:00
“今天查,明天做”ICL晶体云柜正式落户福州普瑞眼科 高清视界无需等待
廿载耕耘,瞩目焕新!在普瑞眼科成立20周年之际,福州普瑞眼科迎来又一重大技术升级——正式启用EVOICL官方授权“云柜系统”
2025-10-24 11:29:00
厦门新能源商用车应用场景清单发布东南网10月24日讯(海峡导报记者 康泽辉)厦门市新能源商用车应用场景清单发布,聚焦5类道路场景43个应用场景项目
2025-10-24 11:30:00
全球首个百亿级人类基因组基础模型Genos发布!
在生命科学的前沿探索中,我们早已能高效“读出”生命的序列,但如何从30亿碱基对中“读懂”生命奥秘,长期以来都是一项巨大挑战
2025-10-24 13:21:00
鲁网10月24日讯作为支撑信息通信网络稳定运行的“核心枢纽”,通信机房承载着海量高功耗数据设备,其温度精准控制直接关系到网络畅通与服务质量
2025-10-24 13:47:00