• 我的订阅
  • 头条热搜
揭秘iPhone里的Transformer:基于GPT-2架构 | MIT校友出品
...a beta翻了个底朝天,结果,还真挖出不少新鲜信息:模型架构上,Cook小哥认为苹果的语言模型更像是基于GPT-2打造的。 在分词器(tokenizer)方面,表情符号在其中十分突出。更多细节,一起来看。基于GPT-2架构先来回顾一下苹果...……更多
苹果300亿参数大模型首亮相,还买了家AI公司|焦点分析
...材”可以帮助大模型更好地适应不同类型的问题。模型的架构和训练过程,包括模型大小和训练超参数的选择,对于模型性能很重要,可以理解为在“建造大模型大楼”的过程中,需要选择“合适的建筑材料”和“施工方法”。...……更多
浙大校友自研跨模态模型,打造具身智能的“通用语法”
...训练变得极为困难甚至无法实现。而大模型中 Transformer 架构的引入,则使模型具有高效的并行计算能力与灵活性,从而可以处理大规模数据集,并能通过微调预训练模型,快速适应不同任务场景。同时,其层次化结构能做到对...……更多
苹果将推出全新ai培训课程
...新闻稿,将于今年秋季面向开发者学院的学生、导师以及校友等,推出全新的AI培训课程。新的核心课程首批将面向6个国家(巴西、印度尼西亚、意大利、沙特阿拉伯、韩国和美国)的18所开发者学院的数千名学生及校友提供,...……更多
首个“开源chatgpt”来了:基于谷歌5400亿参数大模型
...首个开源ChatGPT项目已经出现了!基于谷歌语言大模型PaLM架构,以及使用从人类反馈中强化学习的方法(RLHF),华人小哥 PhillipWang 复刻了一个ChatGPT出来。项目GitHub星已经超过1.7k了,而且还在一路飙升ing。不过一反常态的是,网...……更多
GPT-4o不会数r,被外国小哥原地逼疯! 谷歌论文揭秘Transformer「数不到n」
...所有情况下的评估均使用了1600个示例。研究者使用标准架构组件(自注意力、MLP、layer norm等)训练Transformer模型。他们使用了两层和四个头(理论上可以使用更少,但这种架构的优化速度更快)。训练使用Adam进行优化,批大小...……更多
苹果公司公布“mm1”多模态大模型
...模型的性能有不同的影响。据介绍,研究团队首先在模型架构决策和预训练数据上进行小规模消融实验。之后利用混合专家(MixtureofExperts)架构及一种名为Top-2Gating的方法构建了MM1模型,号称不仅在预训练指标中实现了最好的性...……更多
一块GPU都没用,苹果自研大模型干翻GPT-4?
...模型AFM-server,尚未公布模型参数。报告首次对AFM的模型架构、训练数据、训练过程、推理优化及评估结果进行了解读,并提到背后模型的训练采用的是累计10240颗谷歌TPU,而未提及英伟达GPU。根据论文描述,苹果自研大模型在指...……更多
“苹果智能”仅面向付费开发者,三大新模块炸裂出圈
...在于芯片级别的互联性特别高。苹果的技术论文表明,TPU架构可以开发更大、更复杂的AI模型。三大新模块炸裂出圈随着iOS18.1Beta版的上线,注册开发者从即日起就能体验到苹果AI的部分功能。据悉,本次更新只支持M系和A17Pro芯...……更多
苹果发布mm1.5-ui模型
...了300亿参数的多模态AI大模型MM1.5,该版本是在前代MM1的架构基础上发展而来的。该模型继续遵循数据驱动的训练原则,着重探究在不同训练周期中混合各类数据对模型性能产生的影响,相关模型文档已在HuggingFace上发布。MM1.5提...……更多
苹果AI震撼上线iPhone,进化版Siri却没有ChatGPT!47页技术报告揭秘自研模型
...中。48页超长论文中,覆盖了苹果LLM的设计与评估,包括架构、数据管理、预训练和后训练的recipe、优化、功能适应、和评估结果。论文地址:https://machinelearning.apple.com/papers/apple_intelligence_foundation_langua……更多
o1 基石论文火爆传阅:Ilya 仍是关键先生,核心项目清北校友闪光
...o1 则代表了“从记忆答案到记忆推理的范式转变”。清北校友 o1-mini 主要负责人除了 Ilya Sutskever,关于 o1 背后团队也引发了不少关注。官网给出的全名单,分成了推理研究和推理技术安全两块。粗略一看已经远远超一百人。 咱...……更多
国内创业者和投资人如何看待 Figure 01 机器人:距离具身智能还有多远?
...igure 做的还不错。简单聊聊这个 demo 里的细节。关于整体架构2Figure 的工程师 Corey Lynch 在 x 上公开了架构图,整个算法分为三层:上层:OpenAI model。这也就是我们常说的 High-level policy 部分,也被称为「大脑」,这部分负责处理...……更多
京东:推动大模型加快落地应用  助力培育发展新质生产力
...开发工具JoyCoder,上万名软件开发者可以更加专注于系统架构设计和关键程序开发……大模型行业应用前景广阔。根据《全球数字经济白皮书(2024年)》统计,目前,全球的人工智能大模型有1328个,中国的人工智能大模型达478...……更多
苹果发布xcode16swiftassist编程助手
...议。此外,苹果公司表示Xcode16还引入了全新的动态连接架构,允许使用同一套架构预览/运行代码,从而实现更顺畅高效的工作流程。Xcode16预览版目前现已开放下载,该版本支持适用于iOS18、iPadOS18、macOS15、AppletvOS18、visionOS2和wa...……更多
00后华裔小哥哈佛辍学组团挑战英伟达,史上最快AI芯片Sohu推理性能超H100二十倍!
...界上第一个用于Transformer的专用芯片(ASIC)。将Transformer架构烧录到Sohu芯片后,它无法运行大多数的传统AI模型:比如DLRMs、AlphaFold 2,或Stable Diffusion 2;也无法运行CNNs、RNNs或LSTMs。但对于Transformer来……更多
苹果被曝正悄悄开发大模型 创建聊天机器人“Apple GPT”
...工程小组之间的跨团队合作,以便为重要新功能提供基础架构。虽然公司还没有具体的计划,但熟悉这项工作的人士认为,苹果的目标是在明年发布与人工智能相关的重大消息。报道称,领导这项工作的是苹果机器学习和人工智...……更多
苹果开源7B模型,训练过程数据集一口气全给了,网友:很不像苹果
...单:使用一个标准化的框架来进行实验,包括固定的模型架构、训练代码、超参数和评估,最终找出哪种数据整理策略最适合训练出高性能的模型。基于上述思路,团队构建了一个高质量数据集DCLM-BASELINE,并用它从头训练了一...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...前提,是因为其拥有强大的视觉语言全局理解能力。模型架构根据介绍,Ferret 主要由用于提取图像嵌入的图像编码器;用于提取区域连续特征的空间感知视觉采样器;以及用于对图像、文本和区域特征进行联合建模的大语言模...……更多
微软一夜干翻苹果Mac!GPT-4o装进全家桶,微软把全世界PC都AI了
...夜首发Copilot+ PC,直接把钢铁侠的Jarvis带进现实!全新NPU架构,配上地表最强GPT-4o等40+模型,让Windows PC击败苹果Mac,成为有史以来最快、最智能的PC。显然,一个全新的AI时代正式开启。GPT-4o诞生刚过去一周,微软线下发布会再...……更多
阿维塔07 Ultra版将在10月下旬开始生产
...了300亿参数的多模态AI大模型MM1.5,该版本是在前代MM1的架构基础上发展而来的。该模型继续遵循数据驱动的训练原则,着重探究在不同训练周期中混合各类数据对模型性能产生的影响,相关模型文档已在HuggingFace上发布。MM1.5提...……更多
生成式AI:手机厂商高端梦最后的希望
...从10亿至千亿多种不同参数规模模型,通过“端云协同”架构实现在本地与云端协同运作的效果。此外,华为在盘古L0基座大模型的基础上,针对终端消费者场景构建了大量的场景数据和精调模型后的L1层对话模型,并将该模型用...……更多
本周硅谷发生了什么?|OpenAI推出5项更新;微软组建新的AI团队;Googe发布文生视频模型Lumiere
...频模型Lumiere正式上线。研究团队为Lumiere引入了时空U-Net架构,使得生成视频在运动幅度和一致性表现良好,同时提供多种风格选择,支持生成内容的局部修改。△图源:GoogleAdept AI发布多模态模型Fuyu-Heavy,跑分测试表现出色1月2...……更多
系统级玩家微软、苹果先后出牌,端侧大模型路径清晰了?
...有的应用形态。它为此构建了一个略显复杂的三层大模型架构,分别是本地端30亿参数级的小模型、未公布参数量的云端大模型,以及外挂大模型GPT-4o。虽然据发布会后苹果官方技术博客披露,苹果自研大模型性能相当出色——3...……更多
微软连发3款Phi-3.5模型:128K上下文,首用MoE架构,部分性能超GPT-4o mini
...U测试中击败了GPT-4o mini。这是微软首次使用混合专家模型架构。这一模型系列中最小的Phi-3.5-mini-instruct在长上下文代码理解任务以明显优势击败Llama-3.1-8B-instruct和Mistral-7B-instruct,而其参数规模还不到Llama-3.1-8……更多
ai赋能个人电脑的变革
...之百投入AI电脑的制造商。与此同时,高通也提升了其ARM架构8cxGen3芯片组的AI能力,务求凭借Nuvia架构和WindowsCopilot的整合在2024年扩充市场份额。在x86领域,AMD在2023年第二季度赶在英特尔的MeteorLake首发前,推出了其AI方案“Phoenix...……更多
英伟达地表最强,黄教主被称作AI界“霉霉”
...最强芯片亮相过去几年,英伟达曾在GTC上推出了基于Hopper架构的多款重磅明星产品,目前市面上能叫得上名字得人工智能模型几乎都是在该架构上进行训练,行业内“一芯难求”的局面迟迟得不到缓解。而今年,按照英伟达每两...……更多
1000个智能体创建首个「AI文明」!北大校友放弃MIT教职打造「西部世界」
...理、反思,并生成或改变其目标以适应快速变化的环境。架构由于「大脑」是唯一经过验证的人类级智能体模型,因此团队提出了一种全新的「系统神经科学复合架构」。其中,模型会去模拟前额叶皮层、记忆系统、社会情感状...……更多
Cortex-X5 超大核,联发科新平台现身 Geekbench
...,这颗芯片采用了 ARM 下一代公版 CPU 超大核 ——Cortex-X5 架构。虽然目前测试机数据比较一般,但它频率实际上并不高,而且目前表现出来的 IPC 已经和苹果 A17 Pro 接近。 按照 Arm 的预计,Cortex-X5 将会带来巨大的性能提升,可...……更多
讯飞输入法推出苹果macos版,支持10.15及以上系统
...发布,支持macOS10.15及以上更高系统版本,兼容ARM及IntelX86架构处理器,适配Mac设备Retina显示屏。在讯飞输入法官网了解到,讯飞输入法现已有安卓、iOS、Windows和macOS四个版本,其中安卓、iOS为最新的V12版,Windows版为V3.0版,macOS...……更多
更多关于科技的资讯:
厦门网讯(厦门日报记者 翁华鸿 通讯员 林雨新)在近日举行的2025全球数据管理峰会“数据要素分论坛暨大数据统计与人工智能技术创新管理研讨会”上
2025-10-03 08:38:00
兴趣-实践-视野:达芬奇金奖少年带来的教育启示录
摘要:2025“你是达芬奇”全球青少年科学与艺术创新赛圆满落幕,其中金奖获奖少年的亲身实践告诉我们,在AI赋能的新时代
2025-10-02 16:22:00
单日调用近1万亿次,高德助力北斗规模化民用跨入新量级
2025年10月1日,随着国庆长假首日出行高峰的到来,高德基于北斗卫星导航系统的定位数量接近1万亿次,支撑导航总里程数超90亿公里
2025-10-02 22:31:00
10月1日,从太钢获悉,今年以来,太钢不锈进料加工团队以“精准备案、高效协同”为核心,在进料铬铁镍铁资源利用方面取得突破性进展
2025-10-02 17:39:00
厦门网讯(厦门日报记者 林露虹)记者昨日从中国移动咪咕公司获悉,该公司打造的“鼓浪屿AI伴游”服务已正式上线。市民和游客只需打开“鼓浪屿元宇宙”微信小程序
2025-10-02 08:57:00
“中国脑机谷”落户新奥新智感知产业园 政企研协同构建脑机接口产业新生态
河北新闻网讯(张新)9月26日,脑机接口产业联盟首届“脑机接口50人论坛”暨天津脑机接口产业创新发展推进会举办。会上,由新奥集团旗下的天津新智感知科技有限公司
2025-10-01 08:40:00
国网三明供电公司:守护灯火庆华诞 主动运维显担当
国网三明供电公司检修人员及时更换损坏器件并调整传动系统并完成设备修复及全套试验。(纪长添 摄)东南网10月1日讯 9月28日
2025-10-01 09:19:00
9月26日,由华东政法大学与上海星瀚律师事务所联合主办的第三届“星瀚杯”走进企业的法律课公益大赛正式启动。腾讯云作为大赛的技术支持单位
2025-10-01 09:56:00
平望实小承办吴江区骨干教师(数学)讲学团活动
为进一步发挥吴江区骨干教师的示范和辐射作用,推进课堂教学改革,有效提升教师教学业务能力。2025年9月24日,由苏州市吴江区教师发展中心主办的2025年吴江区骨干教师(数学)讲学团活动在平望实验小学举行
2025-10-01 09:58:00
AI技术让抗战文物“活起来”,人民日报数字传播联合百度推抗战文物智能体
9月30日,由人民日报数字传播与中国国家博物馆、中国人民大学、百度文心大模型、百度百科联合出品的《80年,80件》智能体和3D文物词条正式上线
2025-10-01 10:00:00
新时达2025工博会圆满落幕 | STEP 2.0战略引领智能制造新篇章
2025年9月23日至27日,第二十五届中国国际工业博览会在国家会展中心(上海)盛大举行。新时达以"智拓无界 共创未来"为主题
2025-10-01 10:00:00
从课堂到产线,河北工大学子开展智慧物流与“地狼”系统自动化技术实训
河北新闻网讯(胡广涛)组装调试机器人、体验智慧仓储系统、探索自动化技术前沿……近日,河北工业大学人工智能与数据科学学院2022级自动化专业全体学生在廊坊分校
2025-10-01 11:12:00
中国青年报客户端讯(中青报·中青网记者 夏瑾)9月30日,由湖州师范学院音乐学院、湖州市音声数据挖掘与智能服务重点实验室主办的“1617系列明代魏氏乐虚拟乐器音源”全球发布会在浙江省杭州市举办
2025-10-01 14:11:00
“智慧武当”给游客带来数字文旅新体验
十堰广电讯(通讯员 汪伟 周琼 耿宇)“一部手机游武当”预约购票、AI导游、《入境武当》VR大空间、问道武当数字客厅……国庆假日
2025-10-01 18:35:00
津云文旅电商版块上线 首发“笑漾海河”优选线路 扫码阅读手机版
10月1日,天津鹏欣水游城14周年庆暨津云新媒体“笑漾海河”文旅电商线路首发仪式成功举办。近年来,随着“文旅+电商”模式的快速发展
2025-10-01 18:55:00