推理,框架,模型,苹果,训练,语言头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...，苹果在 Hugging Face 平台上发布了一个“具有开源训练和推理框架的高效语言模型”，名为 OpenELM。当然，这是一项开源语言模型，其源码及预训练的模型权重和训练配方可在苹果 Github 库中获取。IT之家将官方简介翻译如下：参...……更多

2024-04-25 09:24:00推理,框架,模型,苹果,训练,语言

百川智能发布baichuan3稳定语言模型

...处理和代码生成领域的强大实力。不仅如此，其在对逻辑推理能力及专业性要求极高的MCMLE、MedExam、CMExam等权威医疗评测上的中文效果同样超过了GPT-4，是中文医疗任务表现最佳的大模型。Baichuan3还突破“迭代式强化学习”技术...……更多

2024-01-29 19:57:00百川,模型,语言,智能,模型,百川

混合架构赋予AI人类推理能力

...AI)系统在编码、战略规划和机器人科学三个领域执行复杂推理任务。聊天生成预训练转换器(ChatGPT)和“克劳德3-奥普斯”(Claude 3 Opus)等大语言模型(LLM)，根据人类输入“提示词”处理和生成文本。研究人员说，过去18个月，这些技...……更多

2024-06-12 18:15:00推理,架构,混合,人类,能力,语言

苹果的封闭生态为大模型打开！发布开源多模态大模型、每天为 A

...布了两篇新的研究论文，介绍了 3D 头像和高效语言模型推理的新技术，被认为可能带来更身临其境的视觉体验，并允许复杂的人工智能系统在 iPhone 和 iPad 等消费设备上运行。 AI 社区中的许多人后来才注意到 Ferret 的发布，他...……更多

2023-12-26 14:06:00模型,生态,模态,零碎,苹果,模型

苹果大模型，不藏了

...存中的大型语言模型：在有限内存下高效的大型语言模型推理》的论文，直指大模型落地iPhone等“内存有限”设备的方法。进入新年，Siri助手将搭载生成式模型Ajax的消息，再次不胫而走。去年六月和九月的两次重要发布会，苹...……更多

2024-01-06 09:10:00模型,苹果,模型,苹果,数据,处理

百度文心一言发布会详细纪要

...话体现出文心一言各方面的能力，比如总结分析的能力、推理的能力。事实性的东西对于一个搜索引擎来说不是那么难，但是对于一个生成式预训练大模型来说，出错的概率还是挺高的，这些问题都答对相当不容易，因为百度的...……更多

2023-03-17 12:00:00纪要,文心,发布会,模型,文心,能力

本周硅谷发生了什么？｜苹果Vision Pro正式开售；Ne

...推出数据分析工具“办公小浣熊”面壁智能发布2B模型，推理成本仅为GPT-4的1/360科大讯飞发布全民开放大模型星火V3.5百川智能发布Baichuan 3大模型，更好理解中文阿里巴巴开发的自主多模态AI代理MobileAgent上线苹果Vision Pro正式在...……更多

2024-02-05 11:37:00硅谷,字节,接口,人类,苹果,模型

苹果AI登场，与OpenAI合作，Siri将采用GPT-4o

...Bootstrap3D 数据集已全面开源。北大博士生等全新 BoT 框架推理暴涨 70 倍，24 点图形推理一步成神：BoT 可有效提升 LLM 在多个任务上的性能，在 BoT 的加持下，Llama3-8B 在多项任务中的性能甚至超越了 Llama3-70B，且 BoT 的成本相对较...……更多

2024-06-11 09:00:00情报局,独角兽,情报,芯片,进展,苹果

苹果展示ferret-uiai系统可理解应用程序

...指令来设计的，以便于精确引用和接地。为了增强模型的推理能力，我们进一步编制了高级任务数据集，包括详细描述、感知/交互对话和功能推理。苹果在论文中表示相比较现有的GPT-4V，以及其它MLLMs模型，Ferret-UIAI模型更为优...……更多

2024-04-11 02:30:00应用程序,苹果,程序,应用,系统,模型

苹果300亿参数大模型首亮相，还买了家AI公司｜焦点分析

...模有30亿、70亿、300亿三种大小，有图像识别和自然语言推理能力。其中，参与该论文的作者有30人，一半以上都是华人。 MM1测试效果不如Gemini和GPT4V和市面上其他大模型相比，MM1亮点并不在惊艳的效果上，也没有提出特别的技...……更多

2024-03-16 18:14:00模型,苹果,参数,焦点,分析,公司

系统级玩家微软、苹果先后出牌，端侧大模型路径清晰了？

...MGSM（跨语言数学能力）提升 2.3%，而DROP（文本段落分析推理）则下降了 3%。但与此同时，杀手级应用仍未出现。根据第三方网站SimilarWeb的监测数据，早在去年6月，ChatGPT流量即已见顶，当月其网站与移动客户端的全球流量（PV）...……更多

2024-06-21 09:16:00微软,路径,模型,先后,苹果,玩家

北大推出全新机器人多模态大模型！面向通用和机器人场景的高效推

...码仓库 Trending Research 第一位。为了赋予机器人端到端的推理和操纵能力，本文创新性地将视觉编码器与高效的状态空间语言模型集成，构建了全新的 RoboMamba 多模态大模型，使其具备视觉常识任务和机器人相关任务的推理能力，...……更多

2024-06-21 09:52:00机器,模态,人多,机器人,推理,北大

英伟达地表最强，黄教主被称作AI界“霉霉”

...来支持高达10万亿参数的AI模型训练和大语言模型的实时推理。有望在数据处理、工程模拟、电子设计自动化、计算机辅助药物设计、量子计算和生成人工智能等领域实现新的突破。用黄仁勋的原话来说，它就是“当今世界上最...……更多

2024-03-19 11:56:00英伟,地表,教主,英伟,模型,人工智能

小红书技术副总裁王晓博：大模型让AI越来越像人，更懂小红书的

...数据对用户和内容进行建模，会导致新笔记分发难，缺乏推理能力导致信息茧房等问题。在小红书的推荐系统中，率先将大模型作为笔记的语义编码器来使用，通过语义压缩提示词（prompt）结合对比学习技术，让大模型能够把笔...……更多

2024-07-08 14:43:00小红,越来,副总,模型,越来越,内容

探索终端操作系统领域AI大模型创新趋势 OpenHarmon

...发展带来了崭新的机遇,有望通过强大的语义理解和常识推理能力大大提升智能个人代理支持功能的广度和深度。”清华大学助理研究员李元春主题分享中软国际有限公司智能物联网军团产品研发管理部总经理、OpenHarmony项目群技...……更多

2023-11-06 14:46:00终端,模型,趋势,大会,领域,智能

苹果公司公布“mm1”多模态大模型

...0亿、70亿、300亿三种参数规模，拥有图像识别和自然语言推理能力。IT之家注意到，苹果研究团队相关论文主要是利用MM1模型做实验，通过控制各种变量，找出影响模型效果的关键因素。研究表明，图像分辨率和图像标记数量对...……更多

2024-03-16 18:48:00苹果公司,模态,模型,苹果,公司,模型

摆脱Transformer依赖？这家AI初创公司推出国内首个

...能效果——记忆能力提升3倍、速度提升7倍的同时，实现推理吞吐量的5倍提升。至于为何另辟蹊径，寻求非Transformer的大模型路径，岩芯数智CEO刘凡平指出，以大规模著称的Transformer，在实际应用中的高算力和高成本，让不少中...……更多

2024-01-29 06:31:00模型,机制,公司,模型,架构,岩芯

位列第一梯队，腾讯混元再度领跑国内大模型

...维度的综合性测评基准，由十大基础任务组成，包括逻辑推理、代码、语言理解、长文本、角色扮演等。本次报告选取了国内外具有代表性的32个大模型4月份的版本，通过多维度综合性测评，真实准确地反映了国内外大模型在中...……更多

2024-05-06 16:52:00腾讯,梯队,模型,腾讯,模型,能力

连续两日逼近“20CM”涨停，南沙独角兽企业云从科技如何成为

...展开紧密协作，共同致力于本土算力和大型模型的训练与推理技术的发展。11月初，云从科技在投资者关系平台上答复投资者关心的问题时称，公司已与华为签署了全面合作框架协议，并已联合发布了从容大模型训推一体化解决...……更多

2023-11-15 10:18:00南沙,华为,独角兽,概念股,概念,科技

ChatGPT大流行的思考-解析篇

...器人的本质区别。2. ChatGPT如何实现知识的获取、存储、推理及实时更新那究竟GPT如何有如此优秀的表现呢？我们不妨从人类学习思路入手，我们学习一般可分为获取知识-存储知识-推理知识-更新知识，而这也是GPT发展及学习的...……更多

2023-02-17 21:00:00知识,模型,推理,数据,方法,学习

奥林匹克竞赛里选最聪明的AI：Claude-3.5-Sonn

...异，近来Anthropic公司最新发布的Claude-3.5-Sonnet因在知识型推理、数学推理、编程任务及视觉推理等任务上设立新行业基准而引发广泛讨论：Claude-3.5-Sonnet 已经取代OpenAI的GPT4o成为世界上”最聪明的AI“（Most Intelligent AI）了……更多

2024-06-25 09:45:00奥林,奥林匹克,竞赛,模型,推理,能力

昇思MindSpore 2.3全新发布

...级实现脚本、分布式策略，运行时的统一，Baichuan2-13B的推理部署只需1天。在大模型推理上，通过LLMServing实现推理吞吐提升2倍多；升级模型压缩工具金箍棒2.0实现千亿大模型压缩至十倍。为降低开发门槛，昇思持续升级MindSpore...……更多

2024-03-24 17:47:00全新,模型,开发,中国,人工智能,框架

中国也有Sora同款训练架构公司，清华班底，智谱也投了 |

...经理。CTO鲍凡在清华大学计算机系获得博士学位，在加速推理、可控生成、基础架构、训练策略等方面已发表十余篇顶会论文。首席科学家为清华大学计算机系人工智能实验室主任、智源研究院首席科学家朱军。可以说，2023年...……更多

2024-03-14 15:12:00清华,班底,中国,架构,训练,公司

对话王田苗：万亿市场之下，大模型 + 机器人还有四大问题未解

...务设定多个小模型，并提供不同的参数训练，端到端减少推理成本。另外，将专用小 GPU 芯片置入到机器人中，也可提高任务实时性，目前特斯拉已在自动驾驶中尝试了这种做法。硬氪：今年有哪些细分场景的模型值得关注？王...……更多

2024-04-26 23:00:00机器人,模型,对话,机器,问题,市场

NPU全球出货超1亿颗！芯原如何迎战大模型时代的边缘计算变革

...C9X00AI是AI-GPU/AI-PC，Tensor Core GPU IP CCTC-MP则面向大语言模型推理、训练。芯原NPU IP研发副总裁查凯南谈道，NPU的发展近年来大概有三个方向：首先是DEEP AI，在很多嵌入式设备里面，要把AI跟其它的处理IP做比较紧耦合的绑定，可以...……更多

2024-06-14 09:18:00变革,模型,边缘,时代,全球,模型