推理,框架,模型,苹果,训练,语言头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...，苹果在 Hugging Face 平台上发布了一个“具有开源训练和推理框架的高效语言模型”，名为 OpenELM。当然，这是一项开源语言模型，其源码及预训练的模型权重和训练配方可在苹果 Github 库中获取。IT之家将官方简介翻译如下：参...……更多

2024-04-25 09:24:00推理,框架,模型,苹果,训练,语言

百川智能发布baichuan3稳定语言模型

...处理和代码生成领域的强大实力。不仅如此，其在对逻辑推理能力及专业性要求极高的MCMLE、MedExam、CMExam等权威医疗评测上的中文效果同样超过了GPT-4，是中文医疗任务表现最佳的大模型。Baichuan3还突破“迭代式强化学习”技术...……更多

2024-01-29 19:57:00百川,模型,语言,智能,模型,百川

苹果的封闭生态为大模型打开！发布开源多模态大模型、每天为 A

...布了两篇新的研究论文，介绍了 3D 头像和高效语言模型推理的新技术，被认为可能带来更身临其境的视觉体验，并允许复杂的人工智能系统在 iPhone 和 iPad 等消费设备上运行。 AI 社区中的许多人后来才注意到 Ferret 的发布，他...……更多

2023-12-26 14:06:00模型,生态,模态,零碎,苹果,模型

苹果大模型，不藏了

...存中的大型语言模型：在有限内存下高效的大型语言模型推理》的论文，直指大模型落地iPhone等“内存有限”设备的方法。进入新年，Siri助手将搭载生成式模型Ajax的消息，再次不胫而走。去年六月和九月的两次重要发布会，苹...……更多

2024-01-06 09:10:00模型,苹果,模型,苹果,数据,处理

本周硅谷发生了什么？｜苹果Vision Pro正式开售；Ne

...推出数据分析工具“办公小浣熊”面壁智能发布2B模型，推理成本仅为GPT-4的1/360科大讯飞发布全民开放大模型星火V3.5百川智能发布Baichuan 3大模型，更好理解中文阿里巴巴开发的自主多模态AI代理MobileAgent上线苹果Vision Pro正式在...……更多

2024-02-05 11:37:00硅谷,字节,接口,人类,苹果,模型

苹果展示ferret-uiai系统可理解应用程序

...指令来设计的，以便于精确引用和接地。为了增强模型的推理能力，我们进一步编制了高级任务数据集，包括详细描述、感知/交互对话和功能推理。苹果在论文中表示相比较现有的GPT-4V，以及其它MLLMs模型，Ferret-UIAI模型更为优...……更多

2024-04-11 02:30:00应用程序,苹果,程序,应用,系统,模型

苹果300亿参数大模型首亮相，还买了家AI公司｜焦点分析

...模有30亿、70亿、300亿三种大小，有图像识别和自然语言推理能力。其中，参与该论文的作者有30人，一半以上都是华人。 MM1测试效果不如Gemini和GPT4V和市面上其他大模型相比，MM1亮点并不在惊艳的效果上，也没有提出特别的技...……更多

2024-03-16 18:14:00模型,苹果,参数,焦点,分析,公司

英伟达地表最强，黄教主被称作AI界“霉霉”

...来支持高达10万亿参数的AI模型训练和大语言模型的实时推理。有望在数据处理、工程模拟、电子设计自动化、计算机辅助药物设计、量子计算和生成人工智能等领域实现新的突破。用黄仁勋的原话来说，它就是“当今世界上最...……更多

2024-03-19 11:56:00英伟,地表,教主,英伟,模型,人工智能

探索终端操作系统领域AI大模型创新趋势 OpenHarmon

...发展带来了崭新的机遇,有望通过强大的语义理解和常识推理能力大大提升智能个人代理支持功能的广度和深度。”清华大学助理研究员李元春主题分享中软国际有限公司智能物联网军团产品研发管理部总经理、OpenHarmony项目群技...……更多

2023-11-06 14:46:00终端,模型,趋势,大会,领域,智能

苹果公司公布“mm1”多模态大模型

...0亿、70亿、300亿三种参数规模，拥有图像识别和自然语言推理能力。IT之家注意到，苹果研究团队相关论文主要是利用MM1模型做实验，通过控制各种变量，找出影响模型效果的关键因素。研究表明，图像分辨率和图像标记数量对...……更多

2024-03-16 18:48:00苹果公司,模态,模型,苹果,公司,模型

摆脱Transformer依赖？这家AI初创公司推出国内首个

...能效果——记忆能力提升3倍、速度提升7倍的同时，实现推理吞吐量的5倍提升。至于为何另辟蹊径，寻求非Transformer的大模型路径，岩芯数智CEO刘凡平指出，以大规模著称的Transformer，在实际应用中的高算力和高成本，让不少中...……更多

2024-01-29 06:31:00模型,机制,公司,模型,架构,岩芯

连续两日逼近“20CM”涨停，南沙独角兽企业云从科技如何成为

...展开紧密协作，共同致力于本土算力和大型模型的训练与推理技术的发展。11月初，云从科技在投资者关系平台上答复投资者关心的问题时称，公司已与华为签署了全面合作框架协议，并已联合发布了从容大模型训推一体化解决...……更多

2023-11-15 10:18:00南沙,华为,独角兽,概念股,概念,科技

昇思MindSpore 2.3全新发布

...级实现脚本、分布式策略，运行时的统一，Baichuan2-13B的推理部署只需1天。在大模型推理上，通过LLMServing实现推理吞吐提升2倍多；升级模型压缩工具金箍棒2.0实现千亿大模型压缩至十倍。为降低开发门槛，昇思持续升级MindSpore...……更多

2024-03-24 17:47:00全新,模型,开发,中国,人工智能,框架

中国也有Sora同款训练架构公司，清华班底，智谱也投了 |

...经理。CTO鲍凡在清华大学计算机系获得博士学位，在加速推理、可控生成、基础架构、训练策略等方面已发表十余篇顶会论文。首席科学家为清华大学计算机系人工智能实验室主任、智源研究院首席科学家朱军。可以说，2023年...……更多

2024-03-14 15:12:00清华,班底,中国,架构,训练,公司

对话王田苗：万亿市场之下，大模型 + 机器人还有四大问题未解

...务设定多个小模型，并提供不同的参数训练，端到端减少推理成本。另外，将专用小 GPU 芯片置入到机器人中，也可提高任务实时性，目前特斯拉已在自动驾驶中尝试了这种做法。硬氪：今年有哪些细分场景的模型值得关注？王...……更多

2024-04-26 23:00:00机器人,模型,对话,机器,问题,市场

OpenAI机器人亮相，大模型有了“肉身”，英伟达微软都有投

...学习还能决策可以看到，Figure 01不管是在理解能力，还是推理反应都非常强大。团队特别强调，所有这些行为都没有经过远程操作，而是通过机器人自主学习。并且整段视频没有任何加速，也没有任何剪辑，全部一镜到底拍摄。...……更多

2024-03-14 17:17:00英伟,微软,肉身,机器人,模型,机器

微软推出xot新型人工智能方法

...思维搜索的领域知识。策略和价值网络指导搜索过程。在推理过程中，预训练的MCTS模块使用策略网络来探索LLM的思想轨迹。随后，LLM审查MCTS的思想并识别任何错误，然后进行额外的MCTS模拟以生成修改后的想法。最后，将修改后...……更多

2023-11-16 09:37:00微软,人工智能,人工,智能,方法,微软

英特尔推出新款AI芯片：推理性能比英伟达H100快50%

...加速器将为寻求大规模部署生成式AI的企业带来AI训练和推理方面的重大飞跃。英特尔Gaudi 3预计可大幅缩短70亿和130亿参数Llama2模型，以及1750亿参数GPT-3模型的训练时间。英特尔表示，Gaudi 3能够比英伟达上一代H100处理器训练特定...……更多

2024-04-10 10:52:00英特,英特尔,英伟,能比,推理,芯片

科大讯飞大模型新升级：20秒制作PPT，拟人语音能力超越Ch

...台训练的全民开放大模型。升级后的讯飞星火V3.5在逻辑推理、语言理解、文本生成、数学答题、代码、多模态等七大能力上均有提升。升级之后，讯飞星火的文本生成能力和数理运算能力都有提升，可以轻松回答初三的数学物...……更多

2024-01-31 07:32:00讯飞,拟人,语音,模型,能力,升级

马斯克 xAI 推出 Grok-1.5 大语言模型

...宣布，正式推出 Grok-1.5 大语言模型。Grok-1.5 具有改进的推理能力和 128k 的上下文长度，其中最显著的改进之一是其在编码和数学相关任务中的表现。Grok-1.5 将在未来几天内在平台上向早期测试人员和现有的 Grok 用户推出。在官...……更多

2024-03-29 14:00:00马斯,马斯克,模型,语言,基准,上下文

360安全大模型3.0亮相

...方案规划、目标拆解能力；判别中枢具有信息抽取、逻辑推理、是非判断、研判检测能力；道德中枢具有情感分析、道德法律能力；记忆中枢具有信息记忆能力。此外，360以安全大模型为“大脑”，构建出智能体框架，通过任务...……更多

2024-04-01 02:22:00模型,安全,安全,模型,能力,中枢

国内创业者和投资人如何看待 Figure 01 机器人：距离

...完成上面说的第二个步骤，模型中没有思维链，也不具备推理能力。PaLM-E 让机器人有了聪明的大脑，可以将复杂自然语言指令分解为简单指令，完成上面说的第一个步骤，然后再去调用 RT-1 执行动作。所以，PaLM-E 所做的只是自...……更多

2024-03-17 19:11:00多远,投资人,创业者,机器人,机器,智能

语言、机器人破壁，MIT等用GPT-4生成模拟任务，并迁移到

...策略的任务级泛化。此外从概念上讲，利用 GenSim，LLM 的推理和编码能力通过中间合成的模拟数据被提炼成了语言 - 视觉 - 行动策略。‍‍论文地址：https://arxiv.org/pdf/2310.01361.pdf‍GenSim 框架由以下三部分组成：同时该框架通过两...……更多

2023-10-17 16:58:00机器人,生成,机器,任务,语言,世界

中国电信开源星辰语义大模型，开放1t清洗数据集

...模型已与华为昇腾AI基础软硬件完成适配：支持Atlas300Ipro推理卡，具备int8量化能力；支持Atlas训练服务器，用户可使用昇思MindSpore和PyTorch框架进行模型训练和推理。 ……更多

2024-01-14 09:52:00中国电信,语义,中国,星辰,清洗,模型