推理,框架,模型,苹果,训练,语言头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

英伟达地表最强，黄教主被称作AI界“霉霉”

...来支持高达10万亿参数的AI模型训练和大语言模型的实时推理。有望在数据处理、工程模拟、电子设计自动化、计算机辅助药物设计、量子计算和生成人工智能等领域实现新的突破。用黄仁勋的原话来说，它就是“当今世界上最...……更多

2024-03-19 11:56:00英伟,地表,教主,英伟,模型,人工智能

北大推出全新机器人多模态大模型！面向通用和机器人场景的高效推

...码仓库 Trending Research 第一位。为了赋予机器人端到端的推理和操纵能力，本文创新性地将视觉编码器与高效的状态空间语言模型集成，构建了全新的 RoboMamba 多模态大模型，使其具备视觉常识任务和机器人相关任务的推理能力，...……更多

2024-06-21 09:52:00机器,模态,人多,机器人,推理,北大

小红书技术副总裁王晓博：大模型让AI越来越像人，更懂小红书的

...数据对用户和内容进行建模，会导致新笔记分发难，缺乏推理能力导致信息茧房等问题。在小红书的推荐系统中，率先将大模型作为笔记的语义编码器来使用，通过语义压缩提示词（prompt）结合对比学习技术，让大模型能够把笔...……更多

2024-07-08 14:43:00小红,越来,副总,模型,越来越,内容

一块GPU都没用，苹果自研大模型干翻GPT-4？

...参数。报告首次对AFM的模型架构、训练数据、训练过程、推理优化及评估结果进行了解读，并提到背后模型的训练采用的是累计10240颗谷歌TPU，而未提及英伟达GPU。根据论文描述，苹果自研大模型在指令遵循、文本总结方面测试...……更多

2024-07-31 09:37:00模型,苹果,模型,苹果,开发者,开发

$免训练大模型知识编辑，吸收新数据更高效｜EMNLP\'24$

免训练大模型知识编辑，吸收新数据更高效｜EMNLP'24

...的连续提示学习新方法，可以提高知识终身学习的编辑和推理效率。模型编辑旨在纠正大语言模型中过时或错误的知识，同时不需要昂贵的代价进行再训练。终身模型编辑是满足LLM持续编辑要求的最具挑战性的任务。之前的工作...……更多

2024-10-30 09:57:00模型,训练,知识,数据,模型,知识

刚刚，OpenAI震撼发布o1大模型！强化学习突破LLM推理

...专门解决难题。这是一个重大突破，新模型可以实现复杂推理，一个通用模型解决比此前的科学、代码和数学模型能做到的更难的问题。OpenAI 称，今天在 ChatGPT 和大模型 API 中新发布的是该系列中的第一款模型，而且还只是预览...……更多

2024-09-13 16:42:00推理,模型,极限,突破,学习,模型

探索终端操作系统领域AI大模型创新趋势 OpenHarmon

...发展带来了崭新的机遇,有望通过强大的语义理解和常识推理能力大大提升智能个人代理支持功能的广度和深度。”清华大学助理研究员李元春主题分享中软国际有限公司智能物联网军团产品研发管理部总经理、OpenHarmony项目群技...……更多

2023-11-06 14:46:00终端,模型,趋势,大会,领域,智能

全球首篇！调研近400篇文献，鹏城实验室&中大深度解析具身智

...感知未来视觉感知的 “北极星” 是以具身为中心的视觉推理和社会智能。如下图所示，不同于仅仅识别图像中的物体，具有具身感知能力的智能体必须在物理世界中移动并与环境互动，这需要对三维空间和动态环境有更透彻的...……更多

2024-07-29 09:39:00中大,文献,调研,深度,实验室,实验

价格便宜75%！亚马逊推出全新大模型系列，3纳米自研芯片明年

...强合作，两家公司共同推出Claude 3.5 Haiku延迟优化版，将推理速度提高60%。亚马逊已经对Anthropic累计投资80亿美元。Anthropic的联合创始人兼首席计算官Tom Brown也在会上亮相，宣布公司启动“雷尼尔计划”（Project Rainier），在未来将...……更多

2024-12-04 22:47:00亚马,亚马逊,价格便宜,纳米,芯片,模型

苹果公司公布“mm1”多模态大模型

...0亿、70亿、300亿三种参数规模，拥有图像识别和自然语言推理能力。IT之家注意到，苹果研究团队相关论文主要是利用MM1模型做实验，通过控制各种变量，找出影响模型效果的关键因素。研究表明，图像分辨率和图像标记数量对...……更多

2024-03-16 18:48:00苹果公司,模态,模型,苹果,公司,模型

蚂蚁自研知识增强大模型服务框架KAG，可显著提升知识推理准确

...地，也一定要对时间、数字和逻辑敏感，无论让它做多跳推理，还是逻辑规则数字计算，而这些恰好是大语言模型所不擅长的，包括前一段时间热议的 9.9 和 9.12 比大小的例子。基于此，我们认为在垂直领域落地的时候，大语言...……更多

2024-09-13 13:33:00知识,准确率,推理,蚂蚁,框架,模型

这才是真开源模型！公开后训练一切，性能超越Llama 3.1

...著提升，而背后的成功离不开后训练阶段强化学习训练和推理阶段思考计算量的增大。基于此，有人认为，新的扩展律 —— 后训练扩展律（Post-Training Scaling Laws）已经出现，并可能引发社区对于算力分配、后训练能力的重新思...……更多

2024-11-26 09:44:00模型,性能,训练,模型,训练,数据

摆脱Transformer依赖？这家AI初创公司推出国内首个

...能效果——记忆能力提升3倍、速度提升7倍的同时，实现推理吞吐量的5倍提升。至于为何另辟蹊径，寻求非Transformer的大模型路径，岩芯数智CEO刘凡平指出，以大规模著称的Transformer，在实际应用中的高算力和高成本，让不少中...……更多

2024-01-29 06:31:00模型,机制,公司,模型,架构,岩芯

比LoRA更高效！上交大&哈佛推出新微调框架，瞄准特定任务方

比LoRA更高效的模型微调方法来了——以常识推理为例，在参数量减少8~16倍的情况下，两种方法能达到相同效果。新方法名叫LoRA-Dash，由来自上海交通大学和哈佛大学的研究人员提出，主要针对特定任务微调模型往往需要大量计...……更多

2024-09-18 09:57:00哈佛,交大,框架,方向,任务,方向

综合RLHF、DPO、KTO优势，统一对齐框架UNA来了

...，LLM 仍然存在生成不当或偏离预期的结果。这种现象在推理过程中尤为突出，常常导致不准确、不符合语境或不合伦理的回答。为了解决这一问题，学术界和工业界提出了一系列对齐（Alignment）技术，旨在优化模型的输出，使...……更多

2024-10-10 09:56:00框架,优势,统一,综合,模型,奖励

清华领衔发布多模态评估MultiTrust：GPT-4可信度

...息时可能出现的错误回答，以及在涉及安全问题的多模态推理中出现误判。尽管模型可以正确识别图中的酒水，但在进一步的推理中，部分模型并不能意识到其与头孢药物共用的潜在风险。图7 模型在涉及安全问题的推理中出现...……更多

2024-07-25 09:31:00模态,清华,可信度,领衔,可信,几何

位列第一梯队，腾讯混元再度领跑国内大模型

...维度的综合性测评基准，由十大基础任务组成，包括逻辑推理、代码、语言理解、长文本、角色扮演等。本次报告选取了国内外具有代表性的32个大模型4月份的版本，通过多维度综合性测评，真实准确地反映了国内外大模型在中...……更多

2024-05-06 16:52:00腾讯,梯队,模型,腾讯,模型,能力

连续两日逼近“20CM”涨停，南沙独角兽企业云从科技如何成为

...展开紧密协作，共同致力于本土算力和大型模型的训练与推理技术的发展。11月初，云从科技在投资者关系平台上答复投资者关心的问题时称，公司已与华为签署了全面合作框架协议，并已联合发布了从容大模型训推一体化解决...……更多

2023-11-15 10:18:00南沙,华为,独角兽,概念股,概念,科技

补齐Transformer规划短板又不放弃快速思考，Dual

...些解答或慢点思考。OpenAI ο1 模型的发布掀起了人们对 AI 推理过程的关注，甚至让现在的 AI 行业开始放弃卷越来越大的模型，而是开始针对推理过程进行优化了。今天我们介绍的这项来自 Meta FAIR 田渊栋团队的研究也是如此，其...……更多

2024-10-17 09:47:00优势,规划,推理,轨迹,模型,慢速

支持1024帧、准确率近100％，英伟达「LongVILA」

...微调，(4) LLM 的上下文扩展，以及 (5) 长监督微调。对于推理，MM-SP 解决了 KV 缓存内存使用率的挑战，这在处理非常长的序列时会成为瓶颈。通过使用 LongVILA 增加视频帧数，实验结果表明该研究在 VideoMME 和长视频字幕任务上的...……更多

2024-08-22 09:51:00英伟,准确率,支持,视频,序列,训练

对话王田苗：万亿市场之下，大模型 + 机器人还有四大问题未解

...务设定多个小模型，并提供不同的参数训练，端到端减少推理成本。另外，将专用小 GPU 芯片置入到机器人中，也可提高任务实时性，目前特斯拉已在自动驾驶中尝试了这种做法。硬氪：今年有哪些细分场景的模型值得关注？王...……更多

2024-04-26 23:00:00机器人,模型,对话,机器,问题,市场

昇思MindSpore 2.3全新发布

...级实现脚本、分布式策略，运行时的统一，Baichuan2-13B的推理部署只需1天。在大模型推理上，通过LLMServing实现推理吞吐提升2倍多；升级模型压缩工具金箍棒2.0实现千亿大模型压缩至十倍。为降低开发门槛，昇思持续升级MindSpore...……更多

2024-03-24 17:47:00全新,模型,开发,中国,人工智能,框架

中国也有Sora同款训练架构公司，清华班底，智谱也投了 |

...经理。CTO鲍凡在清华大学计算机系获得博士学位，在加速推理、可控生成、基础架构、训练策略等方面已发表十余篇顶会论文。首席科学家为清华大学计算机系人工智能实验室主任、智源研究院首席科学家朱军。可以说，2023年...……更多

2024-03-14 15:12:00清华,班底,中国,架构,训练,公司

奥林匹克竞赛里选最聪明的AI：Claude-3.5-Sonn

...异，近来Anthropic公司最新发布的Claude-3.5-Sonnet因在知识型推理、数学推理、编程任务及视觉推理等任务上设立新行业基准而引发广泛讨论：Claude-3.5-Sonnet 已经取代OpenAI的GPT4o成为世界上”最聪明的AI“（Most Intelligent AI）了……更多

2024-06-25 09:45:00奥林,奥林匹克,竞赛,模型,推理,能力

OpenAI机器人亮相，大模型有了“肉身”，英伟达微软都有投

...学习还能决策可以看到，Figure 01不管是在理解能力，还是推理反应都非常强大。团队特别强调，所有这些行为都没有经过远程操作，而是通过机器人自主学习。并且整段视频没有任何加速，也没有任何剪辑，全部一镜到底拍摄。...……更多

2024-03-14 17:17:00英伟,微软,肉身,机器人,模型,机器

NPU全球出货超1亿颗！芯原如何迎战大模型时代的边缘计算变革

...C9X00AI是AI-GPU/AI-PC，Tensor Core GPU IP CCTC-MP则面向大语言模型推理、训练。芯原NPU IP研发副总裁查凯南谈道，NPU的发展近年来大概有三个方向：首先是DEEP AI，在很多嵌入式设备里面，要把AI跟其它的处理IP做比较紧耦合的绑定，可以...……更多

2024-06-14 09:18:00变革,模型,边缘,时代,全球,模型