推理,模型,思维,空间,模型,生成头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

o1带火的CoT到底行不行？新论文引发了论战

...To CoT or not to CoT？OpenAI ο1 的诞生极大地提升了人们对 LLM 推理能力和思维链（CoT）的兴趣。一时之间，似乎思维链很快就会成为所有 LLM 的标配，但思维链并非万能，就连 OpenAI 自己也提到 o1 在某些任务上的表现并不比 GPT-4o 强...……更多

2024-09-21 09:37:00新论,推理,符号,性能,任务,数据

理想的智能驾驶，到底「City 不 City」？

...人过去的经验和习惯所形成的直觉；系统 2 则代表了思维推理能力，人们需要借助思考和推理来处理复杂的问题和应对未知的场景。端到端模型主要用于处理常规的驾驶行为，从传感器的感知数据输入到行驶轨迹的决策输出只经...……更多

2024-07-17 10:49:00驾驶,理想,智能,理想,模型,系统

跟文心一言讨论庄周梦蝶，它让我拥抱美好世界

...和伟谁更高”，看似简单的两个问题，事实上对于产品的推理能力要求极高，首先文心一言需要搜集到问题相关的事实信息，同时要理解“共同点”“谁更高”的对比含义，并根据事实信息作出判断。相比目前一些生成式AI产品...……更多

2023-03-17 09:00:00庄周,梦蝶,文心,世界,文心,李彦

腾讯开源最大MoE大语言模型！3D大模型同时支持文/图生成，

...型，MoE模型在相同成本下效果更优，在相同规模下训练/推理成本更低，而且容量大，可训练更多数据。当前MoE的挑战有训练稳定性差、专家负载不均衡等。一些应对方案包括：1）Scaling Law探索，设计基于中小模型簇的MoE Scaling ...……更多

2024-11-06 09:41:00模型,腾讯,全家,生成,同时,语言

专注于推理的OpenAI“草莓”模型两周内发布？是人工智能下

...“秋季发布”（9月至11月）要更早。上述报道称，专注于推理能力的人工智能“草莓”发布前后还有一些亟待解决的问题，但看似“仓促上马”似乎说明OpenAI感受到了大语言模型驱动产品领域的激烈竞争压力，希望通过近几个月...……更多

2024-09-11 09:55:00人工智能,推理,草莓,人工,模型,突破

苹果大模型，不藏了

...存中的大型语言模型：在有限内存下高效的大型语言模型推理》的论文，直指大模型落地iPhone等“内存有限”设备的方法。进入新年，Siri助手将搭载生成式模型Ajax的消息，再次不胫而走。去年六月和九月的两次重要发布会，苹...……更多

2024-01-06 09:10:00模型,苹果,模型,苹果,数据,处理

对话王田苗：万亿市场之下，大模型 + 机器人还有四大问题未解

...务设定多个小模型，并提供不同的参数训练，端到端减少推理成本。另外，将专用小 GPU 芯片置入到机器人中，也可提高任务实时性，目前特斯拉已在自动驾驶中尝试了这种做法。硬氪：今年有哪些细分场景的模型值得关注？王...……更多

2024-04-26 23:00:00机器人,模型,对话,机器,问题,市场

构建数字经济新引擎：枫清科技高雪峰解读AI技术的未来趋势

...地过程中也暴露出一系列问题，如大模型“幻觉”现象、推理能力不足、解释性差等。这些问题导致很多企业面临大模型“好玩不好用”的困境。如何真正推动大模型技术在企业场景中的深度应用，成为当前AI产业发展的重要课...……更多

2024-09-13 18:28:00雪峰,趋势,数字,引擎,经济,技术

从线性注意力视角揭秘视觉Mamba,清华、阿里合作提出全新M

...模型的精度，同时保持了线性注意力优越的并行计算与高推理速度。论文链接：https://arxiv.org/abs/2405.16605 代码链接：https://github.com/LeapLabTHU/MLLA 视频讲解：https://www.bilibili……更多

2024-12-11 09:53:00阿里,清华,线性,视角,注意力,模型

腾讯发布最大开源MoE模型，3890亿参数免费可商用

...含四个主要任务：信息抽取、信息定位、定性分析和数值推理。不同于现有的长文本基准测试，”企鹅卷轴”有以下几个优势：数据多样性：”企鹅卷轴”包含了各种真实场景下的长文本，如财务报告、法律文档、学术论文等，...……更多

2024-11-07 09:54:00腾讯,商用,模型,参数,模型,数据

AI智能体引擎加持：天玑9400让「完全体」AI手机提前问世

...间了。相比之下更加「基础」的能力，如多模态大模型的推理，也可以在手机端侧进行：无论是拍数学题让 AI 解题，还是看一张外文菜单让 AI 帮忙点菜，都是几秒钟就能办到的事。这一系列技术的驱动力，都来自联发科上个星...……更多

2024-10-16 13:34:00天玑,全体,引擎,智能,手机,智能

o1金牌团队揭秘AI超越人类惊人时刻！22分完整版视频全公开

...共有8点：1 强化学习加持的o1，比人类更善于发现新的CoT推理步骤2 自我批评的涌现，是o1最强有力的时刻3 让o1「超时」前完成回答，然后突然有了「啊哈」时刻 4 scaling参数规模的挑战，以及继续沿着强化学习算法进步之路5 许...……更多

2024-09-23 09:50:00整版,金牌,团队,人类,时刻,视频

第九届信也科技杯决赛举行，探索语音大模型鉴伪应用

...新大模型的识别技术,并且考虑了模型的实用性,尝试提高推理效率、减少模型推理耗时。信也科技副总裁、大数据及AI负责人陈磊表示:“选手们探索了多种语音鉴伪方案,为对抗假语音欺诈的应用提供了不少思路。例如,有些选手...……更多

2024-07-26 11:44:00音大,决赛,模型,应用,科技,语音

英伟达地表最强，黄教主被称作AI界“霉霉”

...来支持高达10万亿参数的AI模型训练和大语言模型的实时推理。有望在数据处理、工程模拟、电子设计自动化、计算机辅助药物设计、量子计算和生成人工智能等领域实现新的突破。用黄仁勋的原话来说，它就是“当今世界上最...……更多

2024-03-19 11:56:00英伟,地表,教主,英伟,模型,人工智能

智启新元年：PC成为AI落地首选终端

...了具备高性能计算能力的通用加速芯片，是大模型训练、推理的主要算力来源；云计算的发展和普及，则使软硬件充分解耦，大模型开发者可以以相对低的成本调用大规模的算力、存储和网络资源，开发进程大大加快；同时，Tra...……更多

2023-12-22 12:43:00启新,落地,终端,模型,终端,应用

“Sora”王炸，20篇研报带你走进人工智能（下载）

...智能原理本白皮书主要内容包括了：人工智能总论、逻辑推理人工智能和计算智能、神经网络人工智能和生物人工智能、数学人工智能和物理人工智能、信息主义人工智能。提出了智能作为一个科学概念的模型、原理与方法；智...……更多

2024-02-18 09:22:00人工智能,人工,智能,人工智能,智能,人工

华东师范大学的老师，上课已经用上了大模型

...的算力，还要有灵活组合、弹性扩展的能力，既能兼顾AI推理等新型负载，又要进一步强化传统的通用计算平台及应用。第二，软硬兼修的优化适配。随着大模型在教育领域的应用兴起，高校对AI平台提出了更高的要求。一方面...……更多

2024-07-01 09:22:00华东师范大学,华东,师范,模型,老师,大学

$免训练大模型知识编辑，吸收新数据更高效｜EMNLP\\\'24$

免训练大模型知识编辑，吸收新数据更高效｜EMNLP\'24

...的连续提示学习新方法，可以提高知识终身学习的编辑和推理效率。模型编辑旨在纠正大语言模型中过时或错误的知识，同时不需要昂贵的代价进行再训练。终身模型编辑是满足LLM持续编辑要求的最具挑战性的任务。之前的工作...……更多

2024-10-30 09:57:00模型,训练,知识,数据,模型,知识

质量超越o1，UCSD张怡颖教授团队开源生成式AI工作流自动

...ble)（外循环）：构建并结合多个模块来完成任务。多步推理 (Multi-step Reasoning)（内循环）：要求 LLM 逐步推理。少样本学习 (Few-shot Learning)（内循环）：从输入样本中添加一些高质量的示例演示。模型选择 (Model SelectioN……更多

2024-12-05 09:43:00张怡,工作流,生成,教授,团队,质量

chatgpt低成本复现流程开源

...。相比原生PyTorch，单机训练速度最高可提升7.73倍，单卡推理速度提升1.42倍，仅需一行代码即可调用。对于微调任务，可最多提升单卡的微调模型容量3.7倍，同时保持高速运行，同样仅需一行代码。要知道，ChatGPT火是真的火，...……更多

2023-02-15 15:47:00流程,成本,模型,训练,内存,参数

“3D视频版Sora”来了！

...，用户可任意指定摄像机角度。目前，SV4D可以通过一次推理，在约40秒内生成8个视图的各5帧视频，整个4D优化需要20-25分钟。该模型已在Hugging Face上开源，适用于游戏开发、视频编辑、虚拟现实（VR）等场景的应用，可免费用于...……更多

2024-07-26 09:30:00视频,视频,模型,视图,生成,视角

华人团队爆火instructblip抢跑看图聊天

...成员：InstructBLIP据介绍，InstructBLIP模型更擅长「看」、「推理」和「说」，即能够对复杂图像进行理解、推理、描述，还支持多轮对话等。比如，下图这一场景可能发生了什么？InstructBLIP推理出，可能飓风，或者恶劣的天气因素...……更多

2023-05-15 20:17:00团队,华人,指令,数据,模型,研究

关于LLM-as-a-judge范式，终于有综述讲明白了

...的帮助性，无害性，可靠性，生成 / 检索文档的相关性，推理过程中每一步的可行性，以及生成文本的综合质量。Methodology：如何评判表 1：LLM-as-a-judge 训练方法（1）微调：最近许多工作开始探索如何使用微调技术来训练一个...……更多

2024-12-04 09:49:00范式,模型,基准,偏见,数据,评估

4000亿参数，国产大模型硬刚Llama 3？｜钛媒体AGI

...上一代，天工3.0的模型技术知识能力提升超过20%，数学、推理、代码、文创能力提升超过30%，多模态性能超越GPT-4V。同样在4月17日，昆仑万维还宣布，中国首个音乐SOTA（领域最佳水准）模型“天工SkyMusic”音乐大模型也正式开启...……更多

2024-04-19 16:00:00模型,国产,参数,媒体,天工,模型

如何跑赢生成式AI竞赛？云计算大厂揭秘组合拳：自研大模型只是

...胜在全面，有琳琅满目的大模型品类，还有加速从训练到推理的各种工具“套餐”，以及围绕平台、存储、网络、数据库的一系列升级……一切变动都指向一个目的，即让云客户更快更方便地用生成式AI产生价值。一、大模型货...……更多

2024-12-16 09:15:00大厂,组合拳,竞赛,生成,模型,只是

推理性能直逼o1，DeepSeek再次出手，重点：即将开源

...出手了，这次又是重磅炸弹。昨晚，DeepSeek 上线了全新的推理模型 DeepSeek-R1-Lite-Preview，直接冲击 OpenAI o1 保持了两个多月的大模型霸主地位。在美国数学竞赛（AMC）中难度等级最高的 AIME 以及全球顶级编程竞赛（codeforces）等权...……更多

2024-11-22 09:50:00推理,性能,再次,重点,模型,推理