推理,模型,思维,空间,模型,生成头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...共有8点：1 强化学习加持的o1，比人类更善于发现新的CoT推理步骤2 自我批评的涌现，是o1最强有力的时刻3 让o1「超时」前完成回答，然后突然有了「啊哈」时刻 4 scaling参数规模的挑战，以及继续沿着强化学习算法进步之路5 许...……更多

2024-09-23 09:50:00整版,金牌,团队,人类,时刻,视频

腾讯发布最大开源MoE模型，3890亿参数免费可商用

...含四个主要任务：信息抽取、信息定位、定性分析和数值推理。不同于现有的长文本基准测试，”企鹅卷轴”有以下几个优势：数据多样性：”企鹅卷轴”包含了各种真实场景下的长文本，如财务报告、法律文档、学术论文等，...……更多

2024-11-07 09:54:00腾讯,商用,模型,参数,模型,数据

阿里云支持一键部署DeepSeek-V3/R1！仅需3步、0

...写代码，即可通过阿里云平台实现从模型训练到部署再到推理的全过程，极大地简化了AI模型的开发流程。根据官方介绍，一键部署DeepSeek模型的操作流程非常简单，仅需以下3步：登陆PAI控制台，在左侧导航栏选择工作空间列表...……更多

2025-02-03 19:40:00一键,阿里,仅需,代码,支持,模型

360智脑大模型重新定义AI数字人

...话、代码能力、文本分类、文本改写、阅读理解、逻辑与推理、知识问答、多模态、翻译等十大核心能力，维度涵盖数百项细分功能，可覆盖大模型全部应用场景，并在多个第三方评测中位居国产大模型第一梯队。会上周鸿祎表...……更多

2023-06-14 12:18:00模型,数字,数字,周鸿,能力,模型

AI幻觉：它真的会一本正经胡说八道！

...情况时，会基于自己的“经验”（训练数据）进行填补和推理。这不是因为它想要欺骗我们，而是因为它在试图用自己理解的模式来完成这个任务。1、基于统计关系的预测因为AI（尤其是像ChatGPT这样的语言模型）通过大量的训...……更多

2025-02-19 18:57:00八道,一本,幻觉,幻觉,内容,模型

国内企业竞速“垂直大模型”新赛道

...理，利用预训练语言模型中的自然语言理解能力、思维链推理能力，结合天眼查的中控技术，精准识别用户真实意图，并返回天眼查商业知识库中的商查数据和商查知识结果，实现数据可信。在汽车领域，百度智能云为长安汽车...……更多

2023-07-27 07:50:00竞速,赛道,模型,企业,模型,携程

英伟达地表最强，黄教主被称作AI界“霉霉”

...来支持高达10万亿参数的AI模型训练和大语言模型的实时推理。有望在数据处理、工程模拟、电子设计自动化、计算机辅助药物设计、量子计算和生成人工智能等领域实现新的突破。用黄仁勋的原话来说，它就是“当今世界上最...……更多

2024-03-19 11:56:00英伟,地表,教主,英伟,模型,人工智能

第九届信也科技杯决赛举行，探索语音大模型鉴伪应用

...新大模型的识别技术,并且考虑了模型的实用性,尝试提高推理效率、减少模型推理耗时。信也科技副总裁、大数据及AI负责人陈磊表示:“选手们探索了多种语音鉴伪方案,为对抗假语音欺诈的应用提供了不少思路。例如,有些选手...……更多

2024-07-26 11:44:00音大,决赛,模型,应用,科技,语音

英伟达发布超级芯片、OpenAI在中国申请注册“GPT-5”

...合了 Anthropic 最近发布的 Claude2的优势，在数学、编码、推理和安全等领域取得了显著进步。内部测试显示，Claude Instant1.2在编码基准测试中的得分比1.1版本高出近6个百分点，并且在一组数学问题上的得分也有所提升。 DARPA发起...……更多

2023-08-15 01:10:00英伟,小米,周报,中国,芯片,模型

“Sora”王炸，20篇研报带你走进人工智能（下载）

...智能原理本白皮书主要内容包括了：人工智能总论、逻辑推理人工智能和计算智能、神经网络人工智能和生物人工智能、数学人工智能和物理人工智能、信息主义人工智能。提出了智能作为一个科学概念的模型、原理与方法；智...……更多

2024-02-18 09:22:00人工智能,人工,智能,人工智能,智能,人工

腾讯自研混元大模型亮相，将通过腾讯云对外开放

...万亿tokens，具备强大的中文创作能力，复杂语境下的逻辑推理能力，以及可靠的任务执行能力。据腾讯称，腾讯混元大模型是“从实践中来，到实践中去”的实用级大模型。腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会...……更多

2023-09-07 13:57:00腾讯,对外开放,模型,对外,开放,腾讯

华东师范大学的老师，上课已经用上了大模型

...的算力，还要有灵活组合、弹性扩展的能力，既能兼顾AI推理等新型负载，又要进一步强化传统的通用计算平台及应用。第二，软硬兼修的优化适配。随着大模型在教育领域的应用兴起，高校对AI平台提出了更高的要求。一方面...……更多

2024-07-01 09:22:00华东师范大学,华东,师范,模型,老师,大学

智启新元年：PC成为AI落地首选终端

...了具备高性能计算能力的通用加速芯片，是大模型训练、推理的主要算力来源；云计算的发展和普及，则使软硬件充分解耦，大模型开发者可以以相对低的成本调用大规模的算力、存储和网络资源，开发进程大大加快；同时，Tra...……更多

2023-12-22 12:43:00启新,落地,终端,模型,终端,应用

$免训练大模型知识编辑，吸收新数据更高效｜EMNLP\'24$

免训练大模型知识编辑，吸收新数据更高效｜EMNLP'24

...的连续提示学习新方法，可以提高知识终身学习的编辑和推理效率。模型编辑旨在纠正大语言模型中过时或错误的知识，同时不需要昂贵的代价进行再训练。终身模型编辑是满足LLM持续编辑要求的最具挑战性的任务。之前的工作...……更多

2024-10-30 09:57:00模型,训练,知识,数据,模型,知识

2023服贸会｜大模型光环之下科技巨头逐鹿AI赛道

...凭借其掌握的超过10亿与图像相关的参数，执行多达20步推理，创作出用户想要的图像。北京商报记者在现场了解到，完成这些任务全程无需联网、无需访问云端，全部在手机端完成且用时不超过15秒，是迄今为止在智能手机上实...……更多

2023-09-02 23:23:00赛道,光环,巨头,模型,科技,中国

商汤日日新大模型体系更迭升级，金融、医疗等行业场景落地已超2

...大模型商量2.0，徐立透露，其AI代码助手性能全面提升，推理效率提升619%，HumanEval测试集一次通过率达48.7%，超过GPT-3.5的48.1%。而且，无需训练模型，就可以快速融合知识生成，搭配企业知识库可以快速解决相关领域问题。此外...……更多

2023-07-11 13:00:00商汤,落地,模型,场景,体系,升级

质量超越o1，UCSD张怡颖教授团队开源生成式AI工作流自动

...ble)（外循环）：构建并结合多个模块来完成任务。多步推理 (Multi-step Reasoning)（内循环）：要求 LLM 逐步推理。少样本学习 (Few-shot Learning)（内循环）：从输入样本中添加一些高质量的示例演示。模型选择 (Model SelectioN……更多

2024-12-05 09:43:00张怡,工作流,生成,教授,团队,质量

推理性能直逼o1，DeepSeek再次出手，重点：即将开源

...出手了，这次又是重磅炸弹。昨晚，DeepSeek 上线了全新的推理模型 DeepSeek-R1-Lite-Preview，直接冲击 OpenAI o1 保持了两个多月的大模型霸主地位。在美国数学竞赛（AMC）中难度等级最高的 AIME 以及全球顶级编程竞赛（codeforces）等权...……更多

2024-11-22 09:50:00推理,性能,再次,重点,模型,推理