推理,模型,极限,突破,学习,模型头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

百度文心大模型4.0技术进展

...3.5，在基础模型升级、精调技术创新、知识点增强、逻辑推理增强、插件机制等方面创新突破，取得效果和效率的提升。今天发布的文心大模型4.0，相比3.5版本，理解、生成、逻辑、记忆四大能力都有显著提升。其中理解和生成...……更多

2023-10-18 04:20:00文心,进展,模型,技术,模型,文心

PC正在经历AI时代下一代Windows 12将是AI P

...态下也能使用；第三，降低大模型使用成本，在本地免费推理为主，云端公共推理为辅的情况下，一次购买AI PC即可享受全生命周期的本地免费推理服务；第四，提供可信、安全的个人数据和隐私保障，包括个性化本地知识库、...……更多

2023-12-17 21:02:00下一代,载体,正在,时代,推理,个人

云计算一哥终于搞多模态了：一口气6个大模型，还有个3nm芯片

...mazon Nova Premier：亚马逊最强多模态大模型，可处理复杂的推理任务，也可用于蒸馏客户定制化的模型。在现场，Andy也晒出了Amazon Nova在CRAG、BFCL、VisualWebBench和Mind2Web等Benchmarks上取得的分数。从成绩中不难看出，其在检索增强……更多

2024-12-05 09:45:00模态,一口,芯片,模型,一口气,亚马

4090笔记本0.37秒直出大片！英伟达联手MIT清华祭出S

...仅解码器LLM）作为文本编码器，以增强对提示词的理解和推理能力。尽管T2I生成模型多年来取得了显著进展，但大多数现有模型仍依赖CLIP或T5进行文本编码，这些模型往往缺乏强大的文本理解和指令跟随能力。与CLIP或T5不同，Gem...……更多

2024-10-18 09:49:00英伟,清华,架构,大片,性能,笔记本

手机银行APP变身“金融Siri”：你的理财顾问会是个聊天框

...ek、GPT-5、Grok3为代表的通用大模型技术飞速发展，其逻辑推理与多模态能力显著提升，推动金融行业从“数据驱动”迈向“智能驱动”新阶段。大模型以其卓越的逻辑推理、多模态处理能力和高度的可定制性，为金融机构提供了...……更多

2025-03-03 15:09:00手机银行,顾问,银行,金融,手机,模型

连发两款模型“补课”，百度AI成色如何？

...李彦宏，百度近日低调发布两款大模型——文心4.5和深度推理模型文心X1，免费。两年前的3月，百度发布了对标ChatGPT的文心一言。这是全球大厂中首个生成式AI产品，也让外界看到百度相对迅速的先手布局。不过，百度后来采取...……更多

2025-03-20 11:38:00成色,补课,模型,文心,模型,模态

对着3个中国AI大模型，两个美国科技界大佬深聊了半小时

...前AI行业快速发展，竞争也越来越激烈，特别是各种高级推理模型之间的竞争。过去一段时间，中国科技公司陆续发布了3款自研的AI模型，分别是DeepSeek（深度求索）的Deepseek R1、阿里巴巴的Marco-1以及香港中文大学与商汤科技的...……更多

2024-12-04 09:48:00大佬,科技界,美国,模型,两个,小时

OpenAI发布GPT-4.5：情商高、更擅长骗其他AI打钱

...在GPT‑4.5的系统卡/说明书中，OpenAI表示，相比于之前的推理模型，GPT‑4.5并未引入7个全新的前沿能力，并且在大多数准备度能力评估中，其表现低于o1、o3-mini和深度研究模型。OpenAI也承认，相信推理会成为未来AI模型和核心能...……更多

2025-02-28 06:23:00情商,模型,推理,公司,方面,能力

大模型新趋势之MoE：现状、挑战及研究方向

...，MoE在训练过程通过门控模型实现“因材施教”，进而在推理过程实现专家模型之间的“博采众长”。图1MoE架构原理示意图1MoE的特征优势是专家化、动态化、稀疏化，在模型研发成本、训练/推理效率和整体性能之间实现最佳...……更多

2024-11-04 16:00:00研究方向,模型,现状,方向,趋势,研究

数字智能与物理世界双向奔赴（一周科技观察）

...据，自动生成结构化电子病历，同时基于多模态数据深度推理生成智能辅助诊断；西湖大学自然语言处理实验室团队研发出AI生成文本检测模型，可以判断稿件是不是由AI创作。由AI技术加持的人形机器人，开始下车间、进课堂。...……更多

2025-03-17 05:36:00双向,物理,观察,数字,智能,世界

阿里云CTO周靖人：全面投入升级AI大基建

...级从服务器到计算、存储、网络、数据处理、模型训练和推理平台的技术架构体系，让数据中心成为一台超级计算机，为每个AI和应用提供高性能、高效的算力服务。大会现场，通义大模型迎来了年度重磅发布，基础模型升级，...……更多

2024-09-19 15:53:00阿里,基建,投入,升级,模型,通义

华能水电获得发明专利授权：“基于ONNX的目标检测模型库系统

...实现跨框架的深度学习模型部署；使用ONNXRuntime得到模型推理结果，为每个模型编写独立的推理代码，将结果转化为系统所需的统一格式；根据检测结果进行可视化处理，在系统中展示检测后的图像以及相应的评价指标；模型库...……更多

2025-02-13 03:23:00华能,水电,模型,检测,专利,目标

Meta祭出三篇最详尽Llama微调指南！千字长文，0基础小

...类型的信息：- 仅输入和输出文本，也就是少样本学习- 推理追踪：添加中间推理步骤，可参阅思维链（COT）提示- 计划和反思追踪：添加信息，教LLM计划和反思其解决问题的策略，可参阅ReACT 选择正确的适配方法要决定上述哪...……更多

2024-08-27 12:03:00小白,长文,千字,基础,指南,训练

云鼎科技：基于DeepSeek，打造垂域矿山大模型

...模型的性能水平，从而显著增强自有模型在矿山行业中的推理能力，最终蒸馏出首个基于DeepSeek-R1的垂域矿山大模型。在降低算力消耗的同时，使更小参数的模型获得更加高效、精准的推理能力，应用于山能知识助手中，经测试...……更多

2025-02-26 22:55:00矿山,模型,科技,模型,应用,数据

宋亭亭等：DeepSeek或催化中高阶智驾加速渗透

...车端算力要求带来了革命性的降低。通过将云端大模型的推理能力高效迁移至车端轻量模型，DeepSeek有望在保持高性能的同时，显著降低计算开销，为VLA、世界模型等复杂模型在车端部署扫清算力障碍。这一技术有望助力高阶智...……更多

2025-02-12 11:10:00亭亭,高阶,催化,模型,数据,训练

三个大模型组队挑战o1，实测360多模型协作干掉提示词工程

...横空出世，开启了大模型演化的新范式——Inference law（推理定律）。正如英伟达AI科学家Jim Fan所说，o1的出现标志着大模型研发者开始把集中在训练阶段的投入，开始转移到了推理过程。Jim还引用了机器学习先驱Rich Sutton的经典...……更多

2024-09-21 09:45:00模型,实测,协作,三个,提示,工程

OpenAI未来猛料全曝光！奥特曼承认自己最大弱点是产品

...所删改。最后还有11个快问快答彩蛋～内容速览o1代表的推理模型这个方向对OpenAI非常重要。创业公司的主要业务不要对着现有模型打补丁。难道大家已经忘了几年前的模型表现多糟糕吗？其实才过去没几年。同样的价值下，...……更多

2024-11-06 09:42:00奥特,奥特曼,弱点,产品,模型,事情

谷歌「诚意之作」，开源9B、27B版Gemma2，主打高效、

... 2此次提供的90亿（9B）和270亿（27B）参数的两个版本，其推理性能和效率均优于第一代，并具有显著的安全性改进。事实上，270亿参数版本可以与体积超过其两倍的模型进行同等级别的竞争，并且提供了此前只有专有模型才能实...……更多

2024-06-29 09:37:00诚意,经济,模型,训练,性能,注意力

o1 基石论文火爆传阅：Ilya 仍是关键先生，核心项目清北

...后的贡献者。Ilya 在 o1 的作用 OpenAI o1 主打进行通用复杂推理，在输出回答之前，会在产生一个很长的思维链，以此增强模型能力。而 Ilya 此前合著的这篇论文主要就是探讨了提高大语言模型多步推理能力的方法。他们主要比较...……更多

2024-09-18 09:51:00基石,闪光,校友,火爆,核心,先生

DeepSeek“朋友圈”不断扩围：10家国内外云厂商宣布接

...eepSeek-R1。作为一款开源模型，R1在数学、代码、自然语言推理等任务上的性能能够比肩OpenAI o1模型正式版，并采用MIT许可协议，支持免费商用、任意修改和衍生开发等。截至2月5日，国内外已有众多云平台宣布上线DeepSeek- R1大模...……更多

2025-02-06 07:23:00家国,接入,不断,厂商,朋友,用户

对话云天励飞董事长陈宁：2030年人类将实现AGI，推理芯片

...拥有一个AI Agent。“如果说2024年是大模型落地应用之年，推理就会越来越重要。此前在训练芯片市场上，英伟达一骑绝尘，占有绝对的市场占有率，那么今天，推理芯片市场没有垄断性的巨头。这不仅是万亿级、万亿颗芯片的蓝...……更多

2024-03-30 18:00:00陈宁,云天,推理,董事长,芯片,董事

英伟达没有慌，黄仁勋再谈DeepSeek：“推理”的计算需求

...于DeepSeek、Grok、OpenAl等冲击，AI正在从感知和生成式AI向推理和逻辑推理领域发展。而推理AI又增加了一条扩展规律——增加训练的计算能力能让模型变得更智能，而增加深度思考的计算能力则能让答案更精准，与一次性推理相比...……更多

2025-02-27 11:55:00英伟,推理,需求,英伟,增长,推理

赋能千行百业思必驰以垂域大模型引领AI+融合新浪潮

...“小驰”的“聊天”将更加天马行空。“DeepSeek擅长逻辑推理，我们的DFM-2大模型具备跨多个专业垂直领域的综合大模型集合能力，能够学习和利用DeepSeek的逻辑推理能力，并基于在各个垂直领域的应用经验，多维度提升DFM大模型...……更多

2025-02-14 13:01:00新浪潮,新浪,百业,模型,苏州,模型

年度生成式AI大会上海站公布最新嘉宾，报名进入最后阶段

...成热潮，多模态世界模型的研究热度渐起。更具革命性的推理模型o1悄然出世，带来的思维链CoT+强化学习这一新范式，正推动生成式AI迈入新的阶段。大语言模型仍在狂飙，但价格战、营销战硝烟燃起，融资热度正在降温。不过...……更多

2024-11-26 09:38:00上海站,上海,嘉宾,生成,阶段,大会

苹果取得技术突破：可在 iPhone 上运行大型语言模型

...为“闪存中的LLM：利用有限内存实现高效的大型语言模型推理（LLMinaflash:EfficientLargeLanguageModelInferencewithLimitedMemory）”的论文中，研究人员提出了一种巧妙的闪存利用技术，将LLM模型的数据存储在闪存中。作者指出，与传统用于……更多

2023-12-21 22:47:00可在,模型,苹果,运行,突破,语言