训练,效果,数据,研究,国际,模型头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

大模型不会照搬训练数据中的数学推理，回答事实问题和推理问题的「思路」也不一样。大语言模型的「推理」能力应该不是推理，在今年 6 月，一篇 Nature 论文《Language is primarily a tool for communication rather than thought》曾引发……更多

2024-11-23 09:42:00推理,模型,思路,原理,推理,模型

伏羲大模型亮相：人工智能助力解决次季节和极端天气预测难题

...数学公式“发愁”。漆远介绍道，这类模型首先需要接受训练，即识别大量历史气象数据中的模式。当接收到最新气象数据时，人工智能天气模型通过应用从历史模式中习得的知识来完成预测。该过程的计算强度要小得多，并且...……更多

2023-12-15 09:21:00伏羲,人工智能,极端,人工,难题,模型

冰毒配方脱口而出，过去时态让GPT-4o防线崩塌！成功率从1

...以上是来自EPFL机构研究人员的最新发现，在当前LLM拒绝训练方法中，存在一个奇怪的泛化差异：仅仅将有害的请求改写成过去时态，通常就足以破解许多领先的大模型的安全限制。论文地址：https://arxiv.org/pdf/2407.11969值得一提的...……更多

2024-07-22 09:44:00冰毒,而出,时态,成功率,防线,配方

谷歌世界模型：单张图生成可玩3D世界，还要和马斯克一起做AI

...种可控制动作、可玩的 3D 环境，而这些 3D 环境又可用于训练和评估具身智能体。DeepMind 表示，Genie 2 只需使用单张提示图像，就能生成可供人类或 AI 智能使用键鼠输入游玩的环境。我们知道，在 AI 研究领域，游戏扮演着一个重...……更多

2024-12-06 09:53:00马斯,马斯克,世界,生成,模型,生成

提质降价，国产大模型加速奔跑

...化数据，关注数据与实际场景的一致性和配适性；三是在训练过程中找到最优的调试参数。李景秋说，依托大模型强大的能力，百度智能云千帆平台开始与更多行业和企业进行合作。比如，在教育领域，借助大模型，“考试宝”...……更多

2025-02-05 03:48:00模型,国产,模型,国产,能力,成本

致敬浪潮“她”力量丨成功秘诀？不过是把“我能行”，用代码写了

...多路召回和重排序机制提升检索效果；有人建议采用对抗训练方法，增强模型的推理和答案选择能力；还有人提出优化模型融合和选择策略，通过融合多种结构不同的模型提升准确率。”在无数次激烈的思维碰撞以及训练优化中...……更多

2025-03-14 17:54:00能行,浪潮,秘诀,力量,代码,成功

美国东北大学提出视频数据增强方法，能让视频模型学到更好的表征

...增强方法由于其缓解过拟合的特性，而被广泛使用在模型训练过程中，例如图像的旋转、缩放、颜色的改变等等。然而，美国东北大学三年级博士生张一天和所在团队发现作为图像色彩的一个重要属性，色调（Hue）的变化却在现...……更多

2024-05-07 10:12:00东北大学,视频,美国,模型,方法,数据

大模型是否有推理能力？DeepMind数月前的论文让AI社区

...的 LLM 无法进行真正的逻辑推理；相反，它们试图复制在训练数据中观察到的推理步骤」。然而，事实真的是这样吗？谷歌 DeepMind 的一篇论文似乎得出了相反的结论。最近，DeepMind 今年 2 月份的一篇论文在社交媒体上掀起了一些...……更多

2024-10-23 12:05:00推理,模型,能力,论文,社区,模型

只要一张图就能还原绘画过程，这篇论文比Paints-UNDO

...问题，ProcessPainter 通过在合成数据和人类画师绘画视频上训练时序模型，首次实现了让扩散模型生成绘画过程。此外，不同题材、画师的绘画过程差异巨大，风格迥异。然而，目前很少有研究将绘画过程作为研究对象。论文作者...……更多

2024-07-31 09:39:00绘画,过程,论文,绘画,过程,生成

3天把Llama训成Mamba，性能不降，推理更快！

...型的推理速度。为什么要把Llama变成Mamba？因为从头开始训练一个大模型太贵了。Mamba也火了这么长时间了，相关的研究每天都有，但自己训练大尺寸Mamba模型的却很少。目前比较有名的是AI21的Jamba（进化到了1.5版本，最大398B，MoE...……更多

2024-09-06 10:01:00推理,更快,性能,模型,输出,训练

金融大模型观察

...特征？黄艾舟：大模型需要大量的数据，底层有很多语料训练才能涌现出推理能力。金融业是对于数据安全和数据隐私保护最为重视的一个行业之一，所以开展大模型的探索，可能会存在一定的困难。目前各银行对于大模型的应...……更多

2023-12-09 10:47:00模型,观察,金融,模型,金融,应用

o1金牌团队揭秘AI超越人类惊人时刻！22分完整版视频全公开

...重要6 通过规划、纠错，o1能够解决世界上的新问题7 新的训练范式是一种全新的方法，可以将更多的算力投入到模型中8 o1编写代码时，当其输出要使用的代码时，需要通过单元测试接下来，具体来看下o1模型背后的故事。强化学...……更多

2024-09-23 09:50:00整版,金牌,团队,人类,时刻,视频

智能驾驶的「 ChatCPT 时刻」，这么近，那么远

...斯拉的更新日志，采用端到端的 FSDV12 经过数百万个视频训练后，可以减少 30 多万行 C++代码，仅保留了 3000 行代码。当然，上边说的都最理想状态的端到端，现实中，目前被各家车企、自动驾驶供应商宣传的端到端，并没有那...……更多

2024-06-28 14:06:00驾驶,时刻,智能,驾驶,特斯,特斯拉

AI识别方言困难！专家探索用算法度量方言差距，提议构建统一框

...语形式流传，缺乏对应文字，并且难以收集，可用于模型训练的方言语料数据偏少。信也科技算法科学家倪博溢。10月24日，第八届信也科技杯算法大赛总决赛上，9支人工智能队伍角逐，探索利用AI技术识别和还原语音数据中的...……更多

2023-10-26 18:05:00方言,算法,框架,差距,困难,统一

旷视开源的AI人像视频生成太炸了！输入照片即可模仿任意表情包

...生成领域，许多工作通常使用高质量的闭源自采数据进行训练，以追求更好的效果。而旷视研究院始终坚持全面开源，确保实际效果的可复现性。MegActor 的训练数据全部来自公开可获取的开源数据集，配合开源代码，使得感兴趣...……更多

2024-06-28 09:41:00人像,生成,表情,输入,照片,视频

讯飞星火X1全面升级领跑教育、医疗、司法行业应用

...星火X1迎来全新升级。作为当前业界唯一基于全国产算力训练的深度推理大模型，升级后的星火X1在数学、代码、逻辑推理、文本生成、语言理解、知识问答等通用任务上效果显著提升，在模型参数比业界同类模型小一个数量级...……更多

2025-04-22 16:50:00讯飞,星火,行业应用,司法,升级,医疗

零样本即可时空预测！港大、华南理工等发布时空大模型Urban

...提高时空数据预测的准确性，但这些方法通常需要大量的训练数据来生成可靠的时空特征。然而，在实际的城市监测场景中，数据往往不足，特别是在某些情况下，收集有标记的数据变得非常困难，这进一步加剧了挑战。因此，...……更多

2024-08-01 09:40:00时空,华南,样本,理工,模型,时空

AI “早筛” 癌症，准确区分13种癌症，准确率98.2%，

...疗。日前，来自伦敦帝国理工学院和剑桥大学的研究团队训练了一种人工智能模型——EMethylNET，通过观察 DNA 甲基化模式，从非癌组织中识别出 13 种不同类型的癌症（包括乳腺癌、肝癌、肺癌和前列腺癌等），准确率高达 98.2%...……更多

2024-06-27 08:48:00癌症,准确率,人类,治疗,癌症,模型

大模型新趋势之MoE：现状、挑战及研究方向

...门控模型控制专家模型的选择和加权混合。简言之，MoE在训练过程通过门控模型实现“因材施教”，进而在推理过程实现专家模型之间的“博采众长”。图1MoE架构原理示意图1MoE的特征优势是专家化、动态化、稀疏化，在模型研...……更多

2024-11-04 16:00:00研究方向,模型,现状,方向,趋势,研究

类Sora模型能否理解物理规律？字节豆包大模型团队系统性研究

...模型是否准确？它能否泛化到新的情况，即那些不仅仅是训练数据插值的情形？这些问题至关重要，决定了生成图像的应用范围 —— 是仅限于媒体生产，还是可以用作现实世界的可靠模拟。最后他指出，不能简单地通过拟合大...……更多

2024-11-09 09:59:00模型,豆包,系统性,字节,规律,团队

这才是真开源模型！公开后训练一切，性能超越Llama 3.1

... 3.1 Instruct 的相应版本！长达 73 的技术报告详细介绍了后训练的细节。在最近关于「Scaling Law 是否撞墙」的讨论中，后训练（post-training）被寄予厚望。众所周知，近期发布的 OpenAI o1 在数学、代码、长程规划等问题上取得了显...……更多

2024-11-26 09:44:00模型,性能,训练,模型,训练,数据

提升开户效率、控制合规风险，大模型助力券商提质增效

...佳；长文提取关键字段信息难，段落之间没有关联关系；训练样本需求庞大，训练时间长等。北京商报记者了解到，腾讯云TI-OCR平台通过搭载大模型能力，有效解决了图像干扰、混合版式、表格结构化识别等OCR领域核心痛点。...……更多

2024-02-05 10:26:00券商,模型,效率,风险,控制,模型

4轮暴训，Llama 7B击败GPT-4！Meta等让LLM

...秒杀自我奖励模型。LLM对数据的大量消耗，不仅体现在预训练语料上，还体现在RLHF、DPO等对齐阶段。后者不仅依赖昂贵的人工标注数据，而且很可能让人类水平限制LLM的进一步发展。今年1月，Meta和NYU的团队就提出了语言模型的...……更多

2024-08-01 09:40:00三角,进化,模型,奖励,训练,迭代

北大字节VAR最佳论文、厦大清华亚军，NeurIPS 202

...人员重点攻关此技术方向，还投入大量算力资源支持模型训练和实验。该团队近期将发布新的 VAR T2I 模型研究成果，并将对模型开源。二是由新加坡国立大学、 Sea AI Lab 研究者共同完成的《Stochastic Taylor Derivative Estimator: Efficient ……更多

2024-12-05 09:47:00论文,清华,亚军,字节,北大,模型