推理,时间序列,序列,框架,难题,突破头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

突破时间序列组合推理难题！南加大发布一站式多步推理框架TS-

...、自定义模块生成和多领域数据集评估，有效提高了复杂时间序列任务的推理能力和准确性。实验结果表明，TS-Reasoner在金融决策、能源负载预测和因果关系挖掘等多个任务上，相较于现有方法具有显著的性能优势。随着近年来...……更多

2024-10-29 09:55:00推理,时间序列,序列,框架,难题,突破

全球首次！时序大模型突破十亿参数，华人团队发布Time-Mo

...据集，为时序分析提供了丰富的训练资源，为各行各业的时间序列预测任务带来了新的解决方案。在当今以数据为驱动的时代，时序预测已成为众多领域不可或缺的核心组成。然而，构建一个兼具强大性能与高效运算的大规模时...……更多

2024-10-23 09:55:00时序,模型,团队,训练,参数,突破

大模型重构生命科学！最大基础模型面世，解锁DNA超长序列

...，从跨模态预训练、到下游任务的微调都可以完成。而在推理端，他们为该领域量身定制地打造了生物与AI融合的计算引擎。这个值得说道说道。因为在我们日常大模型语境中，可能只需要针对AI模型本身进行推理优化，就能在...……更多

2024-11-07 09:50:00模型,重构,生命科学,序列,生命,基础

清华提出时间序列大模型：面向通用时序分析的生成式Transf

...新智元导读】大模型在语言、图像领域取得了巨大成功，时间序列作为多个行业的重要数据类型，时序领域的大模型构建尚处于起步阶段。近期，清华大学的研究团队基于Transformer在大规模时间序列上进行生成式预训练，获得了...……更多

2024-07-22 09:44:00时间序列,时序,清华,序列,生成,模型

补齐Transformer规划短板又不放弃快速思考，Dual

...些解答或慢点思考。OpenAI ο1 模型的发布掀起了人们对 AI 推理过程的关注，甚至让现在的 AI 行业开始放弃卷越来越大的模型，而是开始针对推理过程进行优化了。今天我们介绍的这项来自 Meta FAIR 田渊栋团队的研究也是如此，其...……更多

2024-10-17 09:47:00优势,规划,推理,轨迹,模型,慢速

摆脱Transformer依赖？这家AI初创公司推出国内首个

...能效果——记忆能力提升3倍、速度提升7倍的同时，实现推理吞吐量的5倍提升。至于为何另辟蹊径，寻求非Transformer的大模型路径，岩芯数智CEO刘凡平指出，以大规模著称的Transformer，在实际应用中的高算力和高成本，让不少中...……更多

2024-01-29 06:31:00模型,机制,公司,模型,架构,岩芯

中国校企联手发表科研成果，借AI发现超16万种RNA病毒

...是病毒世界的冰山一角。传统RNA病毒鉴定方法高度依赖于序列同源性比对，即通过比较未知病毒与已知病毒的序列相似性来进行识别。然而，RNA病毒种类繁多且高度分化，传统方法难以捕捉缺乏同源性或同源性极低的“暗物质病...……更多

2024-10-10 14:57:00科研成果,中国,科研,成果,病毒,病毒

北大林宙辰团队全新混合序列建模架构MixCon：性能远超Ma

...，欢迎投稿或者联系报道。在自然语言处理、语音识别和时间序列分析等众多领域中，序列建模是一项至关重要的任务。然而，现有的模型在捕捉长程依赖关系和高效建模序列方面仍面临诸多挑战。因此，北京大学林宙辰、徐鑫...……更多

2024-10-16 13:34:00序列,架构,北大,混合,团队,性能

Mamba再次挑战霸主Transformer！首个通用Mam

...来处理不断增长的上下文窗口。如果资源没有相应扩展，推理速度会变慢，最终无法处理超过某个固定长度的文本。为了解决这些难题，状态空间语言模型（SSLM）架构应运而生，该架构通过在处理单词时持续更新「状态」，已...……更多

2024-08-14 09:43:00一鸣,霸主,模型,再次,模型,序列

图灵奖得主Yoshua Bengio新作：Were RNNs

...常高效在测试时，循环序列模型会按顺序推出，从而使其推理更为高效。相反，传统 RNN 的瓶颈在于其训练，需要线性训练时间（通过时间反向传播），这导致其最终被淘汰。人们对循环序列模型重新产生兴趣，是因为许多新的...……更多

2024-10-15 09:56:00图灵奖,图灵,得主,新作,序列,训练

智能体首达Kaggle Grandmaster,华为结构化推

...参与者进行直接比较并涵盖计算机视觉、自然语言处理、时间序列和表格数据等多种任务，支持多种模态。下图展示了该基准中 Kaggle 任务的分布情况。目前，其中 55% 是表格任务，包括数值、类别、字符串和布尔值表。另外计...……更多

2024-11-09 09:53:00华为,结构化,推理,思维,结构,智能

百川智能发布baichuan3稳定语言模型

...处理和代码生成领域的强大实力。不仅如此，其在对逻辑推理能力及专业性要求极高的MCMLE、MedExam、CMExam等权威医疗评测上的中文效果同样超过了GPT-4，是中文医疗任务表现最佳的大模型。Baichuan3还突破“迭代式强化学习”技术...……更多

2024-01-29 19:57:00百川,模型,语言,智能,模型,百川

值得收藏！2023 年，你应该知道的所有机器学习算法~

...习算法类型。解释型算法模式挖掘算法集成算法聚类算法时间序列算法相似度算法解释型算法机器学习面临的一大问题是理解各种模型如何达到最终预测，我们经常知道是“什么”，但很难解释“为什么”。有几种算法可以用来...……更多

2023-01-25 13:00:00算法,机器,学习,算法,数据,学习

上海交大团队研发通用人工智能，解决传统蛋白质工程难题

...模型精度的同时降低模型参数，便于进行大规模预训练和推理。其二，策略优势。利用小样本乃至零样本学习方法，提高大模型的工程泛化能力，帮助它在仅有少数湿实验数据的情况下实现蛋白质性能优化，极大地提高了蛋白质...……更多

2024-05-07 09:24:00上海交大,人工智能,交大,上海,蛋白质,蛋白

姚期智院士大模型新研究：思维图DoT，用数学理论确保AI逻辑

姚期智院士领衔，推出大模型新推理框架，CoT“王冠”戴不住了。提出思维图（DiagramofThought），让大模型思考更像人类。团队更是为这种推理过程提供了数学基础，通过拓扑斯理论（Topos Theory）正式化（formalize）DoT，确保其逻...……更多

2024-09-24 13:36:00维图,院士,逻辑,模型,一致,理论

模拟5亿年自然进化史，全新蛋白质大模型ESM3诞生！前Met

...白质语言模型ESM3。不仅支持序列、结构、功能的all-to-all推理，团队还在实验中发现，它设计的新蛋白质相当于模拟自然界5亿年的进化。继AlphaFold 3更新后，我们又看到了一个生命科学领域的大模型ESM3。模型开发团队来自于名为...……更多

2024-06-27 09:31:00进化史,力作,老将,蛋白质,进化,蛋白

为什么诺贝尔化学奖又双叒给AI?

...蛋白质也一样，功能要在折叠后才能实现。如何从氨基酸序列预测蛋白质的三维结构，一直是分子生物学中的关键挑战。在广东，深圳湾实验室系统与物理生物学研究所副所长周耀旗的课题组曾为AlphaFold 2的底层技术框架添砖加...……更多

2024-10-10 13:38:00诺贝尔化学奖,诺贝,蛋白质,蛋白,贝克,结构

撞墙还是新起点？自回归模型在图像领域展现出Scaling潜力

...在文本以外的领域，Scaling Law 的踪迹正在逐渐显现，比如时间序列预测以及图像、视频这类视觉领域。下面这张图来自投稿给 ICLR 2025 的一篇论文。论文发现，在把类似于 GPT 的自回归模型应用于图像生成时，Scaling Law 同样可以...……更多

2024-11-27 13:32:00潜力,模型,图像,起点,领域,还是

陈天奇团队LLM结构化生成新引擎XGrammar：百倍加速、

...效处理其余的上下文相关 token。此外，掩码生成和 LLM 推理是互相重叠的，以最大限度地减少约束解码的开销。一旦 LLM 在掩码约束下生成新 token，就会使用此 token 来更新下推自动机的堆栈状态，以进行下一次掩码生成。具体...……更多

2024-11-27 13:37:00结构化,开销,生成,团队,结构,引擎

苹果让大模型学会偷懒：更快吐出第一个token，准确度还保住

...小的 8B 版本可能也依然会有明显延迟。为了提升模型的推理效率，研究者想出了多种多样的方法，但其中很多都会让模型牺牲一些准确度。近日，苹果和 Meta AI 的一个研究团队提出了一种新方法，可在保证准确度不明显下降的...……更多

2024-08-05 09:35:00准确度,更快,模型,苹果,缓存,模型

OpenAI发布最新技术研究，AI“黑盒”不再是难题！

...出了正确回答。大部分大模型都在给出答案的同时呈现了推理过程。智谱清言给出的推理过程显示，在比较13.11%和13.8%时，13.11%是更大的数值。这是因为当比较两个百分数时，我们首先比较整数部分，如果它们相同，则比较小数...……更多

2024-07-18 09:47:00最新技术,难题,研究,技术,模型,小数

零样本即可时空预测！港大、华南理工等发布时空大模型Urban

...断流量模式。然而，它在处理具有复杂时空依赖性的数字时间序列数据时，有时会出现预测失误。与此同时，虽然预训练的基线模型在编码时空依赖关系方面表现良好，但它们可能会因为过度适应源数据集而在零样本场景中表现...……更多

2024-08-01 09:40:00时空,华南,样本,理工,模型,时空

大模型时代下的机器人应用：我们离具身智能还有多远？| 新程序

...《新程序员》编辑部在大模型以其超前的文本输出、逻辑推理能力出现在人们面前时，“具身智能”这一概念又一次把通用人工智能的可能性推到了人们面前。一种以定位感知模块为输入，以大模型为“大脑”进行逻辑推理和规...……更多

2024-02-05 09:43:00多远,程序员,机器人,模型,机器,智能

浪潮科技参编的三项国家标准正式发布

...造多模态数据融合技术要求》、《智能制造工业大数据时间序列数据采集与存储管理》正式发布，标准由中国电子技术标准化研究院、清华大学牵头，浪潮科技作为行业领军企业共同参与制定。《智能制造工业大数据系统功能...……更多

2023-12-18 19:21:00国家标准,浪潮,标准,国家,科技,数据

史上首个实时AI视频生成技术：DiT通用，速度提升10.6倍

...本都在于质量，很少有研究专注于探索如何加速 DiT 模型推理。加速视频生成模型的推理对于生成式 AI 应用来说已经是当务之急。PAB 方法的出现，为我们打开了一条路。原始方法与 PAB 视频生成速度的比较。作者在 Open-Sora 上测...……更多

2024-06-28 09:32:00实时,生成,速度,技术,视频,注意力

RNN回归！Bengio新作大道至简与Transformer

...随机间隔的，为了解决这项任务，模型需要执行内容感知推理，记住相关token并过滤掉不相关的token。上表将minLSTM和minGRU与可以并行训练的知名RNN模型进行了比较（S4，H3，Hyena和Mamba（S6）)，基线结果引自Mamba论文。在所有这些基...……更多

2024-10-26 09:53:00高下,新作,大道,门控,模型,训练

70倍极致压缩！大模型的检查点再多也不怕

...重要的概念，一个是利用训练中检查点的残差信息，通过时间序列上信息的稀疏性实现更高的剪枝比例；另一个是将优化器和权重联合起来进行压缩，实现整体的高压缩率。具体方法1. 检查点残差在训练过程中，当前的参数可...……更多

2024-08-06 09:27:00检查点,极致,模型,检查,检查点,权重

Sigmoid注意力一样强，苹果开始重新审视注意力机制

...gmoid 注意力实现 ——FLASHSIGMOID。FLASHSIGMOID 在 H100 GPU 上的推理内核速度比 FLASHATTENTION2 提高了 17%。跨语言、视觉和语音的实验表明，合理归一化的 sigmoid 注意力与 softmax 注意力在广泛的领域和规模上性能相当……更多

2024-09-19 12:02:00注意力,机制,苹果,注意力,研究,近器