• 我的订阅
  • 头条热搜
突破时间序列组合推理难题!南加大发布一站式多步推理框架TS-Reasoner
...、自定义模块生成和多领域数据集评估,有效提高了复杂时间序列任务的推理能力和准确性。实验结果表明,TS-Reasoner在金融决策、能源负载预测和因果关系挖掘等多个任务上,相较于现有方法具有显著的性能优势。随着近年来...……更多
全球首次!时序大模型突破十亿参数,华人团队发布Time-MoE,预训练数据达3000亿个时间点
...据集,为时序分析提供了丰富的训练资源,为各行各业的时间序列预测任务带来了新的解决方案。在当今以数据为驱动的时代,时序预测已成为众多领域不可或缺的核心组成。然而,构建一个兼具强大性能与高效运算的大规模时...……更多
大模型重构生命科学!最大基础模型面世,解锁DNA超长序列
...,从跨模态预训练、到下游任务的微调都可以完成。而在推理端,他们为该领域量身定制地打造了生物与AI融合的计算引擎。这个值得说道说道。因为在我们日常大模型语境中,可能只需要针对AI模型本身进行推理优化,就能在...……更多
清华提出时间序列大模型:面向通用时序分析的生成式Transformer
...新智元导读】大模型在语言、图像领域取得了巨大成功,时间序列作为多个行业的重要数据类型,时序领域的大模型构建尚处于起步阶段。近期,清华大学的研究团队基于Transformer在大规模时间序列上进行生成式预训练,获得了...……更多
补齐Transformer规划短板又不放弃快速思考,Dualformer双重优势
...些解答或慢点思考。OpenAI ο1 模型的发布掀起了人们对 AI 推理过程的关注,甚至让现在的 AI 行业开始放弃卷越来越大的模型,而是开始针对推理过程进行优化了。今天我们介绍的这项来自 Meta FAIR 田渊栋团队的研究也是如此,其...……更多
GPT 能为自动驾驶带来什么?毫末给出了答案
... CSS 自动驾驶场景库的决策样本去训练模型,让模型学习推理关系,从而将完整驾驶策略拆分为自动驾驶场景的动态识别过程,完成可理解、可解释的推理逻辑链生成。毫末智行 CEO 顾维灏表示,毫末 DriveGPT 雪湖 · 海若通过引入...……更多
摆脱Transformer依赖?这家AI初创公司推出国内首个非Attention机制大模型
...能效果——记忆能力提升3倍、速度提升7倍的同时,实现推理吞吐量的5倍提升。 至于为何另辟蹊径,寻求非Transformer的大模型路径,岩芯数智CEO刘凡平指出,以大规模著称的Transformer,在实际应用中的高算力和高成本,让不少中...……更多
...是病毒世界的冰山一角。传统RNA病毒鉴定方法高度依赖于序列同源性比对,即通过比较未知病毒与已知病毒的序列相似性来进行识别。然而,RNA病毒种类繁多且高度分化,传统方法难以捕捉缺乏同源性或同源性极低的“暗物质病...……更多
北大林宙辰团队全新混合序列建模架构MixCon:性能远超Mamba
...,欢迎投稿或者联系报道。在自然语言处理、语音识别和时间序列分析等众多领域中,序列建模是一项至关重要的任务。然而,现有的模型在捕捉长程依赖关系和高效建模序列方面仍面临诸多挑战。因此,北京大学林宙辰、徐鑫...……更多
Mamba再次挑战霸主Transformer!首个通用Mamba开源大模型一鸣惊人
...来处理不断增长的上下文窗口。如果资源没有相应扩展,推理速度会变慢,最终无法处理超过某个固定长度的文本。为了解决这些难题,状态空间语言模型(SSLM)架构应运而生,该架构通过在处理单词时持续更新「状态」,已...……更多
图灵奖得主Yoshua Bengio新作:Were RNNs All We Needed?
...常高效在测试时,循环序列模型会按顺序推出,从而使其推理更为高效。相反,传统 RNN 的瓶颈在于其训练,需要线性训练时间(通过时间反向传播),这导致其最终被淘汰。人们对循环序列模型重新产生兴趣,是因为许多新的...……更多
智能体首达Kaggle Grandmaster,华为结构化推理补齐思维链短板
...参与者进行直接比较并涵盖计算机视觉、自然语言处理、时间序列和表格数据等多种任务,支持多种模态。下图展示了该基准中 Kaggle 任务的分布情况。目前,其中 55% 是表格任务,包括数值、类别、字符串和布尔值表。另外计...……更多
百川智能发布baichuan3稳定语言模型
...处理和代码生成领域的强大实力。不仅如此,其在对逻辑推理能力及专业性要求极高的MCMLE、MedExam、CMExam等权威医疗评测上的中文效果同样超过了GPT-4,是中文医疗任务表现最佳的大模型。Baichuan3还突破“迭代式强化学习”技术...……更多
值得收藏!2023 年,你应该知道的所有机器学习算法~
...习算法类型。解释型算法模式挖掘算法集成算法聚类算法时间序列算法相似度算法解释型算法机器学习面临的一大问题是理解各种模型如何达到最终预测,我们经常知道是“什么”,但很难解释“为什么”。有几种算法可以用来...……更多
上海交大团队研发通用人工智能,解决传统蛋白质工程难题
...模型精度的同时降低模型参数,便于进行大规模预训练和推理。其二,策略优势。利用小样本乃至零样本学习方法,提高大模型的工程泛化能力,帮助它在仅有少数湿实验数据的情况下实现蛋白质性能优化,极大地提高了蛋白质...……更多
姚期智院士大模型新研究:思维图DoT,用数学理论确保AI逻辑一致
姚期智院士领衔,推出大模型新推理框架,CoT“王冠”戴不住了。提出思维图(DiagramofThought),让大模型思考更像人类。团队更是为这种推理过程提供了数学基础,通过拓扑斯理论(Topos Theory)正式化(formalize)DoT,确保其逻...……更多
模拟5亿年自然进化史,全新蛋白质大模型ESM3诞生!前Meta老将力作LeCun转赞
...白质语言模型ESM3。不仅支持序列、结构、功能的all-to-all推理,团队还在实验中发现,它设计的新蛋白质相当于模拟自然界5亿年的进化。继AlphaFold 3更新后,我们又看到了一个生命科学领域的大模型ESM3。模型开发团队来自于名为...……更多
为什么诺贝尔化学奖又双叒给AI?
...蛋白质也一样,功能要在折叠后才能实现。如何从氨基酸序列预测蛋白质的三维结构,一直是分子生物学中的关键挑战。在广东,深圳湾实验室系统与物理生物学研究所副所长周耀旗的课题组曾为AlphaFold 2的底层技术框架添砖加...……更多
苹果让大模型学会偷懒:更快吐出第一个token,准确度还保住了
...小的 8B 版本可能也依然会有明显延迟。为了提升模型的推理效率,研究者想出了多种多样的方法,但其中很多都会让模型牺牲一些准确度。近日,苹果和 Meta AI 的一个研究团队提出了一种新方法,可在保证准确度不明显下降的...……更多
OpenAI发布最新技术研究,AI“黑盒”不再是难题!
...出了正确回答。大部分大模型都在给出答案的同时呈现了推理过程。智谱清言给出的推理过程显示,在比较13.11%和13.8%时,13.11%是更大的数值。这是因为当比较两个百分数时,我们首先比较整数部分,如果它们相同,则比较小数...……更多
零样本即可时空预测!港大、华南理工等发布时空大模型UrbanGPT | KDD 2024
...断流量模式。然而,它在处理具有复杂时空依赖性的数字时间序列数据时,有时会出现预测失误。与此同时,虽然预训练的基线模型在编码时空依赖关系方面表现良好,但它们可能会因为过度适应源数据集而在零样本场景中表现...……更多
大模型时代下的机器人应用:我们离具身智能还有多远?| 新程序员
...《新程序员》编辑部在大模型以其超前的文本输出、逻辑推理能力出现在人们面前时,“具身智能”这一概念又一次把通用人工智能的可能性推到了人们面前。一种以定位感知模块为输入,以大模型为“大脑”进行逻辑推理和规...……更多
...造 多模态数据融合技术要求》、《智能制造 工业大数据时间序列数据采集与存储管理》正式发布,标准由中国电子技术标准化研究院、清华大学牵头,浪潮科技作为行业领军企业共同参与制定。《智能制造 工业大数据系统功能...……更多
大语言模型,实现智能客服知识库自动扩写功能
...声,以鼓励语言模型产生更加多样的表达,而不是单一的序列。常用的方法是:随机采样:从语言模型的输出分布中随机采样,而不是直接选择概率最高的输出。这会使得最终的输出序列更加随机。噪声注入:在文本生成的中间...……更多
史上首个实时AI视频生成技术:DiT通用,速度提升10.6倍
...本都在于质量,很少有研究专注于探索如何加速 DiT 模型推理。加速视频生成模型的推理对于生成式 AI 应用来说已经是当务之急。PAB 方法的出现,为我们打开了一条路。原始方法与 PAB 视频生成速度的比较。作者在 Open-Sora 上测...……更多
RNN回归!Bengio新作大道至简与Transformer一较高下
...随机间隔的,为了解决这项任务,模型需要执行内容感知推理,记住相关token并过滤掉不相关的token。上表将minLSTM和minGRU与可以并行训练的知名RNN模型进行了比较(S4,H3,Hyena和Mamba(S6)),基线结果引自Mamba论文。在所有这些基...……更多
出门问问内测大模型“序列猴子”,CEO李志飞:我们不融资也能支撑研发
...大模型不再像上一代的AI能力有限,它已具备基本的逻辑推理能力,每次都能给人惊喜, “序列猴子”大模型已经具备了一定的自然语言理解、知识、逻辑以及推理等能力。他强调,大模型的训练要循序渐进,不要一上来就搞“...……更多
Sigmoid注意力一样强,苹果开始重新审视注意力机制
...gmoid 注意力实现 ——FLASHSIGMOID。FLASHSIGMOID 在 H100 GPU 上的推理内核速度比 FLASHATTENTION2 提高了 17%。 跨语言、视觉和语音的实验表明,合理归一化的 sigmoid 注意力与 softmax 注意力在广泛的领域和规模上性能相当……更多
70倍极致压缩!大模型的检查点再多也不怕
...重要的概念,一个是利用训练中检查点的残差信息,通过时间序列上信息的稀疏性实现更高的剪枝比例;另一个是将优化器和权重联合起来进行压缩,实现整体的高压缩率。 具体方法1. 检查点残差在训练过程中,当前的参数可...……更多
3天把Llama训成Mamba,性能不降,推理更快!
...Mamba模型,并且设计了新的推测解码算法,加速了模型的推理。先来看一张其乐融融的图片(一眼AI):右边的小羊驼代表Llama,而左边的蛇(Mamba)也是我们的老熟人了。至于到底能不能其乐融融,咱就不管了,之所以有此场景...……更多
更多关于科技的资讯:
小米汽车四大预研技术汇总:为自动驾驶打造
量产一代,发布一代,预研一代。11月14日,雷军公布小米汽车最新四大预研技术成果,为SU7背后的研发投入划上圆满句号,也彻底完成了自宣布造车以来的技术储备闭环生态
2024-11-15 22:51:00
小米智能底盘可原地掉头:对比燃油车有什么区别 一文读懂
快科技11月15日消息,今天,小米官方带来了新一期问答,有网友问:“燃油车也可以原地掉头,小米智能底盘有什么区别?”小米汽车官微表示
2024-11-15 22:51:00
蔚来宣布在阿塞拜疆市场开展业务:进一步拓展全球化版图
快科技11月15日消息,在阿塞拜疆首都巴库举办的《联合国气候变化框架公约》第二十九次缔约方大会(第29届联合国气候变化大会
2024-11-15 23:21:00
罗永浩:建议大家购买新能源汽车时优先考虑二手 更具性价比
快科技11月15日消息,瓜子二手车亮相2024广州车展,这次瓜子二手车邀请罗永浩担任首席砸价官,罗永浩现场抡大锤砸穿新能源底价
2024-11-15 20:21:00
2699元起 ROG THOR雷神III 1200/1000W电源上架:引入GaN氮化镓
快科技11月15日消息,ROG THOR雷神III 1200/1000W电源目前已经上市,首发2699元。据悉,新款电源支持最新的ATX 3
2024-11-15 20:21:00
RTX 50全系升级12V-2x6供电接口!最高功率450W
快科技11月15日消息,RTX 40全系标配了新一代12VHPWR 16针供电接口,但因为缺陷而在RTX 4090上出现了多次烧毁事件
2024-11-15 20:51:00
本文转自:人民网-广西频道近年来,百色紧抓发展机遇,创新前行,积极投身于智慧城市建设,并在2024年印发了《“数字百色”工作方案》
2024-11-15 21:03:00
微软宣布暂停windows11新功能更新直至2025年
微软一直在Windows11的各种测试版中不断推出新功能,但现在要放缓下更新的脚步了。微软宣布,将暂停Windows11的新功能更新直至2025年
2024-11-15 21:24:00
中国消费者报太原讯(记者冯铁飞)11月15日,山西省市场监管局质量技术科技帮扶员派驻启动会在太原市召开。山西省市场监管局党组书记
2024-11-15 21:29:00
四川星马重工机械有限公司:22项专利驱动智能制造,乐至新星闪耀科技之光
本文转自:人民网-四川频道11月14日,在位于四川乐至经济开发区的四川星马重工机械有限公司生产车间里,只见工人们正专注地操作着激光切割机床
2024-11-15 21:54:00
融入新发展格局!汇川工业经济稳健前行
多彩贵州网讯 “物流车到了吗?赶快!这批货要发出去。”“单子打好了,现在装车。”……近日,走进位于汇川区遵绥路的遵义金紫阳食品有限公司
2024-11-15 22:29:00
11月15日,阿里巴巴集团发布2025财年第二季度财报,核心业务保持稳健增长。在当晚的分析师电话会上,集团CEO吴泳铭表示
2024-11-15 22:39:00
自行车受宠200年 | 知书
作为一项无法确定发明者的发明,自行车动态多元的特质在200多年前就已注定。再没有哪种交通工具能如此彰显平民性与创造力,承载流动的生活与自由的梦想
2024-11-15 16:36:00
助力进博,服务客户!德必这趟进博服务“专列”被点赞
2024年11月,第七届中国国际进口博览会(以下简称“进博会”)在国家会展中心如期举行。在这场汇聚全球精品、引领行业潮流的盛会背后
2024-11-15 16:45:00