• 我的订阅
  • 头条热搜
突破时间序列组合推理难题!南加大发布一站式多步推理框架TS-Reasoner
...、自定义模块生成和多领域数据集评估,有效提高了复杂时间序列任务的推理能力和准确性。实验结果表明,TS-Reasoner在金融决策、能源负载预测和因果关系挖掘等多个任务上,相较于现有方法具有显著的性能优势。随着近年来...……更多
全球首次!时序大模型突破十亿参数,华人团队发布Time-MoE,预训练数据达3000亿个时间点
...据集,为时序分析提供了丰富的训练资源,为各行各业的时间序列预测任务带来了新的解决方案。在当今以数据为驱动的时代,时序预测已成为众多领域不可或缺的核心组成。然而,构建一个兼具强大性能与高效运算的大规模时...……更多
大模型重构生命科学!最大基础模型面世,解锁DNA超长序列
...,从跨模态预训练、到下游任务的微调都可以完成。而在推理端,他们为该领域量身定制地打造了生物与AI融合的计算引擎。这个值得说道说道。因为在我们日常大模型语境中,可能只需要针对AI模型本身进行推理优化,就能在...……更多
清华提出时间序列大模型:面向通用时序分析的生成式Transformer
...新智元导读】大模型在语言、图像领域取得了巨大成功,时间序列作为多个行业的重要数据类型,时序领域的大模型构建尚处于起步阶段。近期,清华大学的研究团队基于Transformer在大规模时间序列上进行生成式预训练,获得了...……更多
掰开揉碎告诉你,ChatGPT凭啥是人工智能“流量王”
...入到一个万物互联的智能时代,机器将具有感知、判断和推理能力,将自行产生知识,从而增强和替代人类知识,将人从脑力劳动中解决出来。从第一性原理思维角度看,几次工业革命演进的本质是机器逐渐取代人力,包括体力...……更多
补齐Transformer规划短板又不放弃快速思考,Dualformer双重优势
...些解答或慢点思考。OpenAI ο1 模型的发布掀起了人们对 AI 推理过程的关注,甚至让现在的 AI 行业开始放弃卷越来越大的模型,而是开始针对推理过程进行优化了。今天我们介绍的这项来自 Meta FAIR 田渊栋团队的研究也是如此,其...……更多
GPT 能为自动驾驶带来什么?毫末给出了答案
... CSS 自动驾驶场景库的决策样本去训练模型,让模型学习推理关系,从而将完整驾驶策略拆分为自动驾驶场景的动态识别过程,完成可理解、可解释的推理逻辑链生成。毫末智行 CEO 顾维灏表示,毫末 DriveGPT 雪湖 · 海若通过引入...……更多
摆脱Transformer依赖?这家AI初创公司推出国内首个非Attention机制大模型
...能效果——记忆能力提升3倍、速度提升7倍的同时,实现推理吞吐量的5倍提升。 至于为何另辟蹊径,寻求非Transformer的大模型路径,岩芯数智CEO刘凡平指出,以大规模著称的Transformer,在实际应用中的高算力和高成本,让不少中...……更多
...是病毒世界的冰山一角。传统RNA病毒鉴定方法高度依赖于序列同源性比对,即通过比较未知病毒与已知病毒的序列相似性来进行识别。然而,RNA病毒种类繁多且高度分化,传统方法难以捕捉缺乏同源性或同源性极低的“暗物质病...……更多
北大林宙辰团队全新混合序列建模架构MixCon:性能远超Mamba
...,欢迎投稿或者联系报道。在自然语言处理、语音识别和时间序列分析等众多领域中,序列建模是一项至关重要的任务。然而,现有的模型在捕捉长程依赖关系和高效建模序列方面仍面临诸多挑战。因此,北京大学林宙辰、徐鑫...……更多
Mamba再次挑战霸主Transformer!首个通用Mamba开源大模型一鸣惊人
...来处理不断增长的上下文窗口。如果资源没有相应扩展,推理速度会变慢,最终无法处理超过某个固定长度的文本。为了解决这些难题,状态空间语言模型(SSLM)架构应运而生,该架构通过在处理单词时持续更新「状态」,已...……更多
图灵奖得主Yoshua Bengio新作:Were RNNs All We Needed?
...常高效在测试时,循环序列模型会按顺序推出,从而使其推理更为高效。相反,传统 RNN 的瓶颈在于其训练,需要线性训练时间(通过时间反向传播),这导致其最终被淘汰。人们对循环序列模型重新产生兴趣,是因为许多新的...……更多
智能体首达Kaggle Grandmaster,华为结构化推理补齐思维链短板
...参与者进行直接比较并涵盖计算机视觉、自然语言处理、时间序列和表格数据等多种任务,支持多种模态。下图展示了该基准中 Kaggle 任务的分布情况。目前,其中 55% 是表格任务,包括数值、类别、字符串和布尔值表。另外计...……更多
百川智能发布baichuan3稳定语言模型
...处理和代码生成领域的强大实力。不仅如此,其在对逻辑推理能力及专业性要求极高的MCMLE、MedExam、CMExam等权威医疗评测上的中文效果同样超过了GPT-4,是中文医疗任务表现最佳的大模型。Baichuan3还突破“迭代式强化学习”技术...……更多
值得收藏!2023 年,你应该知道的所有机器学习算法~
...习算法类型。解释型算法模式挖掘算法集成算法聚类算法时间序列算法相似度算法解释型算法机器学习面临的一大问题是理解各种模型如何达到最终预测,我们经常知道是“什么”,但很难解释“为什么”。有几种算法可以用来...……更多
Meta提出“可持续思维链”,让大模型在连续潜空间中推理
...ta 提出“可持续思维链”:让大语言模型在连续潜空间中推理GameArena:通过实时电脑游戏评估 LLM 推理想要第一时间获取每日最新大模型热门论文? 点击阅读原文,查看「2024必读大模型论文」合集,以及申请加入「大模型技术...……更多
上海交大团队研发通用人工智能,解决传统蛋白质工程难题
...模型精度的同时降低模型参数,便于进行大规模预训练和推理。其二,策略优势。利用小样本乃至零样本学习方法,提高大模型的工程泛化能力,帮助它在仅有少数湿实验数据的情况下实现蛋白质性能优化,极大地提高了蛋白质...……更多
姚期智院士大模型新研究:思维图DoT,用数学理论确保AI逻辑一致
姚期智院士领衔,推出大模型新推理框架,CoT“王冠”戴不住了。提出思维图(DiagramofThought),让大模型思考更像人类。团队更是为这种推理过程提供了数学基础,通过拓扑斯理论(Topos Theory)正式化(formalize)DoT,确保其逻...……更多
模拟5亿年自然进化史,全新蛋白质大模型ESM3诞生!前Meta老将力作LeCun转赞
...白质语言模型ESM3。不仅支持序列、结构、功能的all-to-all推理,团队还在实验中发现,它设计的新蛋白质相当于模拟自然界5亿年的进化。继AlphaFold 3更新后,我们又看到了一个生命科学领域的大模型ESM3。模型开发团队来自于名为...……更多
为什么诺贝尔化学奖又双叒给AI?
...蛋白质也一样,功能要在折叠后才能实现。如何从氨基酸序列预测蛋白质的三维结构,一直是分子生物学中的关键挑战。在广东,深圳湾实验室系统与物理生物学研究所副所长周耀旗的课题组曾为AlphaFold 2的底层技术框架添砖加...……更多
撞墙还是新起点?自回归模型在图像领域展现出Scaling潜力
...在文本以外的领域,Scaling Law 的踪迹正在逐渐显现,比如时间序列预测以及图像、视频这类视觉领域。下面这张图来自投稿给 ICLR 2025 的一篇论文。论文发现,在把类似于 GPT 的自回归模型应用于图像生成时,Scaling Law 同样可以...……更多
陈天奇团队LLM结构化生成新引擎XGrammar:百倍加速、近零开销
...效处理其余的上下文相关 token。 此外,掩码生成和 LLM 推理是互相重叠的,以最大限度地减少约束解码的开销。一旦 LLM 在掩码约束下生成新 token,就会使用此 token 来更新下推自动机的堆栈状态,以进行下一次掩码生成。具体...……更多
苹果让大模型学会偷懒:更快吐出第一个token,准确度还保住了
...小的 8B 版本可能也依然会有明显延迟。为了提升模型的推理效率,研究者想出了多种多样的方法,但其中很多都会让模型牺牲一些准确度。近日,苹果和 Meta AI 的一个研究团队提出了一种新方法,可在保证准确度不明显下降的...……更多
OpenAI发布最新技术研究,AI“黑盒”不再是难题!
...出了正确回答。大部分大模型都在给出答案的同时呈现了推理过程。智谱清言给出的推理过程显示,在比较13.11%和13.8%时,13.11%是更大的数值。这是因为当比较两个百分数时,我们首先比较整数部分,如果它们相同,则比较小数...……更多
零样本即可时空预测!港大、华南理工等发布时空大模型UrbanGPT | KDD 2024
...断流量模式。然而,它在处理具有复杂时空依赖性的数字时间序列数据时,有时会出现预测失误。与此同时,虽然预训练的基线模型在编码时空依赖关系方面表现良好,但它们可能会因为过度适应源数据集而在零样本场景中表现...……更多
百度发布Apollo开放平台的全新升级版本
...模型效果,落地部署上也做了大量优化,在单orin平台上推理帧率可达5hz。丰富软件生态,加速迭代效率,降低软件开发部署成本:打通ROS生态,软件复用成本更低,研发效率更高。满足更多使用场景,框架层的互通实现,插件...……更多
大模型时代下的机器人应用:我们离具身智能还有多远?| 新程序员
...《新程序员》编辑部在大模型以其超前的文本输出、逻辑推理能力出现在人们面前时,“具身智能”这一概念又一次把通用人工智能的可能性推到了人们面前。一种以定位感知模块为输入,以大模型为“大脑”进行逻辑推理和规...……更多
...造 多模态数据融合技术要求》、《智能制造 工业大数据时间序列数据采集与存储管理》正式发布,标准由中国电子技术标准化研究院、清华大学牵头,浪潮科技作为行业领军企业共同参与制定。《智能制造 工业大数据系统功能...……更多
大语言模型,实现智能客服知识库自动扩写功能
...声,以鼓励语言模型产生更加多样的表达,而不是单一的序列。常用的方法是:随机采样:从语言模型的输出分布中随机采样,而不是直接选择概率最高的输出。这会使得最终的输出序列更加随机。噪声注入:在文本生成的中间...……更多
史上首个实时AI视频生成技术:DiT通用,速度提升10.6倍
...本都在于质量,很少有研究专注于探索如何加速 DiT 模型推理。加速视频生成模型的推理对于生成式 AI 应用来说已经是当务之急。PAB 方法的出现,为我们打开了一条路。原始方法与 PAB 视频生成速度的比较。作者在 Open-Sora 上测...……更多
更多关于科技的资讯:
齐鲁晚报·齐鲁壹点 闫丽君 邵舒琨1月26日,烟台市人民政府新闻办公室召开“一路山海·烟台购 2025烟台市惠民消费券”活动新闻发布会
2025-01-26 17:02:00
男子眼球内捉出4条蠕动线虫:左眼曾飞进去过一只苍蝇
1月26日消息,据媒体报道,浙江的杨先生到医院就诊,他感觉左眼里有虫子在钻。医生翻开病人上睑发现数条正在蠕动的白色寄生虫
2025-01-26 17:05:00
精心部署确保网络畅通,东营联通助力春晚圆满举行
近日,随着欢声笑语的弥漫,垦利区春节联欢晚会如期拉开帷幕。在这场文化盛宴的背后,东营联通垦利区分公司提前筹划、精心保障
2025-01-26 17:11:00
没用D加密:《忍者龙剑传2:黑之章》PC版发售日就被攻破
之前在Xbox直面会上,忍者龙剑传2复刻版《忍者龙剑传2 黑之章》正式公布。随后该作上架Steam并发售,售价298元
2025-01-26 17:36:00
大众网记者 张姝涵 兰帅 泰安报道岁末年初,让我们一起了解常见的非法金融活动手段,守住“钱袋子”,过好幸福年!(一)承诺高额回报
2025-01-26 18:03:00
2025国补增加手机数码 山东苏宁易购迎来年前换机高峰
鲁网1月26日讯1月23日,济南等地市家电手机数码国家补贴正式上线,国补指定卖场苏宁易购全面承接,12类家电单台国补至高2000元
2025-01-26 18:07:00
平安人寿聊城中支举办社区金融内推会宣讲会
为快速搭建平安人寿聊城中支社区金融管理层队伍,确保社区金融队伍高质量发展,平安人寿聊城中支于1月8日在聊城中支职场召开平安社区金融内推会
2025-01-26 18:14:00
潮声丨义乌“走播”,走出了啥?
“走播”主播 义乌市委宣传部供图“世界的义乌”,正在不知不觉间发生变化。眼下,随着新一轮国际贸易改革启动,义乌正在深化市场采购贸易改革
2025-01-26 18:45:00
运营商“二次号码”一键解绑已上线 覆盖150款互联网应用
中国消费者报北京讯(记者武晓莉)工业和信息化部近日通告2024年第四季度电信服务质量情况。数据显示,2024年线上办理业务量超九成
2025-01-26 19:12:00
周鸿祎宣布抽送100辆国产新能源车 车型网友决定!
周鸿祎送车一事今天迎来最新进展。1月26日中午,周鸿祎在个人微博宣布,将抽送100辆国产新能源汽车。周鸿祎在微博中表示
2025-01-26 19:36:00
美联航一波音787客机空中严重颠簸:6人受重伤
1月26日消息,海外媒体近日报道,本月24日,美联航一架从拉各斯飞往华盛顿的波音787客机在飞行途中发生严重颠簸事件,导致多名旅客及机组成员轻伤
2025-01-26 19:36:00
曝雷军亲自面谈高级别汽车研发人员 有时早上8点面试
小米能有今天的成就,在科技和汽车等领域全面开花,可以说离不开雷军对人才的成功招揽。据了解,在小米汽车业务上,雷军对于招聘工作更是亲力亲为
2025-01-26 19:06:00
京东快递深圳口岸自提点开业:香港用户下单后 口岸自提
快科技1月26日消息,据京东物流介绍,为方便香港市民购物,京东近期在港澳下调了运费门槛,香港消费者满188元即可享受免运费送货上门
2025-01-26 19:06:00
猜猜是谁:美国科技界亿万富豪1.39亿英镑买下伦敦白宫
快科技1月26日消息,近日,位于伦敦摄政公园内的“伦敦白宫”(The Holme)以1.39亿英镑(约合人民币12.6亿元)的价格售出
2025-01-26 19:06:00