• 我的订阅
  • 头条热搜
Transformer打破三十年数学猜想!Meta研究者用AI给出反例,算法杀手攻克数学难题
...究者是通过以下步骤应用PatternBoost的:首先生成一个初始数据集,并使用Transformer模型对其进行训练以生成新样本。将这些新样本作为局部搜索的起点,经过多轮迭代后,PatternBoost在这个无4-圈问题上获得了比传统方法更佳的解...……更多
仅用4块GPU、不到3天训练出开源版GPT-4o,这是国内团队最新研究
...合语音交互场景的特点,该研究通过重写现有的文本指令数据并进行语音合成,构建了名为 InstructS2S-200K 的数据集。实验结果表明,LLaMA-Omni 可以同步生成高质量的文本和语音响应,延迟低至 226ms。此外,与 SpeechGPT 等语音 - 语...……更多
产品序列再扩充,银河能否守住“速度神话”
...一汽等传统车企加速布局新能源汽车战略。乘联会最新的数据显示,今年1-4月,国内插混车型累计销量达到109.1万辆,同比增长83.9%;同期,纯电车销量为164.5万辆,同比增速仅有8.9%。 在此背景下,自主品牌之后,国内的大部分...……更多
...的发生地点、不同时期的地方行政区划变迁等。对于具有时间序列的图书档案资源,如地方大事记、编年史等,建立时间轴可视化界面,以时间为线索展示历史事件发展脉络。通过时间轴,用户可以迅速浏览地方历史的重大事件...……更多
揭示Transformer「周期建模」缺陷!北大提出新型神经网络FAN,填补周期性特征建模能力缺陷
...建模上的表现显著优于现有模型,而且在符号公式表示、时间序列预测和语言建模等实际任务中也同样表现出色,超过了Transformer等主流模型。论文链接:https://arxiv.org/pdf/2410.02675.pdf代码链接:https://github.com/YihongDong/F……更多
出门问问重磅发布全新2.5D数字人系统 WetaAvatar 4.0
...成机制。首先,通过人脸重建模型捕捉到人脸的核心特征数据,这一数据反映了人脸的不变属性。然后,人脸生成模型使用这些基础数据,并结合具体的人脸图像及配套的音频信息进行处理,以此同步创造出与音频匹配的嘴型动...……更多
Sora背后团队:成立不到1年,站在谷歌肩头,应届博士带队
...比和分辨率,类似于NaViT对图像的处理。这对于捕捉视觉数据的真正本质至关重要,使模型能够从更准确的表达中学习,从而赋予Sora近乎完美的准确性。由此,Sora能够有效地处理各种视觉数据,而无需调整大小或填充等预处理...……更多
...存在的大量间隙和组装错误,大幅提升了对叶榕基因组的连续性、完整性和准确性,为榕属植物性别演化提供了重要资源。据介绍,榕树是桑科榕属800多种植物的统称,广泛分布于热带和亚热带地区。榕属植物包含6个亚属,一...……更多
中国电建北京勘测申请基于独立分量的含缺值时间序列分析方法专利,有效提升物理信号分离与提取的精度
...究院有限公司申请一项名为“一种基于独立分量的含缺值时间序列分析方法”的专利,公开号 CN 119377595 A,申请日期为2024年10月。专利摘要显示,本发明提供一种基于独立分量的含缺值时间序列分析方法,所属信号处理相关领域...……更多
循环神经网络(RNN):如何处理自然语言?
...)是一种强大的神经网络模型,它能够处理序列数据,如时间序列数据或自然语言。当然传统的RNN同样存在梯度消失和梯度爆炸的问题,这限制了其在处理长序列时的性能,而优化后的长短期记忆(LSTM)和门控循环单元(GRU)...……更多
...团队22日发布其最新成果:建立了全球最大的蛋白质序列数据集,并利用其训练了Venus(启明星)系列模型。肉、蛋、奶,这些食物中含有丰富的蛋白质,可以提供人类身体所需营养。但天然的蛋白质难以发挥这些功能,科研人员需...……更多
Sigmoid注意力一样强,苹果开始重新审视注意力机制
...编辑部注意力是 Transformer 架构的关键部分,负责将每个序列元素转换为值的加权和。将查询与所有键进行点积,然后通过 softmax 函数归一化,会得到每个键对应的注意力权重。尽管 SoftmaxAttn 中的 softmax 具有广泛的用途和有效性...……更多
不是RNN的锅!清华团队深入分析长上下文建模中的状态崩溃,Mamba作者点赞
...一是无法推断比训练长度更长的输入,原因是较短的训练数据导致了循环状态过拟合; 二是内存容量的上限,由于模型无法有效遗忘很久以前的信息,导致新的信息存不进来了。——这俩问题明显不是RNN的锅。而经过研究人员...……更多
...21日电 (记者许维娜)20日, “全球长时间序列投入产出数据库”在中国人民大学发布。据了解,全球长时间序列投入产出数据库汇集了1950年至2015年之间190个国家及经济体的历史数据,将涵盖经济、能源、环境等多个维度,填...……更多
LeCun最新万字演讲:纯语言模型到不了人类水平,我们基本已放弃
...变化的是,现在我们有巨大的神经网络架构,可以在大量数据上进行训练,由此产生原本没有的特性。 然而,自回归预测有一些主要限制,这里没有真正意义上的推理。另一个限制是,这只适用于以离散对象、符号、标记、单...……更多
...采集器的功能是记录签名过程中的坐标序列、压力序列、时间序列等。数字信号采集器的数据传人计算机后,经过一定的算法处理,判断签名者的身份。通常要对签名数据先进行去预处理,然后再提取特征。预处理步骤包括去噪...……更多
从创新方案,看金融行业如何平稳上云用云
...的形态,其中私有云因能够保障金融行业关键业务应用的连续性、稳定性、高可用性、低网络延迟性和数据安全性,已逐渐成为金融行业云平台建设的首选,大量应用于一般和核心业务系统。在金融云产品上,以虚拟化为核心的...……更多
新视角设计下一代时序基础模型,Salesforce推出Moirai-MoE
... NeurIPS 2024 Workshop on Time Series in the Age of Large Models 接收。时间序列预测是人类理解物理世界变化的重要一环。自去年底以来,时序预测领域正在经历重大转型,从传统的「单一数据集训练单一模型」的模式逐步转向「通用预测基...……更多
值得收藏!2023 年,你应该知道的所有机器学习算法~
...习算法类型。解释型算法模式挖掘算法集成算法聚类算法时间序列算法相似度算法解释型算法机器学习面临的一大问题是理解各种模型如何达到最终预测,我们经常知道是“什么”,但很难解释“为什么”。有几种算法可以用来...……更多
唯客零信任网络、AES加密、多重签名机制打造Web3安全堡垒
...检测,前后端服务全面部署OWASP Top 10安全防护措施。业务连续性与事件响应WEEX要求关键系统的恢复时间目标(RTO)小于2 小时,数据恢复点目标(RPO)小于15分钟,事件响应机制对齐ISO 22301,拥有全面应急预案,并定期参与漏洞赏金计...……更多
OpenOS:灵活且高度可定制可扩展的开源开放共识操作系统
...,确保了时间的可验证性,为去中心化应用提供了可靠的时间序列。因为时间序列和并行交易处理的技术文案,目前OpenOS操作系统的区块周期,理论上可以缩减到100毫秒,这个响应时间已经超过了Web2的应用感观要求。OpenOS文档...……更多
模拟5亿年自然进化史,全新蛋白质大模型ESM3诞生!前Meta老将力作LeCun转赞
...威力,他们发现,同样的模式也适用于生物学。随着训练数据以及参数规模的扩大,模型会加深对生物学基本原理的理解,并能更好地预测、设计生物结构和功能。因此,ESM3的开发思路也与Scaling Law一脉相承,其规模比上一代ESM...……更多
3天把Llama训成Mamba,性能不降,推理更快!
...,在一个epoch中使用SFT在GenQA、InfinityInstruct和OpenHermes 2.5数据集上对模型进行监督微调,采用与Zephyr相同的超参数。最后一个阶段,对于从Zephyr中提取的模型,在UltraFeedback数据集上使用DPO与标准模型进行蒸馏对齐。过程中只在第……更多
...造 多模态数据融合技术要求》、《智能制造 工业大数据时间序列数据采集与存储管理》正式发布,标准由中国电子技术标准化研究院、清华大学牵头,浪潮科技作为行业领军企业共同参与制定。《智能制造 工业大数据系统功能...……更多
抖音大撤退后,快手能否拾起短视频巨头的游戏梦?
...协调。原著中,乌贼构建了一套十分完整且成熟的“22条序列”职业模板,这套模板改编成手游会存在几个弊端:一是晋升空间小。《诡秘之主》里共有“22条序列”职业序列,每种职业序列仅有10个等级序列。以“占卜师”序列...……更多
摆脱Transformer依赖?这家AI初创公司推出国内首个非Attention机制大模型
...型和同等参数规模Transformer模型的大量实测对比,经实验数据表明,Yan架构可以实现比Transformer架构更高的训练效率、更强的记忆能力、更低的幻觉表达。在同等资源条件下,Yan架构的模型,训练效率和推理吞吐量分别是Transformer...……更多
报名渗透测试培训班好不好?费用贵吗?
...式的设计和应用PHP基础知识 PHP的语法格式 PHP的变量 PHP的数据类型 PHP流程控制 PHP函数 PHP数组 PHP正则表达式 PHP错误、文件处理和时间 PHP文件上传和会话控制MySQL数据库基础 MySQL数据库管理系统 MySQL数据库和数据表设计 PHP链接MyS...……更多
再升级!微筑科技推出建筑能碳平台V3.0
...测用能负荷上使用双向LSTM算法,可以更好地处理和预测时间序列数据。根据预测结果,可以合理安排设备的运行时间和能源消耗,降低能源成本,提高能源利用效率。 3.能碳数据一屏看清,辅助能碳管控决策 能碳管理平台将能...……更多
智谱AI发布视频生成大模型,B站参与研发,亦庄提供算力|甲子光年
...数视频的编解码的能力。 第二点是可控性。现在的视频数据大多缺乏对应的描述性文本或者描述质量低下,为此智谱自研了一个端到端的视频理解模型,用于为海量的视频数据生成详细的、贴合内容的描述,这样可以增强模型...……更多
Meta提出“可持续思维链”,让大模型在连续潜空间中推理
...架(MOF)开发的。MOF 是一个等级分类系统,根据模型的完整性和开放性对人工智能模型进行评估,坚持开放科学、开放源代码、开放数据和开放访问的原则。通过全面发布预训练代码和配置、训练和微调数据集以及中间和最终...……更多
更多关于科技的资讯:
浙江日报义乌12月3日电 (记者 拜喆喆 何贤君 共享联盟·义乌 吴峰宇) 3日,义乌今年第1亿个跨境电商进口订单完成打包
2025-12-04 08:41:00
中国科大新实验终结爱因斯坦与玻尔世纪之辩
大皖新闻讯 大皖新闻记者从中国科学技术大学获悉,该校潘建伟、陆朝阳、陈明城教授等组成的研究团队,利用光镊囚禁的量子基态单原子
2025-12-04 11:03:00
中新经纬12月4日电 “北京市场监管”微信号4日消息,为应对AI合成技术滥用风险,规范电商直播行业秩序,近日,北京市消费者协会(以下简称“北京消协”)联合京东
2025-12-04 11:06:00
用一张照片告别2025:富士胶片X-SPACE三城点亮\
2025年11月起,富士胶片影像共享空间X-SPACE于上海、南京、杭州三地先后启动年末特别企划——"影像之树"作品征集与交流活动
2025-12-04 11:49:00
《2026年中国礼品行业展望白皮书》发布“差异化”和“质价比”等关键词
2025年10月20-23日,第33届深圳礼品家居展于深圳国际会展中心举办,展会同期进行的2025中国礼业高峰论坛上,展会主办方励展华博第三次携手国际知名咨询公司凯度重磅首发《2026年中国礼品行业展望白皮书》
2025-12-04 11:55:00
中国网12月4日讯 据国家体育总局网站消息,体育总局日前印发《关于进一步推进篮球改革发展的意见》。其中提出,有序促进职业篮球开放
2025-12-04 12:16:00
长白时评评论员 刘颂寒12月1日,电视剧《家业》和制片方华策影视发文,谴责部分短剧投机取巧,擅自截取《家业》宣传物料中的创意元素“跟拍”
2025-12-04 13:48:00
近年来,智能制造产业园引导企业顺应数字化浪潮,积极落实智改数转,推动科技创新与产业创新深度融合。以南汽集团为核心的汽车产业
2025-12-04 11:20:00
储热赋能双碳 智慧引领供热 泰山集团高电压直入式电储能技术破解能源转型难题
鲁网12月4日讯在“双碳”目标深入推进、能源结构加速转型的时代背景下,电网峰谷差拉大、清洁供热需求迫切、弃风弃光资源浪费等问题成为制约绿色发展的关键瓶颈
2025-12-04 09:57:00
上海街头的数字生活指南,是城市数字品牌与公共艺术的对话
在上海,街头悄然出现的“数字城市指示牌”成为了市民与游客驻足讨论的热点。这些立体的、新颖的指示牌,是“智云上海”这个城市信息化名片的立体呈现
2025-12-04 08:17:00
摘要:随着生成式人工智能技术在各行业的广泛应用,模型输出结果的不确定性问题日益受到关注。为提高模型在关键领域的可靠性,对输出不确定性进行量化分析成为重要方向
2025-12-04 06:17:00
杭州博士后用AI让机器懂协作、更安全杭州日报讯 让机器从执行命令的“孤岛”,成为懂得协作的群体?让机器人安全走进人类生活
2025-12-04 06:38:00
12月3日从紫林醋业获悉,紫林醋业部分主导产品通过欧盟有机认证(EU Organic Certification),获准使用欧盟统一有机标识“欧洲叶标”(Euro-Leaf)
2025-12-04 07:31:00
中新经纬12月3日电 12月3日,豆包手机助手在官方微信号就“侵犯用户隐私”等问题进行回应,称不存在任何黑客行为。具体来看
2025-12-04 07:42:00
支付宝AI4SDL研发安全体系斩获首届“AI领航杯”星光金奖
12月1日-3日,由中国互联网协会主办的2025“人工智能+”产业生态大会在北京举办。开幕式上,首届“AI领航杯”“人工智能+”应用与技能大赛总决赛举行了隆重的颁奖仪式
2025-12-04 07:47:00