• 我的订阅
  • 头条热搜
刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
...有广泛世界知识,但对于实际应用来说,可能成本高昂且速度慢。相比之下,o1-mini 是一个较小的模型,在预训练期间针对 STEM 推理进行了优化。在使用与 o1 相同的高计算强化学习 (RL) pipeline 进行训练后, o1-mini 在许多有用的推...……更多
腾讯Angel获世界互联网大会领先科技奖:让通信成本降低70%
...行和算子优化,相比开源框架,训练性能提升2.6倍,推理速度提升2.3倍。规模:实现了单任务万卡的线性扩展,GPU集群加速比从50%提升到99%。腾讯Angel机器学习平台是干嘛的,如果你手握一堆数据,想从零开始训练一个大模型,...……更多
腾讯发布最大开源MoE模型,3890亿参数免费可商用
...负载,充分利用训练数据,保证模型的训练稳定性和收敛速度。专家特定学习率适配策略:不同专家承载的tokens差异巨大,应设定不同学习率,如共享专家使用较大的学习率,确保每个子模型有效地从数据中学习并有助于整体性...……更多
IBM发布全新光电共封装工艺:AI模型训练速度将提升5倍
...传输。最大限度地减少GPU停机时间,同时大幅加快AI工作速度。具体而言,这一新技术带来了三大方面的显著优势:首先,它极大地降低了规模化应用生成式AI的成本。与中距离电气互连装置相比,光电共封装技术的能耗降低了...……更多
百度CTO王海峰:文心大模型的底色和成色
...的参数调优,进一步节省训练资源和时间,加快模型迭代速度。价值对齐,多多益善。为提升大模型的准确性,文心大模型4.0在输入、输出两个阶段都运用了知识点增强,具体做法为在输入端对用户输入的问题进行理解,并拆解...……更多
OpenCity大模型预测交通路况,零样本下表现出色,来自港大百度
...间的动态依赖关系,例如,突发的交通事故可能导致交通速度和交通量急剧下降。为了实现这一点,我们采用类似于周期交通转换编码的注意力机制。不同之处在于,查询(Q)、键(K)和值(V)的输入被替换为上一步的归一化...……更多
1行代码改进大模型训练,Llama训练速度升至1.47倍,华人团队出品
...一旦不一致,就有可能导致损失函数暂时增加,造成收敛速度的减缓。不过作者并未在方向不一致的来源问题上过度纠结,而是引入了一种判断机制,在参数更新之前增加一步计算,从而过滤掉方向不一致的情形。这也正是上面...……更多
3天把Llama训成Mamba,性能不降,推理更快!
...了带有硬件感知的推测解码算法,提高了整个模型的推理速度。为什么要把Llama变成Mamba?因为从头开始训练一个大模型太贵了。Mamba也火了这么长时间了,相关的研究每天都有,但自己训练大尺寸Mamba模型的却很少。目前比较有...……更多
天工开物 智破难关
...的步伐一路小跑着来到发布会现场。如何以6公里/小时的速度跑起来?记者就此采访了“天工”背后的研发团队。灵巧关节扛住运动爆发力“天工”诞生地——北京人形机器人创新中心,研发办公室的布设很简单。一群“80后”...……更多
与OpenAI o1技术理念相似,TDPO-R算法有效缓解奖励过优化问题
...分,会发现随着目标奖励逐渐上升,域外奖励评分的增长速度明显放缓,甚至出现域外评分逐渐下降的情况。这表明,模型在一个特定奖励函数上取得高分时,可能会以牺牲其在其他任务上的表现为代价,最终导致生成质量的不...……更多
4090笔记本0.37秒直出大片!英伟达联手MIT清华祭出Sana架构,性能秒杀FLUX
...Sana架构,得益于核心架构创新,具备了惊人的图像生成速度,而且最高能实现4k分辨率。一台16GB的4090笔记本,仅需0.37秒,直接吐出1024×1024像素图片。如此神速AI生图工具,竟是出自英伟达MIT清华全华人团队之笔!正如其名字一...……更多
GPT-4o的识图能力有多牛?四大维度深度体验
...-4o的效果,着重识图能力的测试。综合来看,GPT-4o在反应速度上有极大的提升,识图方面冠绝群雄,不仅能够准确识别图片,还能以类人的思维理解图像内容。而在长文本总结方面,与当前模型的差距并不突出。GPT-4o到底是如何...……更多
美国东北大学提出视频数据增强方法,能让视频模型学到更好的表征
...色调的变化,并在不同平台上(CPU/GPU)均取得了显著的速度提升。第二部分,指的是课题组提出了一种解决数据增强所导致的分布偏移的通用型方法——Variation Alignment。即通过构建由普通样本和增强样本组成的训练对,显式地...……更多
AI大模型,进入攻防阶段
...毒丸,难度却极大,可以说直接影响了AI绘画模型的训练速度。如何防范毒丸的污染,已经成为各个AI大模型需要慎重对待的问题。AI攻防战如何避免AI被污染?对此,开发者想了很多办法, 比如加入更严苛的数据审核制度,宁愿...……更多
大模型步入推理Scaling时代,SambaNova如何挑战英伟达的霸主地位
...算。对于利用 HBM 来推理的芯片来说,HBM 的利用率是推理速度的关键,越快从内存中访问数据,就越能缩短处理时间。 SambaNova 的 RDU 既有 GPU 10 倍以上的片上分布 SRAM,也有适用于需要快速数据传输的大规模计算任务的 HBM。其...……更多
与ChatGPT“赛跑”!国产大模型170多天“赛”出“加速度”
...万元奖励,到如今历时170多天,讯飞星火大模型实现“加速度”,从“0”到“1”,从“1”到“多”。一块老石头 一种新体验“看得见”“听得懂”的产品在各行业“生根发芽” 在安徽合肥科大讯飞总部,园区中心的一块巨石...……更多
芯片集群「贵」出天际,10年内单个集群价值将达万亿美元
...的引擎之一。随着晶体管变得越来越小、越来越便宜以及速度越来越快,今天实现了手握“超级计算机”的奇迹。但人工智能时代需要处理的数据数量之多,已经将摩尔定律推向了极限。几乎所有现代人工智能中的神经网络都需...……更多
重磅!OpenAI o1模型还没有实现真正的逻辑推理能力
...,o1-preview具有较强的推理能力和广阔的世界知识,o1-mini速度更快、比o1-preview便宜80%的推理模型,在编程方面尤其高效。但o1系列模型在关于世界的事实知识方面总体表现不佳,甚至不如GPT-4o等之前模型,需要更长时间、更高成...……更多
谷歌「诚意之作」,开源9B、27B版Gemma2,主打高效、经济!
...高速推理:Gemma 2经过优化,能够在各种硬件上以惊人的速度运行,无论是强大的游戏笔记本、高端台式机,还是基于云的设置。使用者可以在Google AI Studio上尝试全精度运行Gemma 2,也可以在CPU上使用Gemma.cpp的量化版本解锁本地性...……更多
人工智能研究院何积丰:大模型时代的隐私安全问题涉及到三个纬度
...办方供图挑战:成本消耗与安全隐患人工智能学习知识的速度是人类平均速度的一倍以上,但是所需的时间只要人类的40%左右。“人类从小学到大学毕业大概需要十六年时间,而预计2026年前后,大模型就可以消化人类历史上所...……更多
...京最大,可提供算力3000P。1P相当于每秒1000万亿次的计算速度。也就是说,这里每秒就进行300亿亿次的计算,相当于超过百万台高性能电脑的算力。“大模型最需要稳定的算力。”推出大模型产品已有三年的人民中科公司CEO侯黎...……更多
文心大模型赋能千行百业,自主进化
...本。文心大模型3.5相比3月份的版本,效果提升50%,训练速度提升2倍,推理速度提升30倍,文心大模型3.5还新增了插件机制,扩增了大模型的能力边界。10月17日,百度世界2023大会上,李彦宏宣布文心大模型4.0正式发布。文心大模...……更多
2024北京安博会:宇视科技梧桐大模型落地加速度!
10月22日,2024中国国际社会公共安全产品博览会在中国国际展览中心(顺义馆)正式开幕。宇视科技(uniview)以“更专业,更超值”为主题,亮相E1号馆E1A19展位,全面展示宇视梧桐大模型落地成果、全新AIoT产品方案和新业务创...……更多
价格便宜75%!亚马逊推出全新大模型系列,3纳米自研芯片明年上市
...类别中性能最佳的模型便宜75%,同时也是各自智能类别中速度最快的模型。这些模型也将被集成到Amazon Bedrock平台以供用户通过API使用,并支持自定义微调和蒸馏。 除了图形生成模型Canvas和视频生成模型Reel,亚马逊还预告称将...……更多
全球十亿级轨迹点驱动,首个轨迹基础大模型来了
...掩码:关键点掩码关注轨迹中重要的轨迹点(例如转弯或速度或方向明显变化)。这里,作者使用 RDP 算法来识别这些关键点,从而加强了模型对轨迹内关键结构模式的理解。 最后点掩码:此策略会屏蔽轨迹的最后 N 个点,模拟...……更多
北大字节VAR最佳论文、厦大清华亚军,NeurIPS 2024最佳论文出炉
...e Modeling,首次使得 GPT 风格的自回归视觉生成,在效果、速度、Scaling 能力多方面超越 Diffusion,迎来了视觉生成领域的 Scaling Laws。VAR 为如何定义图像的自回归顺序提供了一个全新的视角,即由粗到细、由全局轮廓到局部精调的...……更多
《自然》子刊:蛋白质结构预测新算法可大幅提高预测效率
...1分钟),而文心的新算法策略只需要11秒就完成了任务,速度提高115倍。全新的算法策略不仅能更好适配到蛋白设计、大规模虚拟筛选等需要频繁预测蛋白结构的任务中,且在多肽、抗体、纳米抗体等与大分子药物设计更相关的...……更多
科学家研发自动驾驶新模块,让自动驾驶场景理解更接近人类认知
...模态的同一个关键对象的错位,最终导致模型学习的收敛速度变慢和次优。 中关村的雪天冬夜里,敲着代码做实验研究中,随着徐冬阳专业技能的积累、以及端到端自动驾驶的发展,在阅读文献时他发现了端到端领域仍然存在...……更多
硬件在人工智能基础教育中的角色: 机遇和挑战
...性,无法同时有效识别大量数据。举例来说,对于基于加速度的手持识别,加速度会涉及大量持续数据,通过这些数据来识别不同手势变得具有挑战性,需要涉及到人工智能中的模式识别。传统方式下,这种任务可能让99.99%的老...……更多
微软紧随英伟达发布芯片,老黄还不慌吗?
...体报告。但纳德拉和博卡尔强调Maia100可以加快数据处理速度,尤其是在语音和图像识别方面。提速的关键,自然是算力。为了提升算力,微软也是下了血本:采用台积电的5nm制程工艺,晶体管数量达到1050亿个。和今年4月被曝光...……更多
更多关于科技的资讯:
河北新闻网1月24日讯 今天,河北省商务厅发布《2025年河北省家电以旧换新及手机等数码产品购新补贴有关工作的公告》,公告称
2025-01-25 07:44:00
天津哪些店买手机能用国补了?津云实地探访 扫码阅读手机版
手机、平板、智能手表(手环)购新补贴(简称“国补”)在全国陆续开启市场情况怎么样?消费者反馈如何?享受补贴的过程中需要注意哪些问题
2025-01-25 07:48:00
全村希望看尊界 江淮汽车:预计2024年亏损约17.7亿元
快科技1月25日消息,江淮汽车昨日发布的业绩预告显示,预计2024年净亏损约17.7亿元,与上年同期(法定披露数据)相比
2025-01-25 08:04:00
打赌喝马桶水给1万事后反悔起诉索回:酒后行为、纯属娱乐
1月25日消息,在日常生活中,有人经常会和朋友做一些“无伤大雅”的赌约。那么这种“游戏”赌约到底该不该履行?双方是否需要承担法律责任呢
2025-01-25 08:34:00
抖音电商上线国家补贴手机销量大增300%:小米15系列销量创新高
快科技1月25日消息,日前,抖音电商发布2025年货节数据,1月2日至22日,抖音商城日均成交额较去年同比增长69%,71个商家成交额破亿元
2025-01-25 08:34:00
前期货量稀少!英伟达RTX 5090马上上市:价格热炒至5W+
快科技1月25日消息,随着RTX 5090上市时间临近,一些黄牛已经行动,想趁机大赚一波(毕竟前期供应量也会非常少)。据悉
2025-01-25 08:34:00
哪吒新车出事故两个月还没修 女车主:4S店说没配件
快科技1月25日消息,据报道,去年年初,朱女士花费13万元购买了一辆哪吒X。但在去年11月5日时,她妹妹因为驾驶技术不熟练
2025-01-25 08:34:00
从商业卫星出海,到入选探月工程,地卫二空间技术(杭州)有限公司(以下简称“地卫二”)再次迎来令人瞩目的“飞升”。1月24日
2025-01-25 09:04:00
绝地传奇再续新篇
迪斯尼正运用双管齐下策略,一头是利维负责,与天行者无关的独立篇章;另一头留用黛西·雷德利出演蕾伊,故事设定于《天行者崛起》(2019)十五年后
2025-01-25 09:04:00
反向春运票价低至2折 长沙至广州硬座仅需18元
快科技1月25日消息,据央视财经报道,近年来,“反向春运”旅客越来越多,不少老人选择来到儿女工作的城市过年。春运期间,铁路客流呈明显单向特征
2025-01-25 09:04:00
网易云音乐回应下架韩国SM旗下全部歌曲:暂时保留 争取长期稳定版权合作
快科技1月25日消息,今日,网易云音乐发布SM版权续约最新进展的公告,版权到期后暂时无需下架。公告表示,经过广大歌迷朋友们的大力支持和热切呼吁
2025-01-25 09:04:00
本文转自:人民网-江西频道有了上下料视觉机器人、AGV物流小车等科技加持,13条智能加工产线只需配备6名看线员;一个通用直料部件餐椅后腿
2025-01-25 09:11:00
深圳餐馆老板“亏损喜报”走红网络 回应:我心里其实很开心
快科技1月25日消息,据媒体报道,近日,深圳市福田区一家餐馆因其老板张贴的特别“喜报”在网络上迅速走红。该喜报的标题为“家有喜事
2025-01-25 09:34:00
没影响!泰国曼谷在春节航线目的地仍排第一:单日入境中国游客超2万人
1月25日消息,据国内媒体报道称,2025年春节假期(2025年1月28日至2月4日)国内航线机票预订量超过958万张
2025-01-25 09:34:00
车险好投保”平台今日上线:高赔付风险新能源汽车投保 险企不得拒保
快科技1月25日消息,据中国保险行业协会官方消息,为贯彻落实金融监管总局、工业和信息化部、交通运输部、商务部《关于深化改革加强监管促进新能源车险高质量发展的指导意见》
2025-01-25 09:34:00