• 我的订阅
  • 头条热搜
轻量化模型架构catvton的优势在哪里
...下。 来自中山大学、Pixocial等机构联合发布轻量化模型架构CatVTON。他们是以StableDiffusionv1.5inpainitng为基础模型。来看看更多效果。用扩散模型进行虚拟试衣CatVTON可以实现传统平铺服装图到人物的换装。不管是上衣、裤子、裙子...……更多
北大林宙辰团队全新混合序列建模架构MixCon:性能远超Mamba
...此,北京大学林宙辰、徐鑫提出了一种全新混合序列建模架构 ——MixCon,它为解决这些难题带来了创新性的方案。经实验验证,其性能远超 Mixtral、Mamba 和 Jamba。论文已在 European Conference on Artificial Intelligence (ECAI)……更多
“苹果智能”仅面向付费开发者,三大新模块炸裂出圈
...在于芯片级别的互联性特别高。苹果的技术论文表明,TPU架构可以开发更大、更复杂的AI模型。三大新模块炸裂出圈随着iOS18.1Beta版的上线,注册开发者从即日起就能体验到苹果AI的部分功能。据悉,本次更新只支持M系和A17Pro芯...……更多
全球首次!时序大模型突破十亿参数,华人团队发布Time-MoE,预训练数据达3000亿个时间点
【新智元导读】Time-MoE采用了创新的混合专家架构,能以较低的计算成本实现高精度预测。研发团队还发布了Time-300B数据集,为时序分析提供了丰富的训练资源,为各行各业的时间序列预测任务带来了新的解决方案。在当今以数...……更多
智能驾驶的「 ChatCPT 时刻」,这么近,那么远
...。让他发出感叹的方案,就是如今风靡整个行业的端到端架构。尽管几年前,端到端架构在自动驾驶领域的运用已经出现在英伟达论文中,但正式落地使用还是从特斯拉的这次转变开始。 什么是智能驾驶的端到端架构呢?严格...……更多
NeurIPS 2024 Oral | 小参数,大作为!揭秘非对称 LoRA 架构性能
...以及剑桥大学的研究者联合提出了一种全新的非对称 LoRA 架构 —— HydraLoRA。与传统 LoRA 需要对所有任务使用相同的参数结构不同,HydraLoRA 引入了共享的 A 矩阵和多个独立的 B 矩阵,分别处理不同的任务,从而避免任务间的干扰...……更多
扩散模型也能搞定社交信息推荐,港大数据智能实验室提出RecDiff
...速度较慢。相比之下,团队的 RecDiff 则得益于紧凑的神经架构,不需要手工制作先验,因此能利用辅助信号进行更快的优化。 对 RecDiff 框架抗噪能力的进一步探索团队评估了 RecDiff 在数据噪声情况下的鲁棒性,方法是在用户-用...……更多
AI出图更快、更懂你心意,高美感文生图模型修炼了哪些技术秘籍?
...》就邀请到了豆包文生图技术专家李亮、NVIDIA 解决方案架构师赵一嘉,为我们深入剖析了文生图模型出图更美、更快、更懂用户心意背后的技术链路。直播开始,李亮首先详细拆解了近期国产大模型「顶流」—— 字节跳动豆包...……更多
OpenCity大模型预测交通路况,零样本下表现出色,来自港大百度
...题,研究团队新的基础模型OpenCity。OpenCity结合了Transformer架构和图神经网络,用以模拟交通数据中复杂的时空依赖关系。通过在大规模、异质性交通数据集上进行预训练,OpenCity能够学习丰富、具有泛化性的表征,这些表征可有...……更多
突破时间序列组合推理难题!南加大发布一站式多步推理框架TS-Reasoner
...进方法,尤其在多步推理任务中展现了显著的优势。模型架构与实现图1:TS-Reasoner的总体架构。大型语言模型(LLM)作为任务分解器,通过学习上下文中的示例来将任务实例分解为程序。然后,程序执行器将调用我们工具箱中的...……更多
科学家研发自动驾驶新模块,让自动驾驶场景理解更接近人类认知
...以对周围环境进行实时感知和安全导航。然而,这种系统架构不但代码量巨大、后处理逻辑复杂、后期维护成本高。而且在实际应用过程中容易出现误差累积的现象,比如前方突然出现行人,由于感知模块的漏检,下游的预测决...……更多
智谱AI发布视频生成大模型,B站参与研发,亦庄提供算力|甲子光年
...空间。从模型本身角度看,需要更具突破式创新的新模型架构,它应该更高效压缩视频信息,更充分融合文本和视频内容,贴合用户指令的同时,让生成内容真实感更高。2.自研DiT架构清影底座的视频生成模型是CogVideoX,它将文...……更多
英伟达开源NVLM 1.0屠榜多模态!纯文本性能不降反升
...经过多年的发展,逐渐发展成了统一的纯解码器Transformer架构。反观现有的多模态大模型架构仍然处于混乱状态,开源模型在选择LLM主干、视觉编码器以及训练数据方面都存在差异,性能优异的闭源多模态大模型也没有公布相关...……更多
AI将爆发哪些超级应用?
...高的可选消费品,拥有上万个电子零部件。同时,汽车的架构也在向“中央集中式”和云计算变革,与AI技术可以实现“1+1>2”。二是智能汽车相当于“带轮子的机器人”,由于两者的技术难点(算法)和核心零部件(传感器...……更多
大模型下沉,汽车需要存算一体芯片|超级观点
...电量,这是地球无法承受的。”然而,在传统的冯诺依曼架构下,存储和运算是分离的,芯片大概有80%-90%的功耗浪费在数据的存储和计算之间的搬运,而非计算上。 此外,当大模型逐渐向智能汽车、电脑、手机等边缘端下沉,...……更多
清华团队提出新型光计算架构,光训练速度提升1个数量级
...戴琼海教授课题组创新性地设计了全前向智能光计算训练架构,开发出一种名为“太极-II”的通用光训练芯片。该架构摆脱了对电计算离线训练的依赖,而且能够为智能系统的高效光训练提供支撑。图丨图中为课题负责人方璐教...……更多
中昊芯英与深圳联通携手共建广东首个国产TPU 智算中心
...积累与优势互补。据了解,中吴芯英作为国内领先的TPU 架构AI 芯片企业,此次提供了搭载其自主研发的高性能 TPU 芯片“刹那®”的人工智能服务器及大规模AI计算集群系统“泰则®”,为项目搭建坚实的AI 计算底座。深圳联通则...……更多
Llama3训练每3小时崩一次?豆包大模型、港大为脆皮万卡训练提效
...nt 在不同并行度配置的任务中的灵活迁移。系统设计存储架构ByteCheckpoint 采用了元数据 / 张量数据分离的存储架构,实现了 Checkpoint 管理与训练框架和并行度的解耦合。 不同训练框架中的模型以及优化器的张量切片 ( Tensor Shard)...……更多
新扩散模型OmniGen一统图像生成,架构还高度简化、易用
...大程度上仍未得到探索。近日,智源推出了新的扩散模型架构 OmniGen,一种新的用于统一图像生成的多模态模型。OmniGen 具有以下特点:统一性:OmniGen 天然地支持各种图像生成任务,例如文生图、图像编辑、主题驱动生成和视觉...……更多
彩云科技发布基于DCFormer架构通用大模型云锦天章
...景等热点话题进行了交流,并正式推出了首款基于DCFormer架构开发的通用大模型云锦天章,与此同时,彩云科技旗下AI RPG平台彩云小梦,也成为首款基于DCFormer架构开发的AI产品。早在2017年,谷歌发布《Attention Is All You Need》论文...……更多
让x86处理器也有AI智能,解读AMD Ryzen AI引擎
...理AI相关任务是采用神经网络进行计算的,和传统计算在架构和模式上都存在巨大的差异。我们知道人工智能最初是由传统的硬编码算法创造,并由人类编程完成,而现代的人工智能大多基于神经网络,数据以不同的权重从一个...……更多
蜘蛛侠妖娆起舞,下代ControlNet来了!贾佳亚团队推出,即插即用
...的参数子集,其余参数则被冻结。另外在设计ControlNeXt的架构时,研究团队还保持了模型结构与原始架构的一致性,从而实现了即插即用。无论是ControlNet还是ControlNeXt,条件控制信息的注入都是一个重要环节。在这个过程中,Cont...……更多
有望改写AI未来!NVIDIA全新nGPT使训练速度暴增20倍
...队提出了一种名为归一化Transformer(nGPT)的新型神经网络架构。这一架构在超球面(hypersphere)上进行表示学习,能够显著提升大型语言模型(LLM)的训练速度,最高可达20倍,同时保持了模型的精度。nGPT架构的核心在于将所有...……更多
...摒弃传统电子深度计算范式,首创分布式广度智能光计算架构,研制出全球首款大规模干涉衍射异构集成芯片“太极”(Taichi)。该芯片具备每平方毫米每秒879万亿次乘加运算的面积效率与每焦耳160万亿次运算的能量效率,首次...……更多
...大学物理系副教授鲁大为合作,在实验上首次使用分布式架构实现环面码模型并成功探测拓扑相位,展示了分布式架构在量子模拟领域的优势。近日,相关成果发表于《物理评论快报》。近年来,超导量子计算迅速发展,规模有...……更多
大模型新趋势之MoE:现状、挑战及研究方向
...快推出MoE大模型,1-5月发布千亿以上大模型均采用MoE优化架构,且数量超过近三年总和。MoE大模型架构凭借平衡大模型训推成本和计算效率等优势,更适合处理大规模数据和复杂任务,已成谷歌、OpenAI、阿里、腾讯等企业控制成...……更多
5项重大更新,NVIDIA助力人形机器人研发迈入新阶段
...机器安全、自然地交互。据悉,该 SoC 基于 NVIDIA Blackwell 架构,采用第二代 Transformer 引擎,其变压器引擎可提供 800 teraflops 的 8 位浮点 AI 性能,运行带宽达 100GB/s,AI 计算性能达 800TFLOPs,多层次规划能力卓越,以运……更多
超越Transformer,全面升级!MIT等华人团队发布通用时序TimeMixer++架构,8项任务全面领先
...一个模型,同时胜任所有任务?近些年来,包括Transformer架构在内的一系列工作,虽然在细分任务上展现出色的性能,但由于缺乏灵活和通用的时序特征的提取能力,无法成为通用的模型架构。为了解决这些问题,来自MIT、港科...……更多
对话腾讯汤道生:大模型和云一样,难以被垄断|36氪专访
...服务能力获得市场竞争力,而不是单纯的低价。新的技术架构,也能为客户降本,比如大数据的湖仓一体架构,就比传统做法性价比更高。最近推出的新一代云服务器,基于性价比更高的Bergamo芯片,也能给到客户更低的单位计...……更多
冲击「行业前三」,长城的智驾开窍了?
...道里窄车道转弯等场景,可以处理的比较流畅。除了技术架构外,影响端到端效果最关键的,是算力和内存、数据,以及未知的训练效果。从长城分享的信息来看,数据来自于长城用户回传数据和专业数采数据,目前累计真实用...……更多
更多关于科技的资讯:
三星折叠新专利曝光:可抵御日常各种冲击 Galaxy Z Fold7要用
快科技2月2日消息,三星电子最近曝光了一项新的专利,专注于提高其折叠屏手机的耐用性。据悉,这项专利与三星的可折叠屏幕保护膜供应商Segyung Hi Tech共同申请
2025-02-02 09:10:00
新春走基层|通用机械“加班记”
大年初四,大街小巷满是新春的热闹与喜庆,走亲访友的人们互道新年祝福,空气中弥漫着烟火与团圆的气息。然而,中国吉林网记者走进吉通机械集团旗下的全资子公司——吉通凯撒的生产车间
2025-02-02 09:26:00
《哪吒之魔童闹海》票房破26亿遥遥领先春节档 导演饺子回应“啃老”三年
快科技2月2日消息,据猫眼专业版数据,电影《哪吒之魔童闹海》 上映5天, 总票房破26亿,观影人次破5000万,排名春节档第一
2025-02-02 10:10:00
天加签下玻利维亚最大购物中心项目,海外市场再获突破——“我们要让‘中国制造’成首选”□南京日报/紫金山新闻记者张甜甜 通讯员王刚李雪莹周莹“祝贺你们
2025-02-02 10:12:00
美国费城失事飞机以201公里时速坠地:机上6人全部遇难
快科技2月2日消息,据报道,一架载有6人的小型飞机1月31日从费城东北机场起飞后坠毁。据悉,失事飞机以时速201公里坠地
2025-02-02 10:40:00
RTX 5090/5080日本东京发售造成现场混乱:数百人挤爆店家致紧急停售
快科技2月2日消息,NVIDIA新一代旗舰显卡RTX 5090、5090D、5080已于本月30日(大年初二)正式上市
2025-02-02 10:40:00
第一现场|当“国补”遇上春节,济南“火力全开”
齐鲁晚报·齐鲁壹点 李梦瑶 石晟绮销售人员每天从早忙到闭店,消费者“组团”来“换新”,帮老人选大屏手机,带小孩挑智能手表
2025-02-02 11:07:00
2025年国内春节档票房超57.4亿:超越北美 暂列全球第一
快科技2月2日消息,2025年中国电影市场迎来开门红,累计票房突破50.47亿元,超越北美暂列全球单一市场票房冠军。据猫眼专业版数据
2025-02-02 11:40:00
英伟达、微软、亚马逊三家美国巨头同日接入DeepSeek 网友实测:这是要成精!
快科技2月2日消息,DeepSeek横空出世,让美国硅谷感受到了前所未有的压力。甚至那些平时对AI毫不关心的人,也感受到了来自中国AI的震撼
2025-02-02 11:40:00
孩子父亲拟卖房赔!被炮炸飞两辆车车主已涨粉20多万:车总价合计超百万
快科技2月2日消息,近日在在四川内江资中,一名小孩往下水道投放鞭炮,结果这一不当行为瞬间引发剧烈爆炸。据国内媒体报道称
2025-02-02 08:10:00
周鸿祎:DeepSeek践行开源精神 是真正的“Open AI”
快科技2月2日消息,据报道,中国人工智能企业DeepSeek近期遭遇了来自美国的全方位打压,包括调查、禁用、污名化指责以及大规模攻击等
2025-02-02 08:10:00
绕开英伟达护城河CUDA!消息称DeepSeek准备适配国产GPU
快科技2月2日消息,据国内媒体报道称,DeepSeek在研发大模型时绕过了英伟达的护城河CUDA,这让美国不少巨头们感到了很大的威胁
2025-02-02 08:10:00
《蛟龙行动》总制片于冬:打一星的都是黑水 我们绝不撤档
快科技2月2日消息,据报道,今年春节档影片《蛟龙行动》陷入排片困境、影片遭遇水军恶意打低分等话题,引发网友热议。在《蛟龙行动》1月31日的路演活动上
2025-02-02 08:40:00
鞭炮炸翻豪车 小孩家庭支付天价赔偿为假!保险公司:8车总共受损28.5万
快科技2月2日消息,近期,四川资中一小孩因燃放鞭炮引起的沼气燃爆,致使8辆汽车受损一事,引起网友关注热议。因为受损车辆包括林肯
2025-02-02 08:40:00