• 我的订阅
  • 头条热搜
轻量化模型架构catvton的优势在哪里
...下。 来自中山大学、Pixocial等机构联合发布轻量化模型架构CatVTON。他们是以StableDiffusionv1.5inpainitng为基础模型。来看看更多效果。用扩散模型进行虚拟试衣CatVTON可以实现传统平铺服装图到人物的换装。不管是上衣、裤子、裙子...……更多
北大林宙辰团队全新混合序列建模架构MixCon:性能远超Mamba
...此,北京大学林宙辰、徐鑫提出了一种全新混合序列建模架构 ——MixCon,它为解决这些难题带来了创新性的方案。经实验验证,其性能远超 Mixtral、Mamba 和 Jamba。论文已在 European Conference on Artificial Intelligence (ECAI)……更多
“苹果智能”仅面向付费开发者,三大新模块炸裂出圈
...在于芯片级别的互联性特别高。苹果的技术论文表明,TPU架构可以开发更大、更复杂的AI模型。三大新模块炸裂出圈随着iOS18.1Beta版的上线,注册开发者从即日起就能体验到苹果AI的部分功能。据悉,本次更新只支持M系和A17Pro芯...……更多
全球首次!时序大模型突破十亿参数,华人团队发布Time-MoE,预训练数据达3000亿个时间点
【新智元导读】Time-MoE采用了创新的混合专家架构,能以较低的计算成本实现高精度预测。研发团队还发布了Time-300B数据集,为时序分析提供了丰富的训练资源,为各行各业的时间序列预测任务带来了新的解决方案。在当今以数...……更多
智能驾驶的「 ChatCPT 时刻」,这么近,那么远
...。让他发出感叹的方案,就是如今风靡整个行业的端到端架构。尽管几年前,端到端架构在自动驾驶领域的运用已经出现在英伟达论文中,但正式落地使用还是从特斯拉的这次转变开始。 什么是智能驾驶的端到端架构呢?严格...……更多
NeurIPS 2024 Oral | 小参数,大作为!揭秘非对称 LoRA 架构性能
...以及剑桥大学的研究者联合提出了一种全新的非对称 LoRA 架构 —— HydraLoRA。与传统 LoRA 需要对所有任务使用相同的参数结构不同,HydraLoRA 引入了共享的 A 矩阵和多个独立的 B 矩阵,分别处理不同的任务,从而避免任务间的干扰...……更多
扩散模型也能搞定社交信息推荐,港大数据智能实验室提出RecDiff
...速度较慢。相比之下,团队的 RecDiff 则得益于紧凑的神经架构,不需要手工制作先验,因此能利用辅助信号进行更快的优化。 对 RecDiff 框架抗噪能力的进一步探索团队评估了 RecDiff 在数据噪声情况下的鲁棒性,方法是在用户-用...……更多
AI出图更快、更懂你心意,高美感文生图模型修炼了哪些技术秘籍?
...》就邀请到了豆包文生图技术专家李亮、NVIDIA 解决方案架构师赵一嘉,为我们深入剖析了文生图模型出图更美、更快、更懂用户心意背后的技术链路。直播开始,李亮首先详细拆解了近期国产大模型「顶流」—— 字节跳动豆包...……更多
OpenCity大模型预测交通路况,零样本下表现出色,来自港大百度
...题,研究团队新的基础模型OpenCity。OpenCity结合了Transformer架构和图神经网络,用以模拟交通数据中复杂的时空依赖关系。通过在大规模、异质性交通数据集上进行预训练,OpenCity能够学习丰富、具有泛化性的表征,这些表征可有...……更多
突破时间序列组合推理难题!南加大发布一站式多步推理框架TS-Reasoner
...进方法,尤其在多步推理任务中展现了显著的优势。模型架构与实现图1:TS-Reasoner的总体架构。大型语言模型(LLM)作为任务分解器,通过学习上下文中的示例来将任务实例分解为程序。然后,程序执行器将调用我们工具箱中的...……更多
科学家研发自动驾驶新模块,让自动驾驶场景理解更接近人类认知
...以对周围环境进行实时感知和安全导航。然而,这种系统架构不但代码量巨大、后处理逻辑复杂、后期维护成本高。而且在实际应用过程中容易出现误差累积的现象,比如前方突然出现行人,由于感知模块的漏检,下游的预测决...……更多
智谱AI发布视频生成大模型,B站参与研发,亦庄提供算力|甲子光年
...空间。从模型本身角度看,需要更具突破式创新的新模型架构,它应该更高效压缩视频信息,更充分融合文本和视频内容,贴合用户指令的同时,让生成内容真实感更高。2.自研DiT架构清影底座的视频生成模型是CogVideoX,它将文...……更多
英伟达开源NVLM 1.0屠榜多模态!纯文本性能不降反升
...经过多年的发展,逐渐发展成了统一的纯解码器Transformer架构。反观现有的多模态大模型架构仍然处于混乱状态,开源模型在选择LLM主干、视觉编码器以及训练数据方面都存在差异,性能优异的闭源多模态大模型也没有公布相关...……更多
AI将爆发哪些超级应用?
...高的可选消费品,拥有上万个电子零部件。同时,汽车的架构也在向“中央集中式”和云计算变革,与AI技术可以实现“1+1>2”。二是智能汽车相当于“带轮子的机器人”,由于两者的技术难点(算法)和核心零部件(传感器...……更多
大模型下沉,汽车需要存算一体芯片|超级观点
...电量,这是地球无法承受的。”然而,在传统的冯诺依曼架构下,存储和运算是分离的,芯片大概有80%-90%的功耗浪费在数据的存储和计算之间的搬运,而非计算上。 此外,当大模型逐渐向智能汽车、电脑、手机等边缘端下沉,...……更多
1-bit大模型还能再突破!新一代BitNet架构启用4位激活值
...【新智元导读】近日,BitNet系列的原班人马推出了新一代架构:BitNet a4.8,为1 bit大模型启用了4位激活值,支持3 bit KV cache,效率再突破。量化到1 bit的LLM还能再突破?这次,他们对激活值下手了!近日,BitNet系列的原班人马推出...……更多
清华团队提出新型光计算架构,光训练速度提升1个数量级
...戴琼海教授课题组创新性地设计了全前向智能光计算训练架构,开发出一种名为“太极-II”的通用光训练芯片。该架构摆脱了对电计算离线训练的依赖,而且能够为智能系统的高效光训练提供支撑。图丨图中为课题负责人方璐教...……更多
中昊芯英与深圳联通携手共建广东首个国产TPU 智算中心
...积累与优势互补。据了解,中吴芯英作为国内领先的TPU 架构AI 芯片企业,此次提供了搭载其自主研发的高性能 TPU 芯片“刹那®”的人工智能服务器及大规模AI计算集群系统“泰则®”,为项目搭建坚实的AI 计算底座。深圳联通则...……更多
Manus和DeepSeek的差别是什么 谁更厉害:一文秒懂!
...、技术定位与核心能力DeepSeek:知识型“最强大脑”技术架构:基于混合专家模型(MoE),参数规模达6710亿,专注于语言模型的极致优化,擅长知识推理、文本生成与专业问题解答。例如,法律合同润色、学术论文撰写等。核心...……更多
Llama3训练每3小时崩一次?豆包大模型、港大为脆皮万卡训练提效
...nt 在不同并行度配置的任务中的灵活迁移。系统设计存储架构ByteCheckpoint 采用了元数据 / 张量数据分离的存储架构,实现了 Checkpoint 管理与训练框架和并行度的解耦合。 不同训练框架中的模型以及优化器的张量切片 ( Tensor Shard)...……更多
新扩散模型OmniGen一统图像生成,架构还高度简化、易用
...大程度上仍未得到探索。近日,智源推出了新的扩散模型架构 OmniGen,一种新的用于统一图像生成的多模态模型。OmniGen 具有以下特点:统一性:OmniGen 天然地支持各种图像生成任务,例如文生图、图像编辑、主题驱动生成和视觉...……更多
彩云科技发布基于DCFormer架构通用大模型云锦天章
...景等热点话题进行了交流,并正式推出了首款基于DCFormer架构开发的通用大模型云锦天章,与此同时,彩云科技旗下AI RPG平台彩云小梦,也成为首款基于DCFormer架构开发的AI产品。早在2017年,谷歌发布《Attention Is All You Need》论文...……更多
智能体不够聪明怎么办?清华&蚂蚁团队:让它像学徒一样持续学习
...具模块,并在 FSM 中定义其调用规则即可。这种可扩展的架构设计使得 AMOR 不仅能够解决当前的知识推理任务,更为未来接入新的知识源、任务类型和工具能力预留了充足的扩展空间。正如论文所述,AMOR 提供了一个构建知识智...……更多
让x86处理器也有AI智能,解读AMD Ryzen AI引擎
...理AI相关任务是采用神经网络进行计算的,和传统计算在架构和模式上都存在巨大的差异。我们知道人工智能最初是由传统的硬编码算法创造,并由人类编程完成,而现代的人工智能大多基于神经网络,数据以不同的权重从一个...……更多
蜘蛛侠妖娆起舞,下代ControlNet来了!贾佳亚团队推出,即插即用
...的参数子集,其余参数则被冻结。另外在设计ControlNeXt的架构时,研究团队还保持了模型结构与原始架构的一致性,从而实现了即插即用。无论是ControlNet还是ControlNeXt,条件控制信息的注入都是一个重要环节。在这个过程中,Cont...……更多
有望改写AI未来!NVIDIA全新nGPT使训练速度暴增20倍
...队提出了一种名为归一化Transformer(nGPT)的新型神经网络架构。这一架构在超球面(hypersphere)上进行表示学习,能够显著提升大型语言模型(LLM)的训练速度,最高可达20倍,同时保持了模型的精度。nGPT架构的核心在于将所有...……更多
...摒弃传统电子深度计算范式,首创分布式广度智能光计算架构,研制出全球首款大规模干涉衍射异构集成芯片“太极”(Taichi)。该芯片具备每平方毫米每秒879万亿次乘加运算的面积效率与每焦耳160万亿次运算的能量效率,首次...……更多
大模型新趋势之MoE:现状、挑战及研究方向
...快推出MoE大模型,1-5月发布千亿以上大模型均采用MoE优化架构,且数量超过近三年总和。MoE大模型架构凭借平衡大模型训推成本和计算效率等优势,更适合处理大规模数据和复杂任务,已成谷歌、OpenAI、阿里、腾讯等企业控制成...……更多
...大学物理系副教授鲁大为合作,在实验上首次使用分布式架构实现环面码模型并成功探测拓扑相位,展示了分布式架构在量子模拟领域的优势。近日,相关成果发表于《物理评论快报》。近年来,超导量子计算迅速发展,规模有...……更多
技术驱动金融进化:揭秘 Indira 与 IAS 2.0 战略服务器矩阵背后的智
...佼佼者,Indira凭借其IAS2.0战略服务器矩阵及领先的AI技术架构,为全球投资者构建出一个高适应性、低延迟、合规透明的交易引擎。本文将从技术角度全面剖析这一系统如何支撑Indira平台的智能量化核心。多市场同步策略:全球...……更多
更多关于科技的资讯:
在数字经济浪潮奔涌、国企改革持续深化的时代背景下,绵阳安鼎元作为四川安州发展集团旗下专业的国有资产管理平台,勇立潮头,以深刻的变革意识和前瞻的战略视野
2025-11-27 10:07:00
厦门网讯(厦门日报记者 沈彦彦 王元晖)“政策一出台,咨询电话就没停过!”厦门厦旅国际旅行社有限公司湖滨东营业部负责人谢晓燕放下手中的咨询电话
2025-11-27 08:12:00
“脑”力全开!江西抢滩脑机接口新蓝海
当好莱坞经典电影《盗梦空间》描绘的人类通过脑机接口潜入他人意识的场景,从科幻照进现实,一场关乎未来产业格局的竞赛已悄然启幕
2025-11-27 07:13:00
专利技术遭盗用,创新成果被侵犯,专利权人该如何维权?11月24日,市知识产权纠纷调委会通过一起实用新型专利侵权的调解案例释法
2025-11-26 08:11:00
感恩节“心”守护:灵动生活集团全链条心理服务破局,让3000万用户听见温暖的回响
当感恩节的暖意在街头巷尾流转,“守护”与“感恩”成为叩击人心的关键词。在心理健康已从“小众需求”转变为“全民刚需”的今天
2025-11-26 08:35:00
省发展改革委近日批复了山西省教育科技人才一体化服务产业云平台项目可行性研究报告,建设地址位于中北大学校内。作为山西聚焦“产学研用深度融合”的关键信息化基建项目
2025-11-26 08:41:00
为推动智能建造落地应用,搭建行业交流平台,近日,“晋塔”智能装备观摩活动在太原市多个施工项目同步启动。“晋塔”智能施工升降机
2025-11-26 08:42:00
经济热力站|绿色转型为基 金融创新为翼 科技赋能为核——助推首都经济高质量发展再上新台阶
11月19日,“京彩不设限・经济热力站”月度主题走访活动再度启程,记者跟随采访团先后走进北京绿色交易所、中国邮政储蓄银行北京分行及北京银行顺义科技研发中心
2025-11-26 10:06:00
赞皇县:AI赋能“一网通办” 业务办理效率提升70%
河北新闻网讯(次柳静)近日,石家庄市赞皇县数据和政务服务局依托DeepSeek大模型与智能算法,创新打造AI“智能填报”平台
2025-11-26 10:07:00
河北师范大学金融学院举行“产品经理人才共创培养体系”主题培训
河北新闻网讯 近日,河北师范大学金融学院邀请北京来学吧信息技术有限公司相关负责人到校,开展了主题为“产品经理人才共创培养体系”主题培训
2025-11-26 10:09:00
南京生物医药:研发“拔节孕穗”,产业新星闪耀
第91届全国药交会在宁落幕南京生物医药:研发“拔节孕穗”,产业新星闪耀□南京日报/紫金山新闻记者张甜甜连续3天,南京国际博览中心人流如织
2025-11-26 10:26:00
2025年两院院士增选结果揭晓 南京地区7人入选 在宁院士总数达102人
南报网讯(记者何洁张安琪)11月21日,2025年两院院士增选结果正式揭晓,选举产生中国科学院院士73人、中国工程院院士71人
2025-11-26 10:27:00
隐风文化:锚定四大理念,以精品力穿越短剧周期
由北京隐风文化科技有限公司出品的奇幻爱情短剧《岁岁怀安》延续预约150万的热度,上线后迅速跃居红果站内热播榜高位,这也是今年团队继《咬清梨》《怎敌她动人》之后
2025-11-26 11:06:00
视源股份荣获2024年度广东省科技进步一等奖
2025年11月20日,广东省人民政府正式发布《2024年度广东省科学技术奖通报》(粤府〔2025〕50号)。视源股份牵头完成的“高自然度智能交互显示终端关键技术及产业化”项目
2025-11-26 11:06:00
视源股份成为英特尔首批尊享级合作伙伴 合作再升级
近日,英特尔合作伙伴联盟完成战略升级,联盟最高等级“钛金级”正式更迭为“尊享级”。视源股份凭借其在计算机领域的深厚积累
2025-11-26 11:06:00