• 我的订阅
  • 头条热搜
扩散模型训练方法一直错了!谢赛宁:Representation matters
...远不如使用具有特征预测损失和崩溃预防机制的联合嵌入架构。这篇来自纽约大学 @sainingxie 的论文表明,即使你只对生成像素感兴趣(例如使用扩散 Transformer 生成漂亮图片),也应该包含特征预测损失,以便解码器的内部表征...……更多
...。另一种是将顺序数据根据上下文拼接在一起的“转换器架构”技术,例如,大型语言模型就是使用转换器架构将单词组装成可理解的句子。不过,Sora生成的视频中仍然有很多错误,比如一个行走的人的左右腿交换位置、一把...……更多
AI落地千行百业,存储痛点凸显,浪潮信息如何助力AI向实?
...即存储和计算的平衡及两者的有效利用。然而测试中存储架构的多样与存算节点的非标准化,导致性能数据本身的参考价值有所下降。在性能数据之外,有无另一指标可以更为准确地反映存储系统在AI场景的表现呢?MLPerf存储基...……更多
2022生成模型进展有多快,新论文盘点9类生成模型代表作
...有Phenaki、Soundify。Phenaki 由谷歌打造,基于新的编解码器架构C-ViViT将视频压缩为离散嵌入,能够在时空两个维度上压缩视频,在时间上保持自回归的同时,还能自回归生成任意长度的视频。Soundify 是Runway开发的一个系统,目的是...……更多
信号表征指数级强、内存节省35%,量子隐式表征网络
... MLP 拟合的图像的不同频率分量(底部) 模型图 3. 模型架构模型整体架构QIREN 的总体架构如图 3 所示,由 N 个混合层和末端的线性层组成。该模型以坐标作为输入并输出信号值。数据最初进入混合层,从 Linear 层和 BatchNorm 层开...……更多
GPT-4就是冲着赚钱来的!
...家,千芯科技董事长陈巍博士认为,OpenAI不公布参数量和架构是一种商业化技术保护策略,增加其竞争对手的产品试错成本。不过目前也没法排除GPT-4参数量小于GPT-3的可能性。迅速落地商业应用,保密参数量,增加图片识别能...……更多
stablediffusion3:文字渲染能力大升级
...的是,它和Sora一样当起了维新派,摒弃了业内常用的U-NET架构,加入Transformer和Diffusion结合的大家族。而具体的原理和进步啥的,看不懂没关系,咱们过会儿再聊。直接先来一波全新的高清无码大图,让大伙们见识下StableDiffusion3...……更多
智谱AI“中国版Sora”实测:6秒视频排队2分钟,猫猫很可爱,人手很翻车
...三个维度融合起来。该模型参考Sora算法设计,采用了DiT架构,相比前代CogVideo模型推理速度提升了6倍。智谱AI成立于2019年6月,起源于清华大学计算机系知识工程实验室,专注于开发新一代认知智能大模型。一直以来,智谱AI以...……更多
抽卡效率提升4.8倍!东北大学等开源优化版Stable-Diffusion.cpp:分辨率越高越快,生成质量更好
...配到不同的计算线程与核心上,充分利用多线程和多核心架构,动态分配计算任务,充分发挥硬件性能,减少图像生成延迟。尤其是在M系列Mac设备上,优化了性能核心(P-core)和效率核心(E-core)的分工,使推理速度得到了显...……更多
腾讯云公布多项大模型产品进展
...模型也持续迭代升级。在生图领域,腾讯混元文生图基础架构已全面升级至Sora同款的DiT架构,支持中英文双语输入及理解,具备多轮绘图能力,测评结果国内领先;在生视频领域,腾讯混元支持文生视频、图生视频、图文生视...……更多
比Stable Diffusion便宜118倍!1890美元训出11.6亿参数高质量文生图模型
...幸存的patch中,从而显著减少高mask带来的性能下降。在本架构中,patch-mixer是通过注意力层和前馈层的组合来实现的,使用二进制掩码进行mask,整个模型的损失函数为:与MaskDiT相比,这里不需要额外的损失函数,整体设计和训...……更多
全球首个端侧应用 70 亿参数大语言模型手机OPPO Find X7发布
...的5G通讯、AI等高含金量领域。Find X7 搭载 OPPO 自研的潮汐架构,通过将性能研究深入到芯片底层,实现异构计算单元的超动态调度,让旗舰手机可以兼具极致的性能释放、极致的能效表现。OPPO芯片技术负责人姜波表示:“想做...……更多
LeCun最新万字演讲:纯语言模型到不了人类水平,我们基本已放弃
...此之外,他还谈到当前大模型的局限性、以目标驱动的AI架构,包括利用世界模型进行推理和规划,最后强调了开源AI的重要性。对于未来发展,他提到,最终机器将超越人类智能,但它们将受到控制,因为它们是目标驱动的。...……更多
Meta首款多模态Llama 3.2开源!1B羊驼宝宝,跑在手机上了
...觉任务的Llama模型,Meta为11B和90B型打造了一个全新的模型架构。在图像输入方面,训练了一组适配器权重,将预训练的图像编码器集成到预训练的大语言模型中。具体来说,该适配器:由一系列交叉注意力层组成,负责将图像编...……更多
智谱AI发布视频生成大模型,B站参与研发,亦庄提供算力|甲子光年
...空间。从模型本身角度看,需要更具突破式创新的新模型架构,它应该更高效压缩视频信息,更充分融合文本和视频内容,贴合用户指令的同时,让生成内容真实感更高。2.自研DiT架构清影底座的视频生成模型是CogVideoX,它将文...……更多
大模型的未来,快手在自己身上找答案
...上来说已经远优于同类数字人产品效果。这是因为在工程架构方面,「AI 关小芳」实现了端云结合的技术架构设计,通过搭建分布式流媒体计算调度框架、自研大模型能力算子化适配和专有网络协议加速,支持用户双工和 AI 智...……更多
阿里多模态检索智能体,自带o1式思考过程!复杂问题逐步拆解
...,OmniSearch引入了一种动态检索规划框架。OmniSearch的核心架构包括:规划智能体(Planning Agent):负责对原始问题进行逐步拆解,根据每个检索步骤的反馈决定下一步的子问题及检索策略。 检索器(Retriever):执行实际的检索任...……更多
天玑9300 苏黎世AI跑分超2000,AI性能第一
...!在科技日新月异的今天,天玑9300旗舰芯片以全大核CPU架构引领潮流,打破了固有模式。为用户带来了“高智能、高性能、高能效、低功耗”的使用体验,轻松拿下综合性能第一、CPU多核性能第一、GPU性能第一、AI性能第一等响...……更多
Sora背后团队:成立不到1年,站在谷歌肩头,应届博士带队
...空Patch)技术和DiffusionTransformer(DiT,或扩散型Transformer)架构。Sora官网截图记者查询这两项技术的原作论文发现,时空Patch的技术论文实际上是由谷歌DeepMind的科学家们于2023年7月发表的。DiT架构技术论文的一作则是Sora团队领导..……更多
轻量化模型架构catvton的优势在哪里
...下。 来自中山大学、Pixocial等机构联合发布轻量化模型架构CatVTON。他们是以StableDiffusionv1.5inpainitng为基础模型。来看看更多效果。用扩散模型进行虚拟试衣CatVTON可以实现传统平铺服装图到人物的换装。不管是上衣、裤子、裙子...……更多
华人团队爆火instructblip抢跑看图聊天
...的信息转移。InstructBLIP通过充分利用BLIP-2模型中的Q-Former架构,提出了一种指令感知的视觉特征提取方法。如上图所示,Q-Former被设计用来从一个冻结的图像编码器的输出中提取视觉特征。根据BLIP-2的论文,Q-Former已经分成两个阶...……更多
较传统采标方法降本80%,合成数据服务商「卓印智能」获天使轮融资 | 36氪首发
...据 来源:卓印智能创始人俞开文博士有多年AI算法、技术架构经验,曾经历任蚂蚁、百度等大厂中的资深AI架构师,有丰富的大型To B项目落地经验。他告诉36氪,从数据角度,优质数据的短缺一直是困扰AI赛道的难题。“在各式...……更多
生成式AI在金融行业的应用及思考
...引发了广泛关注和热议。在这场由亚马逊云科技金融行业架构师团队负责人张呈刚先生主讲的演讲中,他全面深入地探讨了生成式人工智能在金融行业的应用现状、挑战和机遇,并分享了亚马逊云科技为企业提供的全方位支持和解...……更多
OpenAI发布首个文生视频模型Sora,网友:工作要丢了!
...初的随机像素转化为清晰的图像场景。Sora使用了Transformer架构,有极强的扩展性。视频和图像是被称为“补丁”的较小数据单位集合,每个“补丁”都类似于GPT中的一个标记(Token),通过统一的数据表达方式,可以在更广泛的...……更多
黄仁勋对话Transformer七子:我们被困在原始模型里,还需要更强大的新架构
...术,还无法触及每个人。而它有如此多的用途,如此简单易用。我们的最终目标是帮助全世界每个人。所以我必须离职创业,让这些发生。Jakob Uszkoreit(Inceptive):我更多意识到,这项技术能比以前更广泛地改善人们的生活质量...……更多
科学家开发多模态音乐理解和生成大模型,兼具理解和创作音乐能力
...型的使用,让模型得以具备生成音乐的能力。在完成模型架构设计的基础上,他们搜集了目前市场上可以找到的所有开放版权音乐,并利用 MU-LLaMA 和一些视觉基础模型来生成文本/图像/视频到音乐的多模态数据集,从而助力 M2Uge...……更多
国产AI可以拍微电影了!4K、60帧高清画质,自带音效
...将自然语言描述转化为动态视觉内容的复杂系统。在模型架构设计中,CogVideoX特别采用了因果3D卷积(Causal 3D Convolution),以高效捕捉时空维度上的复杂变化,使得模型能够更加精确地理解和生成富有细节的场景。同时,该模型...……更多
全新一代天玑9300全大核架构,到底有何玄机?
...动芯片天玑9300。全新一代天玑9300芯片凭借创新的全大核架构设计,提供了远超以往的高智能、高性能、高能效、低功耗等热特性,通过极具突破性的先进科技创新,在端侧生成式AI、游戏、影像等方面重新定义了旗舰移动体验...……更多
一文读懂黄仁勋CES重磅发布:最新5090芯片、世界最大AI计算机、首个世界模型
...仁勋发布了一系列重磅技术产品,包括新一代基于Blackwell架构的RTX 50系列显卡、世界上最大最快的巨型芯片Grace Blackwell NVLink72、首个世界基础模型Cosmos等,并公布了在AI代理、物理AI等方面的布局和进展。新一代GeForce RTX 50系列芯...……更多
“智算融合 共创未来”——开普云AI战略暨新产品发布会召开
...比;支持云端模型更新和升级,实现大模型边缘应用的高易用性。 开普云大模型平台产品:驾驭智能,驱动未来 开普云未来科技研究院副院长倪金松介绍了两款大模型平台级产品,包括开悟大模型运营管理系统(LLMOps)和开...……更多
更多关于科技的资讯:
国产超大规模智算平台“飞星二号”将在今年交付使用首批算力
大皖新闻讯 1月25日,科大讯飞董事长刘庆峰在公司年会现场透露了“飞星二号”的最新进展,表示该平台的首批算力将在2025年交付使用
2025-01-25 22:56:00
李楠点评iPhone 17系列:除了薄没什么意思
快科技1月25日消息,李楠发微博表示,iPhone 17系列不是unibody(一体成型),除了薄没什么意思。此前有博主爆料
2025-01-25 23:05:00
北京佛爷顶开始飘雪花了:今天夜间和明天有降雪
1月25日消息,据气象部门消息,1月25日20时20分降雪开始影响北京西部山区,延庆佛爷顶开始下雪了,近一小时降雪量不足1毫米
2025-01-25 23:05:00
余承东展示科幻一幕:智界新S7自己开过来接他
快科技1月25日消息,今天华为余承东展示了鸿蒙智行强大的智能驾驶功能之一——泊车代驾。视频中,余承东在手机APP上打开这一功能
2025-01-25 19:35:00
三星S25 Ultra在3DMark测试中击败iPhone 16 Pro Max:领先幅度达36%
快科技1月25日消息,三星Galaxy S25 Ultra在3DMark的Steel Nomad Light基准测试中以36%的领先优势击败了苹果iPhone 16 Pro Max
2025-01-25 19:35:00
首发自研芯片 谷歌Pixel 11系列曝光:4剑齐发
快科技1月25日消息,据报道,谷歌将在2026年下半年推出4款Pixel 11系列机型,包含Pixel 11、Pixel 11 Pro
2025-01-25 20:05:00
超百家企业参加新年浙江首批拓市场增订单团组 “千团万企”收获了什么
拓市场,增订单,新年首个工作日,浙江外贸已“开跑”。1月2日下午,浙江省2025年“千团万企拓市场增订单”行动正式启动
2025-01-25 20:17:00
小屏之王!三星Galaxy S25预售:尝鲜价6499元
快科技1月25日消息,三星将在2月11日发布Galaxy S25系列国行版,这次三星同时推出了Galaxy S25、Galaxy S25+和Galaxy S25 Ultra三款机型
2025-01-25 20:35:00
看好自己的物品!南京南站4天捡到1000个身份证
1月25日消息,据媒体报道,南京南站的遗失物品招领处引发关注。据了解,南京南站专门开辟了一个位置用于存放旅客遗失的物品
2025-01-25 20:35:00
零售商员工公然变黄牛!2倍价格倒卖RTX 5090
快科技1月25日消息,RTX 5090/5090D已经性能解禁,很快就会上市,这次供货之紧张绝对前所未有,比如英国顶级零售商OCUK就透露
2025-01-25 20:35:00
春节机票跳水!多条航线大降价:部分跌至百元
快科技1月25日消息,据报道,春节前夕,多条航线降价,部分航线低至百元。去哪儿数据显示,如天津-上海裸票价格最低145元
2025-01-25 20:35:00
最新爆料:苹果调动善战老将整顿AI业务 期盼能打翻身仗
知名科技爆料人马克·古尔曼周五表示,面对AI项目的现状,苹果公司决定先从人事问题下手。知情人士透露,擅长整顿“问题产品”和推动重大项目上市的项目管理副总裁金·沃拉斯(Kim Vorrath)
2025-01-25 21:05:00
中国台湾台南市再发5.1级地震:福建多地有震感 之前致台积电6万块晶圆报废
据中国地震台网正式测定,1月25日19时49分,在台湾台南市(北纬23.31度,东经120.46度)发生5.1级地震,震源深度11千米
2025-01-25 21:05:00
73岁喜当爹!张纪中哄四胎女儿睡觉引围观:网友直呼老当益壮
1月25日消息,近日,杜星霖在网上分享了张纪中哄娃睡觉的视频,引起了不少网友的讨论。张纪中在美国家中哄四胎女儿睡觉,尽管他已73岁
2025-01-25 21:05:00
男子学狗语驯狗:一开口就被咬穿脸
1月25日消息,据媒体报道,胡先生学习说狗语,跟家里的宠物犬交流,没想到刚一开口就被狗咬了。据了解,胡先生家的宠物狗是一条阿拉斯加犬
2025-01-25 21:35:00