• 我的订阅
  • 头条热搜
新扩散模型OmniGen一统图像生成,架构还高度简化、易用
...一图像生成模型 OmniGen。OmniGen 模型具有良好的简洁性和易用性,集成了多种基础图像生成任务,包括但不限于:文生图、图像编辑、角色一致性生成、基于视觉条件的生成等。OmniGen 支持基于任意多模态的文图指令完成任务,而...……更多
...频聊天等能力。米拉·穆拉蒂表示,“这是我们第一次在易用性方面真正向前迈出了一大步。”此前,大模型在各个领域的应用主要集中在文生文、文生图之上,今年初Sora的发布则推动文生视频领域进一步发展。业内分析表示,...……更多
空间智能产业化加速 一线企业集体锚定百度智能云
...一站式空间智能开发体验生态,为空间智能企业提供了最易用的应用开发工具、最丰富的大模型库和最全面的模型开发工具链,不仅满足2D和3D等应用中人、物、场三要素的生产需求,还支持大模型微调和传统模型开发,助力高...……更多
...储、提炼、共享至智慧化和模型化生成的全过程,以简便易用的组织知识管理业务系统融合大模型能力的形式,帮助客户更有效地管理和利用知识资源,简化工作流程,显著提高服务质量和效率。该系统基于Transformer架构的大语...……更多
iPad可用AI绘画交互编辑神器火了,网友:颤抖吧PS
...显著优于基线系统,包括复杂性和效率、一致性和集成、易用性以及总体满意度4个方面。看来体验过的用户反馈都不错呢!未来工作团队还表示,这将是一个长期的工作,未来他们的目标是扩展系统功能,纳入更多的编辑类型...……更多
送技术支持送资源!联发科携手产业伙伴启动天玑AI先锋计划
...的生成速度,功能包所占用的存储空间也可以大幅减少。易用的Neuron Studio 集成开发环境,跳出传统的代码开发环境,可为开发者提供高度集成的,一站式、可视化开发环境 ,带来“所见即所得”般更易用的开发体验,让开发过...……更多
OpenAI发布文生视频模型Sora,奥尔特曼选取网友提示词
...用扩散模型(diffusionprobabilisticmodels)技术,基于Transformer架构,但为了解决Transformer架构核心组件注意力机制的长文本、高分辨率图像处理等问题,扩散模型用可扩展性更强的状态空间模型(SSM)主干替代了传统架构中的注意力...……更多
更快、更强、更可控:智谱“起舞弄清影”,视频生成卷出新高度!
...多方的细节期望。如何实现这一点?这离不开智谱全自研架构的底色——从创立之初,智谱就“自研以明志”,从数据到训练集群运维再到核心算法,都实现了全方位的自研。在视频生成领域,智谱自研的视频理解模型用于为视...……更多
Find X7正式发布!天玑9300带来极致性能
...,这需要芯片有很高的性能和能效。天玑9300搭载第7代APU架构,最高可支持330亿参数的AI大语言模型,同时还有极低的功耗。 OPPO的FindX7就是利用了天玑9300芯片的生成式AI能力,为用户带来了许多创新的功能。比如通话摘要、文...……更多
Sora这就落伍了?Meta“最强视频模型”不用DiT,用Llama大力出奇迹了
...最基础的介绍,而最最重要的信息就是,它不再是一个DiT架构的模型,也就是和现在几乎所有最知名的文生视频模型架构都不一样。用Meta视频生成团队的研究科学家Andrew Brown的话说,在这个项目里最大的发现就是:数据,算力...……更多
Meta版Sora深夜横空出世,小扎放出16秒高清大片!92页论文曝光技术细节,Llama 3架构立功
...传图像生成个性化视频。甚至Meta还放出了92页论文,模型架构、训练细节一并公开,干货满满!毫无预兆地,Meta版Sora——Movie Gen,就在刚刚抢先上线了!Meta将其称为「迄今最先进的媒体基础模型」。全新上线的大杀器Movie Gen Vi...……更多
英伟达超快stylegan回归
...024×1024高分辨率的图像,并借鉴了StyleGAN2和StyleGAN3的部分架构设计。它的整体架构如下:具体到细节上,作者们对生成器、判别器和文本对齐权衡机制进行了重新设计,用FID对样本质量进行量化评估,并采用CLIP来对文本进行对...……更多
从未见过现实世界数据,MIT在虚拟环境中训练出机器狗,能跑酷
...人出色表现的主要原因。一个简单的 transformer 控制模型架构。研究者提出了一个简单的 transformer 架构,与之前extreme parkour, 使用 transformer 大大减少了处理多模态输入时控制模型架构的复杂度,如下图 8 所示。以往四足跑酷的...……更多
1890美元,就能从头训练一个还不错的12亿参数扩散模型
...型大小)实现了更好的性能。最后,作者结合 Transformer 架构的最新进展,例如逐层缩放、使用 MoE 的稀疏 Transformer,以提高大规模训练的性能。作者提出的低成本训练 pipeline 减少了实验开销。除了使用真实图像,作者还考虑在...……更多
Meta 公司发布 Imagine Yourself AI 模型
...个文本编码器和一个可训练视觉编码器的完全并行注意力架构; 以及一个从粗到细的多阶段微调过程这些创新技术使该模型能够生成高质量、多样化的图像,同时保持强大的身份保护和文本对齐功能。Imagine Yourself 使用可训练...……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
文 | 周鑫雨编辑 | 邓咏仪全球首家发布Sora同款底层架构的清华系模型公司,近期完成了新一轮融资。投资名单中,也出现了大模型独角兽智谱AI的身影。36氪获悉,近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融...……更多
oppo首个端侧应用70亿参数大模型findx7系列
...星通话,首个端侧应用70亿参数大模型,首次亮相的潮汐架构等诸多前沿技术。此次宣布的全新技术组合将全面落地下一代旗舰产品FindX7系列,为2024年旗舰手机树立全新的技术标杆,并为消费者带来刷新标准的创新旗舰体验发布...……更多
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
...时离开视野也保持不变。与GPT模型类似,Sora使用Transformer架构。Sora建立在过去对DALL·E和GPT模型的研究之上。 它使用DALL·E 3的重述技术,该技术涉及为视觉训练数据生成高度描述性的标题。因此,该模型能够更精准遵循生成用户...……更多
英伟达推出全新文生图ai模型
...达GettyImages表示全新文生图AI模型部分基于英伟达Edify模型架构,该架构隶属于英伟达Picasso,主要为视觉设计搭建和部署生成式AI模型。英伟达Edify模型架构不仅能够带来更快的生成速度、更高的质量、更符合用户输入的提示词,...……更多
4090笔记本0.37秒直出大片!英伟达联手MIT清华祭出Sana架构,性能秒杀FLUX
...本,秒生1K质量高清图。英伟达联合MIT清华团队提出的Sana架构,得益于核心架构创新,具备了惊人的图像生成速度,而且最高能实现4k分辨率。一台16GB的4090笔记本,仅需0.37秒,直接吐出1024×1024像素图片。如此神速AI生图工具,...……更多
stability邀请用户测试文本到图像生成模型
...StabilityDiffusion3还结合了扩散型变换器(diffusiontransformer)架构,这种架构结合了深度学习和扩散模型的优势,能够将随机噪声逐步转化为有意义的图像或视频内容。 ……更多
AI出图更快、更懂你心意,高美感文生图模型修炼了哪些技术秘籍?
...》就邀请到了豆包文生图技术专家李亮、NVIDIA 解决方案架构师赵一嘉,为我们深入剖析了文生图模型出图更美、更快、更懂用户心意背后的技术链路。直播开始,李亮首先详细拆解了近期国产大模型「顶流」—— 字节跳动豆包...……更多
英特尔AI PC半年“答卷”:三大AI引擎驱动
...的生产力、安全性、稳定性、可管理性、可持续性,以及易用性等方面,都更胜一筹。锚定6大AI商用场景,全面赋能千行百业当AI浪潮以无可阻挡的趋势到来时,更能看到产业链顶端厂商的底蕴所在。在AI PC的发展当中,英特尔...……更多
腾讯混元上线文生视频并开源,120秒内成片!还有提示词建议
...态ScalingLaw,增强时空建模与动态表现;4、采用自研3D VAE架构,提升图像和视频的重建能力。与此同时,腾讯宣布将这款拥有130亿参数规模的视频生成模型开源。目前,该模型已在APP与Web端发布,其标准模式下的视频生成大约需...……更多
Sora刷屏 标贝科技AI配音为音视频内容创作插上翅膀
... 生成式AI新里程碑据介绍,Sora采用了扩散模型和Transformer架构的结合(Diffusion Transformers, DiTs)。扩散模型通过逐渐添加噪声来破坏图像,然后学习逆向过程来恢复图像。Transformer架构则可以捕捉图像中的全局依赖关系。Sora的生成过...……更多
马斯克评OpenAI首个视频生成模型:人类认赌服输
...:“OpenAI今天宣布了Sora,它使用混合扩散和变压器模型架构生成长达1分钟的视频。他们似乎又领先了其他所有人1-2年。以下是我看过的最令人印象深刻的视频,以及生成它们的提示。”另一位X用户评论称:“gg皮克斯。”马斯...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...练框架北大对齐小组设计了高度模块化、扩展性以及简单易用的对齐训练框架,支持由文本、图片、视频、音频四大基本模态衍生出的任意模态模型对齐微调,并验证了框架对齐算法的实现正确性。模块化对齐代码实现高度可复...……更多
开源社区参数量最大的文生视频模型来了,腾讯版Sora免费使用
...,加速行业创新步伐。据技术报告,在混元视频生成模型架构设计与训练中,采用了多个创新技术:包括通过新一代本文编码器提升语义遵循,自研 3D 视觉编码器支持图像视频混合训练,通过全注意力机制提升画面运镜能力,...……更多
vivo发布自研大模型,为用户和开发者带来诸多惊喜
... 让图像生成技术触手可及,实现AI普惠随着扩散模型与AI架构的深度融合,图像生成技术迎来了指数级飞跃,其中文生图技术尤为显著。vivoAIGC图像大模型技术总监阮晓虎在论坛上介绍了vivo的文生图大模型——蓝心图像大模型Blu...……更多
手机市场深陷泥沼,厂商如何破冰?
...颈不断,手机厂商该如何破冰,进入下一个增长期?潮汐架构,一份关键答案性能不再是手机的瓶颈,前几年手机厂商都选择了新的影像赛道,通过与传统相机企业的携手同行,让高端手机市场迎来了新的增长机会。如今市面上...……更多
更多关于科技的资讯:
进军核药赛道,广药集团谋求“聚变”!
当承载着“国之重器”的核导弹方阵在阅兵式上巍然驶过,中国的科技实力与国防实力以庄严姿态展现于世界。在震撼之外,“核”所蕴含的巨大能量
2025-09-29 13:11:00
中新经纬9月29日电 题:备战“十一”消费高峰,平台用AI重塑购物逻辑作者 盘和林 工信部信息通信经济专家委员会委员“十一”长假将至
2025-09-29 13:13:00
聊城智汇 链接全球丨年销海外近8000万,泊西集团凭收纳盒从乡镇驶向全球
鲁网9月29日讯在山东聊城市茌平区洪官屯镇的土地上,山东泊西实业集团有限公司正以蓬勃之姿,书写着海外出口的精彩篇章。走进泊西集团的生产车间
2025-09-29 12:07:00
京东折扣超市全国第六店落户固安
河北新闻网讯(李寒梦、陈放)9月25日,京东折扣超市全国第六家门店在固安尚品爱购城市广场正式开业,进一步点燃居民消费热情
2025-09-29 09:53:00
从榨菜月饼到榨菜咖啡,乌江榨菜以创新打破品类边界
近年来,伴随区域化、特色化产品的迅速增长,各大品牌在深耕主业的同时也开始积极探索新赛道、新领域。乌江榨菜作为涪陵榨菜集团旗下的核心品牌
2025-09-29 08:03:00
华北首家!多美卡品牌专卖店登陆北京玩具反斗城
[北京] – 继中国首家多美卡品牌专卖店入驻玩具反斗城上海南丰城店并成功引爆小车收藏热潮后,玩具反斗城(Toys“R”Us)与多美(TAKARA TOMY)的战略合作再结硕果
2025-09-29 07:33:00
南报网讯(记者张甜甜)10月2日至3日,由南京报业传媒集团旗下南报优选供应链公司主办的首届紫金山国潮漫文化嘉年华,将在南京国际展览中心举办
2025-09-29 07:42:00
9月26日,购在中国(山西站)暨中石化易捷第八届易享节在我市启动,诸多三晋名特优产品将陆续入驻中石化易捷,走向全国。今后
2025-09-28 08:20:00
刚刚闭幕的长春航空展上,“净月号”成瞩目焦点
9月23日,长春航空展圆满闭幕,“净月号”凭借其震撼的实体造型与深厚的文化内涵,成为展会瞩目的焦点。这艘承载中式太空梦想的“星舰”
2025-09-28 10:07:00
为更好的服务广大客户,富德生命人寿安平支公司积极组织员工开展《产品健康增值服务》培训。培训中,讲师细致讲解公司产品健康增值服务
2025-09-28 10:12:00
河北新闻网讯(王丽英)9月24日至25日,宁晋县晶龙集团举行人力资源专业培训,内训师靳桂峰、王素峰和张晓宁分别围绕工伤保险及识人辨人
2025-09-28 10:18:00
美团Keeta上线阿联酋!40天连开3国,国际化全速推进
当地时间9月27日上午11点,美团旗下国际外卖品牌Keeta正式在阿联酋迪拜启动运营,这是Keeta继8月上线卡塔尔、9月上线科威特后
2025-09-28 10:22:00
小米17系列9月27日开售,卢伟冰称ProMax需求远超预期,已安排快速提拉生产
9月27日上午10点,小米17系列开售,价格4499元起!并全系首发第五代骁龙 8 至尊版。据悉,小米17尺寸6.3,7000mAh 电池
2025-09-28 10:22:00
齐鲁晚报·齐鲁壹点 王会广 通讯员 李杰在数字经济蓬勃发展的当下,大数据、云计算、物联网、移动互联网、人工智能以及区块链等新兴技术的广泛应用
2025-09-28 10:56:00
实时互动x高效制播:佳能携手《密室大逃脱大神版 互动直播》真人秀实现制作新范式
在直播与正片并行制作逐渐成为综艺内容生产新常态的当下,真人秀现场对影像系统的要求不断提升:既要满足直播的即时输出,又要兼顾正片制作的高质量成片
2025-09-28 11:51:00