• 我的订阅
  • 头条热搜
新扩散模型OmniGen一统图像生成,架构还高度简化、易用
...一图像生成模型 OmniGen。OmniGen 模型具有良好的简洁性和易用性,集成了多种基础图像生成任务,包括但不限于:文生图、图像编辑、角色一致性生成、基于视觉条件的生成等。OmniGen 支持基于任意多模态的文图指令完成任务,而...……更多
...频聊天等能力。米拉·穆拉蒂表示,“这是我们第一次在易用性方面真正向前迈出了一大步。”此前,大模型在各个领域的应用主要集中在文生文、文生图之上,今年初Sora的发布则推动文生视频领域进一步发展。业内分析表示,...……更多
iPad可用AI绘画交互编辑神器火了,网友:颤抖吧PS
...显著优于基线系统,包括复杂性和效率、一致性和集成、易用性以及总体满意度4个方面。看来体验过的用户反馈都不错呢!未来工作团队还表示,这将是一个长期的工作,未来他们的目标是扩展系统功能,纳入更多的编辑类型...……更多
...储、提炼、共享至智慧化和模型化生成的全过程,以简便易用的组织知识管理业务系统融合大模型能力的形式,帮助客户更有效地管理和利用知识资源,简化工作流程,显著提高服务质量和效率。该系统基于Transformer架构的大语...……更多
送技术支持送资源!联发科携手产业伙伴启动天玑AI先锋计划
...的生成速度,功能包所占用的存储空间也可以大幅减少。易用的Neuron Studio 集成开发环境,跳出传统的代码开发环境,可为开发者提供高度集成的,一站式、可视化开发环境 ,带来“所见即所得”般更易用的开发体验,让开发过...……更多
OpenAI发布文生视频模型Sora,奥尔特曼选取网友提示词
...用扩散模型(diffusionprobabilisticmodels)技术,基于Transformer架构,但为了解决Transformer架构核心组件注意力机制的长文本、高分辨率图像处理等问题,扩散模型用可扩展性更强的状态空间模型(SSM)主干替代了传统架构中的注意力...……更多
更快、更强、更可控:智谱“起舞弄清影”,视频生成卷出新高度!
...多方的细节期望。如何实现这一点?这离不开智谱全自研架构的底色——从创立之初,智谱就“自研以明志”,从数据到训练集群运维再到核心算法,都实现了全方位的自研。在视频生成领域,智谱自研的视频理解模型用于为视...……更多
Find X7正式发布!天玑9300带来极致性能
...,这需要芯片有很高的性能和能效。天玑9300搭载第7代APU架构,最高可支持330亿参数的AI大语言模型,同时还有极低的功耗。 OPPO的FindX7就是利用了天玑9300芯片的生成式AI能力,为用户带来了许多创新的功能。比如通话摘要、文...……更多
Sora这就落伍了?Meta“最强视频模型”不用DiT,用Llama大力出奇迹了
...最基础的介绍,而最最重要的信息就是,它不再是一个DiT架构的模型,也就是和现在几乎所有最知名的文生视频模型架构都不一样。用Meta视频生成团队的研究科学家Andrew Brown的话说,在这个项目里最大的发现就是:数据,算力...……更多
Meta版Sora深夜横空出世,小扎放出16秒高清大片!92页论文曝光技术细节,Llama 3架构立功
...传图像生成个性化视频。甚至Meta还放出了92页论文,模型架构、训练细节一并公开,干货满满!毫无预兆地,Meta版Sora——Movie Gen,就在刚刚抢先上线了!Meta将其称为「迄今最先进的媒体基础模型」。全新上线的大杀器Movie Gen Vi...……更多
英伟达超快stylegan回归
...024×1024高分辨率的图像,并借鉴了StyleGAN2和StyleGAN3的部分架构设计。它的整体架构如下:具体到细节上,作者们对生成器、判别器和文本对齐权衡机制进行了重新设计,用FID对样本质量进行量化评估,并采用CLIP来对文本进行对...……更多
从未见过现实世界数据,MIT在虚拟环境中训练出机器狗,能跑酷
...人出色表现的主要原因。一个简单的 transformer 控制模型架构。研究者提出了一个简单的 transformer 架构,与之前extreme parkour, 使用 transformer 大大减少了处理多模态输入时控制模型架构的复杂度,如下图 8 所示。以往四足跑酷的...……更多
1890美元,就能从头训练一个还不错的12亿参数扩散模型
...型大小)实现了更好的性能。最后,作者结合 Transformer 架构的最新进展,例如逐层缩放、使用 MoE 的稀疏 Transformer,以提高大规模训练的性能。作者提出的低成本训练 pipeline 减少了实验开销。除了使用真实图像,作者还考虑在...……更多
Meta 公司发布 Imagine Yourself AI 模型
...个文本编码器和一个可训练视觉编码器的完全并行注意力架构; 以及一个从粗到细的多阶段微调过程这些创新技术使该模型能够生成高质量、多样化的图像,同时保持强大的身份保护和文本对齐功能。Imagine Yourself 使用可训练...……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
文 | 周鑫雨编辑 | 邓咏仪全球首家发布Sora同款底层架构的清华系模型公司,近期完成了新一轮融资。投资名单中,也出现了大模型独角兽智谱AI的身影。36氪获悉,近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融...……更多
oppo首个端侧应用70亿参数大模型findx7系列
...星通话,首个端侧应用70亿参数大模型,首次亮相的潮汐架构等诸多前沿技术。此次宣布的全新技术组合将全面落地下一代旗舰产品FindX7系列,为2024年旗舰手机树立全新的技术标杆,并为消费者带来刷新标准的创新旗舰体验发布...……更多
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
...时离开视野也保持不变。与GPT模型类似,Sora使用Transformer架构。Sora建立在过去对DALL·E和GPT模型的研究之上。 它使用DALL·E 3的重述技术,该技术涉及为视觉训练数据生成高度描述性的标题。因此,该模型能够更精准遵循生成用户...……更多
英伟达推出全新文生图ai模型
...达GettyImages表示全新文生图AI模型部分基于英伟达Edify模型架构,该架构隶属于英伟达Picasso,主要为视觉设计搭建和部署生成式AI模型。英伟达Edify模型架构不仅能够带来更快的生成速度、更高的质量、更符合用户输入的提示词,...……更多
4090笔记本0.37秒直出大片!英伟达联手MIT清华祭出Sana架构,性能秒杀FLUX
...本,秒生1K质量高清图。英伟达联合MIT清华团队提出的Sana架构,得益于核心架构创新,具备了惊人的图像生成速度,而且最高能实现4k分辨率。一台16GB的4090笔记本,仅需0.37秒,直接吐出1024×1024像素图片。如此神速AI生图工具,...……更多
stability邀请用户测试文本到图像生成模型
...StabilityDiffusion3还结合了扩散型变换器(diffusiontransformer)架构,这种架构结合了深度学习和扩散模型的优势,能够将随机噪声逐步转化为有意义的图像或视频内容。 ……更多
AI出图更快、更懂你心意,高美感文生图模型修炼了哪些技术秘籍?
...》就邀请到了豆包文生图技术专家李亮、NVIDIA 解决方案架构师赵一嘉,为我们深入剖析了文生图模型出图更美、更快、更懂用户心意背后的技术链路。直播开始,李亮首先详细拆解了近期国产大模型「顶流」—— 字节跳动豆包...……更多
英特尔AI PC半年“答卷”:三大AI引擎驱动
...的生产力、安全性、稳定性、可管理性、可持续性,以及易用性等方面,都更胜一筹。锚定6大AI商用场景,全面赋能千行百业当AI浪潮以无可阻挡的趋势到来时,更能看到产业链顶端厂商的底蕴所在。在AI PC的发展当中,英特尔...……更多
Sora刷屏 标贝科技AI配音为音视频内容创作插上翅膀
... 生成式AI新里程碑据介绍,Sora采用了扩散模型和Transformer架构的结合(Diffusion Transformers, DiTs)。扩散模型通过逐渐添加噪声来破坏图像,然后学习逆向过程来恢复图像。Transformer架构则可以捕捉图像中的全局依赖关系。Sora的生成过...……更多
马斯克评OpenAI首个视频生成模型:人类认赌服输
...:“OpenAI今天宣布了Sora,它使用混合扩散和变压器模型架构生成长达1分钟的视频。他们似乎又领先了其他所有人1-2年。以下是我看过的最令人印象深刻的视频,以及生成它们的提示。”另一位X用户评论称:“gg皮克斯。”马斯...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...练框架北大对齐小组设计了高度模块化、扩展性以及简单易用的对齐训练框架,支持由文本、图片、视频、音频四大基本模态衍生出的任意模态模型对齐微调,并验证了框架对齐算法的实现正确性。模块化对齐代码实现高度可复...……更多
vivo发布自研大模型,为用户和开发者带来诸多惊喜
... 让图像生成技术触手可及,实现AI普惠随着扩散模型与AI架构的深度融合,图像生成技术迎来了指数级飞跃,其中文生图技术尤为显著。vivoAIGC图像大模型技术总监阮晓虎在论坛上介绍了vivo的文生图大模型——蓝心图像大模型Blu...……更多
手机市场深陷泥沼,厂商如何破冰?
...颈不断,手机厂商该如何破冰,进入下一个增长期?潮汐架构,一份关键答案性能不再是手机的瓶颈,前几年手机厂商都选择了新的影像赛道,通过与传统相机企业的携手同行,让高端手机市场迎来了新的增长机会。如今市面上...……更多
AIGC工具测评:生成式AI的产品表现如何
...规布局,提供沉浸式问答体验。界面设计集中在功能性和易用性,助于用户快速理解并使用各项功能。智普清言特别增加了功能入口和灵感大全,提升了操作便利性,使用户易于接触和探索更多功能。使用感受: 在处理一些专...……更多
文生图参数量升至240亿!Playground v3发布:深度融合LLM,图形设计能力超越人类
...去年以来,文本到图像生成模型取得了巨大进展,模型的架构从传统的基于UNet逐渐转变为基于Transformer的模型。Playground Research最近发布了一篇论文,详细介绍了团队最新的、基于DiT的扩散模型Playground v3(简称PGv3),将模型参数...……更多
不要小看「实而不华」的腾讯 AI
...连开了两场发布会,第一场宣布混元文生图升级采用 DiT 架构并开源,第二场,腾讯重申了以「产业实用」作为发展大模型的核心战略,并从模型侧、工具侧、应用侧三大核心层公布了一系列 AI 战略的最新进展。作为国内最大的...……更多
更多关于科技的资讯:
省数据和政务服务局发布公告公开征集一批河北省高质量数据集河北日报讯(记者解楚楚)9月26日,河北省数据和政务服务局发布公告
2025-10-04 08:03:00
央媒看太原9月30日,央视财经频道《经济信息联播》栏目以《双节市场备货足美食特产受青睐》为题,报道了假期到来,太原市各大综合市场提前备货
2025-10-04 07:17:00
厦门网讯(厦门日报记者 朱道衡)近日,2025鼓浪屿世遗文创作品征集活动启动。此次活动面向全国(含港澳台地区)高校、企业
2025-10-03 08:37:00
厦门网讯(厦门日报记者 楚燕 通讯员 石青青)长假期间,许多人从忙碌的工作中解脱出来,趁机好好休息。可是,如果休息方式不得当
2025-10-03 08:37:00
渤海之潮涌动着澎湃的脉搏,海河之畔镌刻着科技的印记。10年前,一颗带有“清华”基因的种子在天津这片沃土扎根;10年后,它长成一棵枝繁叶茂的参天大树
2025-10-03 09:25:00
太燃了!无人机空中展旗!高新区国庆“氛围组”已上线!
2025-10-03 23:48:00
抖音生活服务联合北京卫视发起“老板驾到”直播活动,吸引用户下单超100万元团购券
9月29日,抖音生活服务联合北京卫视发起“老板驾到”直播活动,助力北京国庆中秋消费。抖音用户在@北京卫视 直播间下单超1万次
2025-10-03 18:36:00
“FutureBOT未来引力”2025北京机器人文化节首日盛况 打造国庆科技打卡新地标
国庆首日,“FutureBOT未来引力”2025北京机器人文化节在北京昌平超极合生汇正式拉开帷幕,成为国庆假期极具科技温度的打卡地
2025-10-03 19:06:00
走到白石山巅的尽头,这家建在悬崖边的“云端咖啡厅”绝对让你惊呼。
2025-10-03 11:37:00
泰康人寿发布新品“泰康百万药无忧(庆典版)医疗保险”(以下‬简称“百万药无忧”),以广覆盖、易投保、强保障、低费率为优势
2025-10-03 09:17:00
厦门网讯(厦门日报记者 翁华鸿 通讯员 林雨新)在近日举行的2025全球数据管理峰会“数据要素分论坛暨大数据统计与人工智能技术创新管理研讨会”上
2025-10-03 08:38:00
兴趣-实践-视野:达芬奇金奖少年带来的教育启示录
摘要:2025“你是达芬奇”全球青少年科学与艺术创新赛圆满落幕,其中金奖获奖少年的亲身实践告诉我们,在AI赋能的新时代
2025-10-02 16:22:00
单日调用近1万亿次,高德助力北斗规模化民用跨入新量级
2025年10月1日,随着国庆长假首日出行高峰的到来,高德基于北斗卫星导航系统的定位数量接近1万亿次,支撑导航总里程数超90亿公里
2025-10-02 22:31:00
10月1日,从太钢获悉,今年以来,太钢不锈进料加工团队以“精准备案、高效协同”为核心,在进料铬铁镍铁资源利用方面取得突破性进展
2025-10-02 17:39:00
厦门网讯(厦门日报记者 林露虹)记者昨日从中国移动咪咕公司获悉,该公司打造的“鼓浪屿AI伴游”服务已正式上线。市民和游客只需打开“鼓浪屿元宇宙”微信小程序
2025-10-02 08:57:00