• 我的订阅
  • 头条热搜
新扩散模型OmniGen一统图像生成,架构还高度简化、易用
...一图像生成模型 OmniGen。OmniGen 模型具有良好的简洁性和易用性,集成了多种基础图像生成任务,包括但不限于:文生图、图像编辑、角色一致性生成、基于视觉条件的生成等。OmniGen 支持基于任意多模态的文图指令完成任务,而...……更多
...频聊天等能力。米拉·穆拉蒂表示,“这是我们第一次在易用性方面真正向前迈出了一大步。”此前,大模型在各个领域的应用主要集中在文生文、文生图之上,今年初Sora的发布则推动文生视频领域进一步发展。业内分析表示,...……更多
...储、提炼、共享至智慧化和模型化生成的全过程,以简便易用的组织知识管理业务系统融合大模型能力的形式,帮助客户更有效地管理和利用知识资源,简化工作流程,显著提高服务质量和效率。该系统基于Transformer架构的大语...……更多
iPad可用AI绘画交互编辑神器火了,网友:颤抖吧PS
...显著优于基线系统,包括复杂性和效率、一致性和集成、易用性以及总体满意度4个方面。看来体验过的用户反馈都不错呢!未来工作团队还表示,这将是一个长期的工作,未来他们的目标是扩展系统功能,纳入更多的编辑类型...……更多
OpenAI发布文生视频模型Sora,奥尔特曼选取网友提示词
...用扩散模型(diffusionprobabilisticmodels)技术,基于Transformer架构,但为了解决Transformer架构核心组件注意力机制的长文本、高分辨率图像处理等问题,扩散模型用可扩展性更强的状态空间模型(SSM)主干替代了传统架构中的注意力...……更多
送技术支持送资源!联发科携手产业伙伴启动天玑AI先锋计划
...的生成速度,功能包所占用的存储空间也可以大幅减少。易用的Neuron Studio 集成开发环境,跳出传统的代码开发环境,可为开发者提供高度集成的,一站式、可视化开发环境 ,带来“所见即所得”般更易用的开发体验,让开发过...……更多
更快、更强、更可控:智谱“起舞弄清影”,视频生成卷出新高度!
...多方的细节期望。如何实现这一点?这离不开智谱全自研架构的底色——从创立之初,智谱就“自研以明志”,从数据到训练集群运维再到核心算法,都实现了全方位的自研。在视频生成领域,智谱自研的视频理解模型用于为视...……更多
Find X7正式发布!天玑9300带来极致性能
...,这需要芯片有很高的性能和能效。天玑9300搭载第7代APU架构,最高可支持330亿参数的AI大语言模型,同时还有极低的功耗。 OPPO的FindX7就是利用了天玑9300芯片的生成式AI能力,为用户带来了许多创新的功能。比如通话摘要、文...……更多
Sora这就落伍了?Meta“最强视频模型”不用DiT,用Llama大力出奇迹了
...最基础的介绍,而最最重要的信息就是,它不再是一个DiT架构的模型,也就是和现在几乎所有最知名的文生视频模型架构都不一样。用Meta视频生成团队的研究科学家Andrew Brown的话说,在这个项目里最大的发现就是:数据,算力...……更多
Meta版Sora深夜横空出世,小扎放出16秒高清大片!92页论文曝光技术细节,Llama 3架构立功
...传图像生成个性化视频。甚至Meta还放出了92页论文,模型架构、训练细节一并公开,干货满满!毫无预兆地,Meta版Sora——Movie Gen,就在刚刚抢先上线了!Meta将其称为「迄今最先进的媒体基础模型」。全新上线的大杀器Movie Gen Vi...……更多
英伟达超快stylegan回归
...024×1024高分辨率的图像,并借鉴了StyleGAN2和StyleGAN3的部分架构设计。它的整体架构如下:具体到细节上,作者们对生成器、判别器和文本对齐权衡机制进行了重新设计,用FID对样本质量进行量化评估,并采用CLIP来对文本进行对...……更多
从未见过现实世界数据,MIT在虚拟环境中训练出机器狗,能跑酷
...人出色表现的主要原因。一个简单的 transformer 控制模型架构。研究者提出了一个简单的 transformer 架构,与之前extreme parkour, 使用 transformer 大大减少了处理多模态输入时控制模型架构的复杂度,如下图 8 所示。以往四足跑酷的...……更多
1890美元,就能从头训练一个还不错的12亿参数扩散模型
...型大小)实现了更好的性能。最后,作者结合 Transformer 架构的最新进展,例如逐层缩放、使用 MoE 的稀疏 Transformer,以提高大规模训练的性能。作者提出的低成本训练 pipeline 减少了实验开销。除了使用真实图像,作者还考虑在...……更多
Meta 公司发布 Imagine Yourself AI 模型
...个文本编码器和一个可训练视觉编码器的完全并行注意力架构; 以及一个从粗到细的多阶段微调过程这些创新技术使该模型能够生成高质量、多样化的图像,同时保持强大的身份保护和文本对齐功能。Imagine Yourself 使用可训练...……更多
oppo首个端侧应用70亿参数大模型findx7系列
...星通话,首个端侧应用70亿参数大模型,首次亮相的潮汐架构等诸多前沿技术。此次宣布的全新技术组合将全面落地下一代旗舰产品FindX7系列,为2024年旗舰手机树立全新的技术标杆,并为消费者带来刷新标准的创新旗舰体验发布...……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
文 | 周鑫雨编辑 | 邓咏仪全球首家发布Sora同款底层架构的清华系模型公司,近期完成了新一轮融资。投资名单中,也出现了大模型独角兽智谱AI的身影。36氪获悉,近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融...……更多
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
...时离开视野也保持不变。与GPT模型类似,Sora使用Transformer架构。Sora建立在过去对DALL·E和GPT模型的研究之上。 它使用DALL·E 3的重述技术,该技术涉及为视觉训练数据生成高度描述性的标题。因此,该模型能够更精准遵循生成用户...……更多
英伟达推出全新文生图ai模型
...达GettyImages表示全新文生图AI模型部分基于英伟达Edify模型架构,该架构隶属于英伟达Picasso,主要为视觉设计搭建和部署生成式AI模型。英伟达Edify模型架构不仅能够带来更快的生成速度、更高的质量、更符合用户输入的提示词,...……更多
4090笔记本0.37秒直出大片!英伟达联手MIT清华祭出Sana架构,性能秒杀FLUX
...本,秒生1K质量高清图。英伟达联合MIT清华团队提出的Sana架构,得益于核心架构创新,具备了惊人的图像生成速度,而且最高能实现4k分辨率。一台16GB的4090笔记本,仅需0.37秒,直接吐出1024×1024像素图片。如此神速AI生图工具,...……更多
stability邀请用户测试文本到图像生成模型
...StabilityDiffusion3还结合了扩散型变换器(diffusiontransformer)架构,这种架构结合了深度学习和扩散模型的优势,能够将随机噪声逐步转化为有意义的图像或视频内容。 ……更多
AI出图更快、更懂你心意,高美感文生图模型修炼了哪些技术秘籍?
...》就邀请到了豆包文生图技术专家李亮、NVIDIA 解决方案架构师赵一嘉,为我们深入剖析了文生图模型出图更美、更快、更懂用户心意背后的技术链路。直播开始,李亮首先详细拆解了近期国产大模型「顶流」—— 字节跳动豆包...……更多
英特尔AI PC半年“答卷”:三大AI引擎驱动
...的生产力、安全性、稳定性、可管理性、可持续性,以及易用性等方面,都更胜一筹。锚定6大AI商用场景,全面赋能千行百业当AI浪潮以无可阻挡的趋势到来时,更能看到产业链顶端厂商的底蕴所在。在AI PC的发展当中,英特尔...……更多
Sora刷屏 标贝科技AI配音为音视频内容创作插上翅膀
... 生成式AI新里程碑据介绍,Sora采用了扩散模型和Transformer架构的结合(Diffusion Transformers, DiTs)。扩散模型通过逐渐添加噪声来破坏图像,然后学习逆向过程来恢复图像。Transformer架构则可以捕捉图像中的全局依赖关系。Sora的生成过...……更多
马斯克评OpenAI首个视频生成模型:人类认赌服输
...:“OpenAI今天宣布了Sora,它使用混合扩散和变压器模型架构生成长达1分钟的视频。他们似乎又领先了其他所有人1-2年。以下是我看过的最令人印象深刻的视频,以及生成它们的提示。”另一位X用户评论称:“gg皮克斯。”马斯...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...练框架北大对齐小组设计了高度模块化、扩展性以及简单易用的对齐训练框架,支持由文本、图片、视频、音频四大基本模态衍生出的任意模态模型对齐微调,并验证了框架对齐算法的实现正确性。模块化对齐代码实现高度可复...……更多
vivo发布自研大模型,为用户和开发者带来诸多惊喜
... 让图像生成技术触手可及,实现AI普惠随着扩散模型与AI架构的深度融合,图像生成技术迎来了指数级飞跃,其中文生图技术尤为显著。vivoAIGC图像大模型技术总监阮晓虎在论坛上介绍了vivo的文生图大模型——蓝心图像大模型Blu...……更多
手机市场深陷泥沼,厂商如何破冰?
...颈不断,手机厂商该如何破冰,进入下一个增长期?潮汐架构,一份关键答案性能不再是手机的瓶颈,前几年手机厂商都选择了新的影像赛道,通过与传统相机企业的携手同行,让高端手机市场迎来了新的增长机会。如今市面上...……更多
AIGC工具测评:生成式AI的产品表现如何
...规布局,提供沉浸式问答体验。界面设计集中在功能性和易用性,助于用户快速理解并使用各项功能。智普清言特别增加了功能入口和灵感大全,提升了操作便利性,使用户易于接触和探索更多功能。使用感受: 在处理一些专...……更多
文生图参数量升至240亿!Playground v3发布:深度融合LLM,图形设计能力超越人类
...去年以来,文本到图像生成模型取得了巨大进展,模型的架构从传统的基于UNet逐渐转变为基于Transformer的模型。Playground Research最近发布了一篇论文,详细介绍了团队最新的、基于DiT的扩散模型Playground v3(简称PGv3),将模型参数...……更多
不要小看「实而不华」的腾讯 AI
...连开了两场发布会,第一场宣布混元文生图升级采用 DiT 架构并开源,第二场,腾讯重申了以「产业实用」作为发展大模型的核心战略,并从模型侧、工具侧、应用侧三大核心层公布了一系列 AI 战略的最新进展。作为国内最大的...……更多
更多关于科技的资讯:
4999元起!京东自营iPhone 16系列年底大降价:最高立减1200元
快科技12月22日消息,京东官网显示,Apple产品京东自营旗舰店iPhone 16系列今日迎来年底大降价,叠加消费券至高立减1200元
2024-12-22 08:02:00
北京未来科学城能源谷亮2024成绩单 多个维度步入“全球前列”
本文转自:人民网-北京频道人民网北京12月22日电 (记者董兆瑞)12月20日,2024北京未来科学城能源谷科技成果交流会举办
2024-12-22 09:19:00
□南京日报/紫金山新闻记者徐宁通讯员蔡旺12月20日,2024世界智能制造大会在南京举行。南京本土企业T3出行受邀参会
2024-12-22 10:11:00
由于资金问题,Moxie机器人将停止服务
12月21日消息,Embodied公司在2022年12月推出了一款针对儿童设计的Moxie机器人,定价800美元(IT之家备注
2024-12-22 10:40:00
网红吃宵夜晕倒:昏迷8个月去世
12月21日消息,据媒体报道,广东45岁网红麦友煊因病于12月20日离世。据了解,4月13日凌晨,麦友煊吃宵夜突发意外昏迷不醒
2024-12-22 00:02:00
山灵m0s便携无损音乐播放器发布, 24日开售
12月20日消息,山灵官方今日发布M0s便携无损音乐播放器,将于12月24日开售,首发价528元。山灵M0s搭载一块1
2024-12-22 00:11:00
丰田凯美瑞光辉版上市,提供两款不同配置
12月21日消息,广汽丰田凯美瑞光辉版轿车今日正式上市,新车提供两款不同配置,官方指导价分别为 20.28万元和 21
2024-12-22 00:22:00
毛不易冬至送广州一场雪:现场歌迷被震撼到了
12月22日消息,据媒体报道,毛不易在三巡广州站现场演唱《东北民谣》时送了广州一场雪,场馆内飘起了漫天雪花。毛不易表示
2024-12-22 00:32:00
北京星际智造大直径搅拌摩擦焊贮箱成功下线
12月21日消息,北京星际智造科技有限公司官方公众号昨日(12月20日)发布博文,宣布在北京市大兴区,成功下线大直径搅拌摩擦焊贮箱
2024-12-22 00:33:00
特斯拉透露cybertruck隐藏的“彩蛋”设计
12月21日消息,特斯拉Cybertruck赛博皮卡越野车的首席工程师WesMorrill透露,Cybertruck中存在一项隐藏的“彩蛋”设计
2024-12-22 00:36:00
epic2024年假日促销将送16款神秘游戏
12月20日消息,Epic2024年假日促销期间总共将送出16款神秘游戏,《吸血鬼幸存者》现在仍可领取。12月21日0时起
2024-12-22 00:50:00
openkylin2.0sp1发布:内核稳固升级
12月20日消息,OpenAtomopenKylin(以下简称“openKylin”)2.0SP1版本今日正式发布。据介绍
2024-12-22 01:03:00
华硕rog各系列新品sku参数曝光
12月20日消息,爆料者@Huang514613发现华硕ROG多款机型已经在印度、欧洲和英国经销商处上架,他特地整理了ROG各系列新品sku的参数信息
2024-12-22 01:09:00
《双人成行》新作《双影奇境》开启预购
12月21日消息,据Steam商店页面显示,《双人成行》团队新作《SplitFiction》中文名定名为《双影奇境》,游戏现已开启预购
2024-12-22 01:12:00
AT&T计划到2029年底劝说全美国的用户告别固定电话
12月21日消息,据彭博社周五晚间报道,AT&T计划到2029年底劝说全美国的用户告别固定电话。为了实现这一目标
2024-12-22 01:20:00