• 我的订阅
  • 头条热搜
比Stable Diffusion便宜118倍!1890美元训出11.6亿参数高质量文生图模型
【新智元导读】近日,来自加州大学尔湾分校等机构的研究人员,利用延迟掩蔽、MoE、分层扩展等策略,将扩散模型的训练成本降到了1890美元。训练一个扩散模型要多少钱?之前最便宜的方法(Wuerstchen)用了28400美元,而像Stab...……更多
Sora这就落伍了?Meta“最强视频模型”不用DiT,用Llama大力出奇迹了
...频生成: Movie Gen 不仅可以根据视频内容和文本指令生成高质量的各类音效和音乐,而且还可以做到与视频内容更高度的匹配与同步。这些音频最长可达 45 秒,而且Meta还表示,它们的音频模型可以生成任意长度视频的连贯音频...……更多
超越扩散模型!自回归新范式仅需2.9秒就生成高质量图像
...小满等机构提出通用文生图模型STAR。仅需2.9秒就可生成高质量图像,超越当前一众包括SDXL在内扩散模型的性能。此外在生成图像真实度、图文一致性和人类偏好上均表现优秀。来看看具体是如何做到的?自回归通用文生图模型S...……更多
腾讯开源最大MoE大语言模型!3D大模型同时支持文/图生成,晒混元模型及应用全家桶
...、数学等9大维度,混元Large实现全面领先。混元Large包含高质量合成数据、专家特定的学习率缩放、KV缓存压缩、长上下文处理能力、广泛的基础测试等主要技术创新,具体可参见技术报告。腾讯混元3D生成大模型则是业界首个同...……更多
AI出图更快、更懂你心意,高美感文生图模型修炼了哪些技术秘籍?
...量图文数据做精细化筛选和过滤,最终入库了千亿量级的高质量图像。此外,团队还专门训练了一个多模态大语言模型进行 recapiton 任务。这个模型将更加全面、客观地描述图片中图像的物理关系。有了高质量高细节的图文对数...……更多
开源文生图AI重磅选手上新:Stable Diffusion 3.5最强全家桶登场
...的精简版,在出色地遵循提示词上,仅需 4 个步骤内生成高质量图像,且生成速度明显快于 Large。 Stable Diffusion 3.5 Medium(将于 10 月 29 日发布):该模型拥有 25 亿个参数,采用改进的 MMDiT-X 架构和训练方法,旨在能够在消费级...……更多
OpenAI又放大招,一文看懂Sora对AI领域的影响
...图像视频模型。此外,Sora在训练时还借助了DALL·E3生成的高质量文本描述,在推理时借助了GPT对用户输入进行扩展,可谓“站在巨人肩膀上”更进一步。三、Sora对AI应用和算力需求带来哪些影响?对于应用而言,Sora生成的视频已...……更多
文生图参数量升至240亿!Playground v3发布:深度融合LLM,图形设计能力超越人类
【新智元导读】Playground Research推出了新一代文本到图像模型PGv3,具备240亿参数量,采用深度融合的大型语言模型,实现了在图形设计和遵循文本提示指令上甚至超越了人类设计师,同时支持精确的RGB颜色控制和多语言识别。自...……更多
腾讯混元大模型批量上新:10秒生成AI图像,超过180个腾讯业务接入 | 最前线
...载的“灵感”模块,已经能生成相当合理、逼真的图像。文生图是AIGC领域的核心技术之一,也是体现通用大模型能力的试金石,对模型算法、训练平台、算力设施都有较高的要求。在用户侧,这又是一个和广大用户联系紧密的...……更多
AI潮起 共筑数智之基
...台已汇聚并开放超30个“自有+开源+生态”大模型、超20个高质量数据集,后续将逐步开放百个大模型、百个数据集和百个AI应用,带动我国大模型产业生态融通共赢。开放三大基地打造全链条产业生态中国移动宣布开放大模型训...……更多
AIGC落地应用:腾讯云如何助力产业智能化升级?
...向更复杂的动作、情感交互等方向探索。展望未来,结合高质量的交互能力将是未来数字人发展的重要方向。 腾讯混元大模型赋能AIGC应用落地 推进产业智能化升级 腾讯云大模型产品专家屈蕾 腾讯混元大模型历经迭代日趋...……更多
更快、更强、更可控:智谱“起舞弄清影”,视频生成卷出新高度!
...为视频数据生成高度吻合的文本描述,进而构建了海量的高质量视频文本对,使得训练出的模型指令遵循度高。比如,输入指令“猴子打工”,可以看到智谱对“猴子”主体和“打工”行为理解都十分到位,生成了让打工人心酸...……更多
AI生成式视频往何处去 “灵动 AI”亮相网易未来大会
...图生视频对创意生产力带来的解放,更期待AI在3D领域的高质量生成能力”。 作为AI领域的知识博主和模型训练师,娜乌斯嘉认为,AI在视频生成领域归结为四类场景:原视频风格转化、瞬息全宇宙、图生视频、场景转换视频。...……更多
快手「可灵」爆火:海外AI圈巨震,中国版Sora一号难求
...,显著提升视频生成模型的文本指令响应能力。模型架构高质量的标注数据准备完毕后,可灵大模型又是如何获得模拟物理世界特性与概念组合的能力呢?在整体架构设计上,可灵采用了目前火热的 Diffusion Transformer (DiT) 。传统...……更多
智谱AI杀入视频生成:「清影」上线,时长6秒,免费不限量
...视频数据生成详细的、贴合内容的描述,进而构建海量的高质量视频文本对,使得训练出的模型指令遵循度高。最后值得一提的是,智谱 AI 自研了一个将文本、时间、空间融合起来的 transformer 架构,该架构没有采用传统 cross att...……更多
大模型如何链接产业?“联通元景”重磅发布!
...AI关键技术研发到实际产品落地转化,切实助力实体经济高质量发展。 人工智能为中国联通带来了哪些智能化变革?中国联通以自智网络理念为牵引,打造网络智慧运营平台赋能网络运营方方面面。在网络监控、故障处理、调...……更多
让一台普通PC欢快地跑起AIGC:Intel做到了!
...用ArcA730M这样的笔记本独立显卡,就可以在几秒钟内完成高质量的文生图、图生图、图像风格转换等,从而极大地节省工作量,将更多精力放在创意上。这足以证明,一台普通的笔记本在端侧运行大模型,使用普通独显甚至集显...……更多
Sora为何没能诞生在中国?
...,此前在图片生成领域已展现出强大能力,能生成逼真且高质量的图片。Transformer是GPT这类大语言模型的基础架构。ChatGPT能对答如流,便是因为这一架构能通过预测下一个token(文本的最小单元)出现的概率,更好捕捉上下文信...……更多
最强开源文生图模型一夜易主!SD原班人马打造,要发SOTA视频生成模型
...Stable Diffusion的创始团队成立,该团队此前的工作还包括高质量图像生成模型VQGAN、视频生成模型Stable Video Diffusion等。Stable Diffusion最初的5位作者中,4位曾加入Stability AI并持续开发SD后续版本的成员,包括Robin Ro……更多
你的下一个美少女偶像何必是真人 娱乐圈AIGC要内测了
...训练数据,包括日韩等国外歌手和舞者的音舞数据。基于高质量数据和大算力模型训练,PARO已可实现文生舞、文生音、音生舞功能。具体而言,在PARO的文生动作功能中,用户输入简单的文字描述,即可快速生成高质量动态内容...……更多
快手发布大模型产品“可图” 20多种创新AI图像玩法限免上线
...只鹦鹉,极简,波西米亚风格”等描述,可图同样生成了高质量的精美AI图片。(根据文字描述生成的产品) 值得注意的是,“可图”大大降低了AI图像生成的使用门槛,提供了更好的使用体验:与同类产品需多张照片和较长时间...……更多
...的计算量消耗。这种计算量的增加,使得模型能够获得更高质量的回答。然而,这并不意味着推理和训练的边界正在变得模糊,而是推理阶段的计算需求正在增加。清程极智认为,推理和训练需要差异化的系统设计和实现方式。...……更多
阿里巴巴推出atomovideo高保真图生视频框架
...真图生视频(I2V,ImagetoVideo)框架,旨在从静态图像生成高质量的视频内容,并与各种文生图(T2I)模型兼容。▲图源AtomoVIdeo团队论文IT之家总结AtomoVideo特性如下:高保真度:生成的视频与输入图像在细节与风格上保持高度一...……更多
谢赛宁新作:表征学习有多重要?一个操作刷新SOTA,DiT训练速度暴涨18倍
...大规模扩散模型的一个主要瓶颈,就在于无法有效学习到高质量的内部表示。如果能够结合高质量的外部视觉表示,而不是仅仅依靠扩散模型来独立学习,就可以使训练过程变得更容易。为了实现这一点,论文基于经典的扩散Tra...……更多
Adobe推视频生成大杀器!最长生成5秒视频,一键重拍成为现实,已开放公测
...进行了重要更新。Premiere Pro新增了三个主要功能,分别是文生视频、图生视频和生成扩展(Generative Extend)。通过文生视频功能,用户可模拟调整摄像机角度、运动和缩放等参数,进一步细化视频;通过图生视频功能,用户可在...……更多
智谱AI发布基座大模型GLM-4,发起大模型开源基金
...源项目,为优秀开源开发者提供1000亿免费API tokens。GLM-4文生图和多模态理解得到增强。1月16日,在智谱AI(即北京智谱华章科技有限公司)首届技术开放日上,智谱AI发布新一代基座大模型GLM-4,支持128K的上下文窗口长度,单次...……更多
...一而足,主要难点包括算力成本高企、生态建设难度大、高质量的数据短缺等。自6月底发布之初,小i机器人的华藏大模型就直击痛点,提出了“可控、可定制、可交付”的特点,并特别介绍其大模型产品的最低算力成本为10万...……更多
APUS带你穿越千载重回故里,看AI眼中的《轩辕大帝》
...,践行加速AI落地应用的社会责任,持续推动AI产业健康高质量发展。 ……更多
一毛钱写两本红楼梦,智谱AI再降价,已服务30万企业用户
...如《红楼梦》写两遍。而在企业V3版的价格下,用CogView-3文生图模型生成一张图只要6分钱。智谱AI也公布了过去一年的产品、商业化进展:当前,智谱AI的开放平台已服务30万企业级客户,日均调用量达400亿token,过去6个月API每日...……更多
AI 3D生成天花板再拉升!清华团队炼成3D Scaling Law
...模型头部玩家VAST更新了旗下的大模型Tripo,是基于千万级高质量原生自有数据库训出来的那种超强版本。而3D生成新工具的玩法也更进一步,文字、单图、多图都能作为输入。至于几何精细度和图片还原度等方面的效果嘛,先小...……更多
更多关于科技的资讯:
进军核药赛道,广药集团谋求“聚变”!
当承载着“国之重器”的核导弹方阵在阅兵式上巍然驶过,中国的科技实力与国防实力以庄严姿态展现于世界。在震撼之外,“核”所蕴含的巨大能量
2025-09-29 13:11:00
中新经纬9月29日电 题:备战“十一”消费高峰,平台用AI重塑购物逻辑作者 盘和林 工信部信息通信经济专家委员会委员“十一”长假将至
2025-09-29 13:13:00
聊城智汇 链接全球丨年销海外近8000万,泊西集团凭收纳盒从乡镇驶向全球
鲁网9月29日讯在山东聊城市茌平区洪官屯镇的土地上,山东泊西实业集团有限公司正以蓬勃之姿,书写着海外出口的精彩篇章。走进泊西集团的生产车间
2025-09-29 12:07:00
京东折扣超市全国第六店落户固安
河北新闻网讯(李寒梦、陈放)9月25日,京东折扣超市全国第六家门店在固安尚品爱购城市广场正式开业,进一步点燃居民消费热情
2025-09-29 09:53:00
从榨菜月饼到榨菜咖啡,乌江榨菜以创新打破品类边界
近年来,伴随区域化、特色化产品的迅速增长,各大品牌在深耕主业的同时也开始积极探索新赛道、新领域。乌江榨菜作为涪陵榨菜集团旗下的核心品牌
2025-09-29 08:03:00
华北首家!多美卡品牌专卖店登陆北京玩具反斗城
[北京] – 继中国首家多美卡品牌专卖店入驻玩具反斗城上海南丰城店并成功引爆小车收藏热潮后,玩具反斗城(Toys“R”Us)与多美(TAKARA TOMY)的战略合作再结硕果
2025-09-29 07:33:00
南报网讯(记者张甜甜)10月2日至3日,由南京报业传媒集团旗下南报优选供应链公司主办的首届紫金山国潮漫文化嘉年华,将在南京国际展览中心举办
2025-09-29 07:42:00
9月26日,购在中国(山西站)暨中石化易捷第八届易享节在我市启动,诸多三晋名特优产品将陆续入驻中石化易捷,走向全国。今后
2025-09-28 08:20:00
刚刚闭幕的长春航空展上,“净月号”成瞩目焦点
9月23日,长春航空展圆满闭幕,“净月号”凭借其震撼的实体造型与深厚的文化内涵,成为展会瞩目的焦点。这艘承载中式太空梦想的“星舰”
2025-09-28 10:07:00
为更好的服务广大客户,富德生命人寿安平支公司积极组织员工开展《产品健康增值服务》培训。培训中,讲师细致讲解公司产品健康增值服务
2025-09-28 10:12:00
河北新闻网讯(王丽英)9月24日至25日,宁晋县晶龙集团举行人力资源专业培训,内训师靳桂峰、王素峰和张晓宁分别围绕工伤保险及识人辨人
2025-09-28 10:18:00
美团Keeta上线阿联酋!40天连开3国,国际化全速推进
当地时间9月27日上午11点,美团旗下国际外卖品牌Keeta正式在阿联酋迪拜启动运营,这是Keeta继8月上线卡塔尔、9月上线科威特后
2025-09-28 10:22:00
小米17系列9月27日开售,卢伟冰称ProMax需求远超预期,已安排快速提拉生产
9月27日上午10点,小米17系列开售,价格4499元起!并全系首发第五代骁龙 8 至尊版。据悉,小米17尺寸6.3,7000mAh 电池
2025-09-28 10:22:00
齐鲁晚报·齐鲁壹点 王会广 通讯员 李杰在数字经济蓬勃发展的当下,大数据、云计算、物联网、移动互联网、人工智能以及区块链等新兴技术的广泛应用
2025-09-28 10:56:00
实时互动x高效制播:佳能携手《密室大逃脱大神版 互动直播》真人秀实现制作新范式
在直播与正片并行制作逐渐成为综艺内容生产新常态的当下,真人秀现场对影像系统的要求不断提升:既要满足直播的即时输出,又要兼顾正片制作的高质量成片
2025-09-28 11:51:00