• 我的订阅
  • 头条热搜
比Stable Diffusion便宜118倍!1890美元训出11.6亿参数高质量文生图模型
【新智元导读】近日,来自加州大学尔湾分校等机构的研究人员,利用延迟掩蔽、MoE、分层扩展等策略,将扩散模型的训练成本降到了1890美元。训练一个扩散模型要多少钱?之前最便宜的方法(Wuerstchen)用了28400美元,而像Stab...……更多
Sora这就落伍了?Meta“最强视频模型”不用DiT,用Llama大力出奇迹了
...频生成: Movie Gen 不仅可以根据视频内容和文本指令生成高质量的各类音效和音乐,而且还可以做到与视频内容更高度的匹配与同步。这些音频最长可达 45 秒,而且Meta还表示,它们的音频模型可以生成任意长度视频的连贯音频...……更多
超越扩散模型!自回归新范式仅需2.9秒就生成高质量图像
...小满等机构提出通用文生图模型STAR。仅需2.9秒就可生成高质量图像,超越当前一众包括SDXL在内扩散模型的性能。此外在生成图像真实度、图文一致性和人类偏好上均表现优秀。来看看具体是如何做到的?自回归通用文生图模型S...……更多
腾讯开源最大MoE大语言模型!3D大模型同时支持文/图生成,晒混元模型及应用全家桶
...、数学等9大维度,混元Large实现全面领先。混元Large包含高质量合成数据、专家特定的学习率缩放、KV缓存压缩、长上下文处理能力、广泛的基础测试等主要技术创新,具体可参见技术报告。腾讯混元3D生成大模型则是业界首个同...……更多
AI出图更快、更懂你心意,高美感文生图模型修炼了哪些技术秘籍?
...量图文数据做精细化筛选和过滤,最终入库了千亿量级的高质量图像。此外,团队还专门训练了一个多模态大语言模型进行 recapiton 任务。这个模型将更加全面、客观地描述图片中图像的物理关系。有了高质量高细节的图文对数...……更多
开源文生图AI重磅选手上新:Stable Diffusion 3.5最强全家桶登场
...的精简版,在出色地遵循提示词上,仅需 4 个步骤内生成高质量图像,且生成速度明显快于 Large。 Stable Diffusion 3.5 Medium(将于 10 月 29 日发布):该模型拥有 25 亿个参数,采用改进的 MMDiT-X 架构和训练方法,旨在能够在消费级...……更多
OpenAI又放大招,一文看懂Sora对AI领域的影响
...图像视频模型。此外,Sora在训练时还借助了DALL·E3生成的高质量文本描述,在推理时借助了GPT对用户输入进行扩展,可谓“站在巨人肩膀上”更进一步。三、Sora对AI应用和算力需求带来哪些影响?对于应用而言,Sora生成的视频已...……更多
文生图参数量升至240亿!Playground v3发布:深度融合LLM,图形设计能力超越人类
【新智元导读】Playground Research推出了新一代文本到图像模型PGv3,具备240亿参数量,采用深度融合的大型语言模型,实现了在图形设计和遵循文本提示指令上甚至超越了人类设计师,同时支持精确的RGB颜色控制和多语言识别。自...……更多
AI潮起 共筑数智之基
...台已汇聚并开放超30个“自有+开源+生态”大模型、超20个高质量数据集,后续将逐步开放百个大模型、百个数据集和百个AI应用,带动我国大模型产业生态融通共赢。开放三大基地打造全链条产业生态中国移动宣布开放大模型训...……更多
腾讯混元大模型批量上新:10秒生成AI图像,超过180个腾讯业务接入 | 最前线
...载的“灵感”模块,已经能生成相当合理、逼真的图像。文生图是AIGC领域的核心技术之一,也是体现通用大模型能力的试金石,对模型算法、训练平台、算力设施都有较高的要求。在用户侧,这又是一个和广大用户联系紧密的...……更多
AIGC落地应用:腾讯云如何助力产业智能化升级?
...向更复杂的动作、情感交互等方向探索。展望未来,结合高质量的交互能力将是未来数字人发展的重要方向。 腾讯混元大模型赋能AIGC应用落地 推进产业智能化升级 腾讯云大模型产品专家屈蕾 腾讯混元大模型历经迭代日趋...……更多
更快、更强、更可控:智谱“起舞弄清影”,视频生成卷出新高度!
...为视频数据生成高度吻合的文本描述,进而构建了海量的高质量视频文本对,使得训练出的模型指令遵循度高。比如,输入指令“猴子打工”,可以看到智谱对“猴子”主体和“打工”行为理解都十分到位,生成了让打工人心酸...……更多
AI生成式视频往何处去 “灵动 AI”亮相网易未来大会
...图生视频对创意生产力带来的解放,更期待AI在3D领域的高质量生成能力”。 作为AI领域的知识博主和模型训练师,娜乌斯嘉认为,AI在视频生成领域归结为四类场景:原视频风格转化、瞬息全宇宙、图生视频、场景转换视频。...……更多
快手「可灵」爆火:海外AI圈巨震,中国版Sora一号难求
...,显著提升视频生成模型的文本指令响应能力。模型架构高质量的标注数据准备完毕后,可灵大模型又是如何获得模拟物理世界特性与概念组合的能力呢?在整体架构设计上,可灵采用了目前火热的 Diffusion Transformer (DiT) 。传统...……更多
智谱AI杀入视频生成:「清影」上线,时长6秒,免费不限量
...视频数据生成详细的、贴合内容的描述,进而构建海量的高质量视频文本对,使得训练出的模型指令遵循度高。最后值得一提的是,智谱 AI 自研了一个将文本、时间、空间融合起来的 transformer 架构,该架构没有采用传统 cross att...……更多
大模型如何链接产业?“联通元景”重磅发布!
...AI关键技术研发到实际产品落地转化,切实助力实体经济高质量发展。 人工智能为中国联通带来了哪些智能化变革?中国联通以自智网络理念为牵引,打造网络智慧运营平台赋能网络运营方方面面。在网络监控、故障处理、调...……更多
Sora为何没能诞生在中国?
...,此前在图片生成领域已展现出强大能力,能生成逼真且高质量的图片。Transformer是GPT这类大语言模型的基础架构。ChatGPT能对答如流,便是因为这一架构能通过预测下一个token(文本的最小单元)出现的概率,更好捕捉上下文信...……更多
让一台普通PC欢快地跑起AIGC:Intel做到了!
...用ArcA730M这样的笔记本独立显卡,就可以在几秒钟内完成高质量的文生图、图生图、图像风格转换等,从而极大地节省工作量,将更多精力放在创意上。这足以证明,一台普通的笔记本在端侧运行大模型,使用普通独显甚至集显...……更多
最强开源文生图模型一夜易主!SD原班人马打造,要发SOTA视频生成模型
...Stable Diffusion的创始团队成立,该团队此前的工作还包括高质量图像生成模型VQGAN、视频生成模型Stable Video Diffusion等。Stable Diffusion最初的5位作者中,4位曾加入Stability AI并持续开发SD后续版本的成员,包括Robin Ro……更多
你的下一个美少女偶像何必是真人 娱乐圈AIGC要内测了
...训练数据,包括日韩等国外歌手和舞者的音舞数据。基于高质量数据和大算力模型训练,PARO已可实现文生舞、文生音、音生舞功能。具体而言,在PARO的文生动作功能中,用户输入简单的文字描述,即可快速生成高质量动态内容...……更多
快手发布大模型产品“可图” 20多种创新AI图像玩法限免上线
...只鹦鹉,极简,波西米亚风格”等描述,可图同样生成了高质量的精美AI图片。(根据文字描述生成的产品) 值得注意的是,“可图”大大降低了AI图像生成的使用门槛,提供了更好的使用体验:与同类产品需多张照片和较长时间...……更多
...的计算量消耗。这种计算量的增加,使得模型能够获得更高质量的回答。然而,这并不意味着推理和训练的边界正在变得模糊,而是推理阶段的计算需求正在增加。清程极智认为,推理和训练需要差异化的系统设计和实现方式。...……更多
阿里巴巴推出atomovideo高保真图生视频框架
...真图生视频(I2V,ImagetoVideo)框架,旨在从静态图像生成高质量的视频内容,并与各种文生图(T2I)模型兼容。▲图源AtomoVIdeo团队论文IT之家总结AtomoVideo特性如下:高保真度:生成的视频与输入图像在细节与风格上保持高度一...……更多
谢赛宁新作:表征学习有多重要?一个操作刷新SOTA,DiT训练速度暴涨18倍
...大规模扩散模型的一个主要瓶颈,就在于无法有效学习到高质量的内部表示。如果能够结合高质量的外部视觉表示,而不是仅仅依靠扩散模型来独立学习,就可以使训练过程变得更容易。为了实现这一点,论文基于经典的扩散Tra...……更多
Adobe推视频生成大杀器!最长生成5秒视频,一键重拍成为现实,已开放公测
...进行了重要更新。Premiere Pro新增了三个主要功能,分别是文生视频、图生视频和生成扩展(Generative Extend)。通过文生视频功能,用户可模拟调整摄像机角度、运动和缩放等参数,进一步细化视频;通过图生视频功能,用户可在...……更多
智谱AI发布基座大模型GLM-4,发起大模型开源基金
...源项目,为优秀开源开发者提供1000亿免费API tokens。GLM-4文生图和多模态理解得到增强。1月16日,在智谱AI(即北京智谱华章科技有限公司)首届技术开放日上,智谱AI发布新一代基座大模型GLM-4,支持128K的上下文窗口长度,单次...……更多
...一而足,主要难点包括算力成本高企、生态建设难度大、高质量的数据短缺等。自6月底发布之初,小i机器人的华藏大模型就直击痛点,提出了“可控、可定制、可交付”的特点,并特别介绍其大模型产品的最低算力成本为10万...……更多
APUS带你穿越千载重回故里,看AI眼中的《轩辕大帝》
...,践行加速AI落地应用的社会责任,持续推动AI产业健康高质量发展。 ……更多
一毛钱写两本红楼梦,智谱AI再降价,已服务30万企业用户
...如《红楼梦》写两遍。而在企业V3版的价格下,用CogView-3文生图模型生成一张图只要6分钱。智谱AI也公布了过去一年的产品、商业化进展:当前,智谱AI的开放平台已服务30万企业级客户,日均调用量达400亿token,过去6个月API每日...……更多
智谱AI发布视频生成大模型,B站参与研发,亦庄提供算力|甲子光年
...到视频生成模型CogVideo,采用了多帧率分层训练策略生成高质量的视频片段,提出一种基于递归插值的方法,逐步生成与每个子描述相对应的视频片段,并将这些视频片段逐层插值得到最终的视频片段。这个工作引起脸书、谷歌...……更多
更多关于科技的资讯:
美国闹鸡蛋荒:一颗鸡蛋5块多还要涨价 真吃不起了
1月18日消息,据国外媒体报道称,缺货、限购、高价……美国当下的“蛋荒”,让不少美国家庭“心慌”。出现“蛋荒”,主要是因为美国当下的禽流感疫情形势严峻
2025-01-18 14:27:00
B站大会员年卡大降价:补贴10元98即可入手 折合一月8块钱
B站大会员年卡原价233元,年货节大促直降至108元。即日起~1月23日可叠加10元平台补贴,仅需98元即可入手,相当于一月仅需8块钱
2025-01-18 12:57:00
只有5.5mm!苹果最薄iPhone 17 Air将取代Plus机型
快科技1月18日消息,多方爆料已经确定,苹果将在今年发布全新机型——iPhone 17 Air。这是一款主打轻薄机身的手机
2025-01-18 13:57:00
“码上有金喜”焕新传统年俗,今年春节泸州老窖这样玩
临近春节,泸州老窖以回馈消费者为目标,特别推出的“扫码有‘金’喜”活动正在火热进行中,邀请消费者开盖品饮佳酿的同时,以实打实的品质好礼回馈广大C端人群
2025-01-18 09:54:00
2天倒计时!手机数码国补下周一开始:一文看懂怎么买最划算
快科技1月18日消息,下周一(1月20日)开始,2025年国补中的手机、平板电脑和智能手表/手环产品的补贴将正式开启。这次国补政策有三个种重要数字
2025-01-18 09:57:00
冷暖+热水!中广欧特斯为甘肃酒店打造舒适住宿体验
酒店作为服务类行业,提供高质量的服务是其市场竞争之本。冷暖与热水作为酒店向宾客提供的基础服务,能在不同维度反映出一家酒店的品质
2025-01-18 10:00:00
1月17日晚间,完美世界发布2024年度业绩预告。公告显示,公司去年全年实现营业收入55亿元至56亿元,归母净利润亏损11亿元至13亿元
2025-01-18 10:25:00
新一代续航灭霸!真我GT7入网:6500mAh超大电池+骁龙8至尊版平台
快科技1月18日消息,近日,一款型号为RMX5090的真我新机通过了3C认证,据推测,该机可能是即将发布的真我GT7。根据入网信息来看
2025-01-18 10:27:00
海通国际研报提出2025五大猜想:小米将收购蔚来汽车
快科技1月18日消息,据报道,海通国际证券公司近日发布研究报告,提出2025年五大猜想。其中提到,海通国际认为小米将收购蔚来
2025-01-18 10:27:00
三星快充史诗级升级!S26系列有望支持65W快充、50W无线充
快科技1月18日消息,据外媒报道,三星正在研发65W有线快充方案,并计划在Galaxy S26系列手机上首次部署这一技术
2025-01-18 10:57:00
春节后见!华为Pocket 3至少有两种不同版本
快科技1月18日消息,根据数码爆料博主@智慧皮卡丘透露,华为第三代小折叠Pocket 3系列将会推出2款不同版本的机型
2025-01-18 11:27:00
美国对中国封锁16nm制程:英伟达回应不会影响公司在华业务或产品销售
快科技1月18日消息,本周美国商务部工业和安全局(BIS)发布了两项规则:一项是更新先进计算半导体的出口管制,另一项是将中国(14家)和新加坡(2家)的其他实体列入实体名单
2025-01-18 11:27:00
曝航旅纵横被国航暂停电子登机牌乘机:需换取纸质登机牌
快科技1月18日消息,据报道,近日,有多名旅客在社交媒体反馈,乘坐国航CA4107CA4115等成都双流飞往北京首都的航班时
2025-01-18 11:27:00
索未来科技集团:跨行业融合加速智能化发展
在人工智能技术日新月异的今天,行业间的界限日趋模糊,跨界融合已经成为推动产业升级的重要动力。作为人工智能领域的创新企业
2025-01-18 11:42:00
849元!机械师推出MJQ27F180L显示器:2K 180Hz屏 内置游戏辅助功能
快科技1月18日消息,机械师推出新款显示器MJQ27F180L,以亲民价格849元为广大消费者带来高品质视觉体验。机械师MJQ27F180L显示器采用27英寸Fast IPS屏幕
2025-01-18 11:57:00