• 我的订阅
  • 头条热搜
比Stable Diffusion便宜118倍!1890美元训出11.6亿参数高质量文生图模型
【新智元导读】近日,来自加州大学尔湾分校等机构的研究人员,利用延迟掩蔽、MoE、分层扩展等策略,将扩散模型的训练成本降到了1890美元。训练一个扩散模型要多少钱?之前最便宜的方法(Wuerstchen)用了28400美元,而像Stab...……更多
Sora这就落伍了?Meta“最强视频模型”不用DiT,用Llama大力出奇迹了
...频生成: Movie Gen 不仅可以根据视频内容和文本指令生成高质量的各类音效和音乐,而且还可以做到与视频内容更高度的匹配与同步。这些音频最长可达 45 秒,而且Meta还表示,它们的音频模型可以生成任意长度视频的连贯音频...……更多
超越扩散模型!自回归新范式仅需2.9秒就生成高质量图像
...小满等机构提出通用文生图模型STAR。仅需2.9秒就可生成高质量图像,超越当前一众包括SDXL在内扩散模型的性能。此外在生成图像真实度、图文一致性和人类偏好上均表现优秀。来看看具体是如何做到的?自回归通用文生图模型S...……更多
腾讯开源最大MoE大语言模型!3D大模型同时支持文/图生成,晒混元模型及应用全家桶
...、数学等9大维度,混元Large实现全面领先。混元Large包含高质量合成数据、专家特定的学习率缩放、KV缓存压缩、长上下文处理能力、广泛的基础测试等主要技术创新,具体可参见技术报告。腾讯混元3D生成大模型则是业界首个同...……更多
AI出图更快、更懂你心意,高美感文生图模型修炼了哪些技术秘籍?
...量图文数据做精细化筛选和过滤,最终入库了千亿量级的高质量图像。此外,团队还专门训练了一个多模态大语言模型进行 recapiton 任务。这个模型将更加全面、客观地描述图片中图像的物理关系。有了高质量高细节的图文对数...……更多
开源文生图AI重磅选手上新:Stable Diffusion 3.5最强全家桶登场
...的精简版,在出色地遵循提示词上,仅需 4 个步骤内生成高质量图像,且生成速度明显快于 Large。 Stable Diffusion 3.5 Medium(将于 10 月 29 日发布):该模型拥有 25 亿个参数,采用改进的 MMDiT-X 架构和训练方法,旨在能够在消费级...……更多
OpenAI又放大招,一文看懂Sora对AI领域的影响
...图像视频模型。此外,Sora在训练时还借助了DALL·E3生成的高质量文本描述,在推理时借助了GPT对用户输入进行扩展,可谓“站在巨人肩膀上”更进一步。三、Sora对AI应用和算力需求带来哪些影响?对于应用而言,Sora生成的视频已...……更多
文生图参数量升至240亿!Playground v3发布:深度融合LLM,图形设计能力超越人类
【新智元导读】Playground Research推出了新一代文本到图像模型PGv3,具备240亿参数量,采用深度融合的大型语言模型,实现了在图形设计和遵循文本提示指令上甚至超越了人类设计师,同时支持精确的RGB颜色控制和多语言识别。自...……更多
腾讯混元大模型批量上新:10秒生成AI图像,超过180个腾讯业务接入 | 最前线
...载的“灵感”模块,已经能生成相当合理、逼真的图像。文生图是AIGC领域的核心技术之一,也是体现通用大模型能力的试金石,对模型算法、训练平台、算力设施都有较高的要求。在用户侧,这又是一个和广大用户联系紧密的...……更多
AI潮起 共筑数智之基
...台已汇聚并开放超30个“自有+开源+生态”大模型、超20个高质量数据集,后续将逐步开放百个大模型、百个数据集和百个AI应用,带动我国大模型产业生态融通共赢。开放三大基地打造全链条产业生态中国移动宣布开放大模型训...……更多
AIGC落地应用:腾讯云如何助力产业智能化升级?
...向更复杂的动作、情感交互等方向探索。展望未来,结合高质量的交互能力将是未来数字人发展的重要方向。 腾讯混元大模型赋能AIGC应用落地 推进产业智能化升级 腾讯云大模型产品专家屈蕾 腾讯混元大模型历经迭代日趋...……更多
更快、更强、更可控:智谱“起舞弄清影”,视频生成卷出新高度!
...为视频数据生成高度吻合的文本描述,进而构建了海量的高质量视频文本对,使得训练出的模型指令遵循度高。比如,输入指令“猴子打工”,可以看到智谱对“猴子”主体和“打工”行为理解都十分到位,生成了让打工人心酸...……更多
AI生成式视频往何处去 “灵动 AI”亮相网易未来大会
...图生视频对创意生产力带来的解放,更期待AI在3D领域的高质量生成能力”。 作为AI领域的知识博主和模型训练师,娜乌斯嘉认为,AI在视频生成领域归结为四类场景:原视频风格转化、瞬息全宇宙、图生视频、场景转换视频。...……更多
快手「可灵」爆火:海外AI圈巨震,中国版Sora一号难求
...,显著提升视频生成模型的文本指令响应能力。模型架构高质量的标注数据准备完毕后,可灵大模型又是如何获得模拟物理世界特性与概念组合的能力呢?在整体架构设计上,可灵采用了目前火热的 Diffusion Transformer (DiT) 。传统...……更多
智谱AI杀入视频生成:「清影」上线,时长6秒,免费不限量
...视频数据生成详细的、贴合内容的描述,进而构建海量的高质量视频文本对,使得训练出的模型指令遵循度高。最后值得一提的是,智谱 AI 自研了一个将文本、时间、空间融合起来的 transformer 架构,该架构没有采用传统 cross att...……更多
大模型如何链接产业?“联通元景”重磅发布!
...AI关键技术研发到实际产品落地转化,切实助力实体经济高质量发展。 人工智能为中国联通带来了哪些智能化变革?中国联通以自智网络理念为牵引,打造网络智慧运营平台赋能网络运营方方面面。在网络监控、故障处理、调...……更多
让一台普通PC欢快地跑起AIGC:Intel做到了!
...用ArcA730M这样的笔记本独立显卡,就可以在几秒钟内完成高质量的文生图、图生图、图像风格转换等,从而极大地节省工作量,将更多精力放在创意上。这足以证明,一台普通的笔记本在端侧运行大模型,使用普通独显甚至集显...……更多
Sora为何没能诞生在中国?
...,此前在图片生成领域已展现出强大能力,能生成逼真且高质量的图片。Transformer是GPT这类大语言模型的基础架构。ChatGPT能对答如流,便是因为这一架构能通过预测下一个token(文本的最小单元)出现的概率,更好捕捉上下文信...……更多
最强开源文生图模型一夜易主!SD原班人马打造,要发SOTA视频生成模型
...Stable Diffusion的创始团队成立,该团队此前的工作还包括高质量图像生成模型VQGAN、视频生成模型Stable Video Diffusion等。Stable Diffusion最初的5位作者中,4位曾加入Stability AI并持续开发SD后续版本的成员,包括Robin Ro……更多
你的下一个美少女偶像何必是真人 娱乐圈AIGC要内测了
...训练数据,包括日韩等国外歌手和舞者的音舞数据。基于高质量数据和大算力模型训练,PARO已可实现文生舞、文生音、音生舞功能。具体而言,在PARO的文生动作功能中,用户输入简单的文字描述,即可快速生成高质量动态内容...……更多
快手发布大模型产品“可图” 20多种创新AI图像玩法限免上线
...只鹦鹉,极简,波西米亚风格”等描述,可图同样生成了高质量的精美AI图片。(根据文字描述生成的产品) 值得注意的是,“可图”大大降低了AI图像生成的使用门槛,提供了更好的使用体验:与同类产品需多张照片和较长时间...……更多
...的计算量消耗。这种计算量的增加,使得模型能够获得更高质量的回答。然而,这并不意味着推理和训练的边界正在变得模糊,而是推理阶段的计算需求正在增加。清程极智认为,推理和训练需要差异化的系统设计和实现方式。...……更多
阿里巴巴推出atomovideo高保真图生视频框架
...真图生视频(I2V,ImagetoVideo)框架,旨在从静态图像生成高质量的视频内容,并与各种文生图(T2I)模型兼容。▲图源AtomoVIdeo团队论文IT之家总结AtomoVideo特性如下:高保真度:生成的视频与输入图像在细节与风格上保持高度一...……更多
谢赛宁新作:表征学习有多重要?一个操作刷新SOTA,DiT训练速度暴涨18倍
...大规模扩散模型的一个主要瓶颈,就在于无法有效学习到高质量的内部表示。如果能够结合高质量的外部视觉表示,而不是仅仅依靠扩散模型来独立学习,就可以使训练过程变得更容易。为了实现这一点,论文基于经典的扩散Tra...……更多
Adobe推视频生成大杀器!最长生成5秒视频,一键重拍成为现实,已开放公测
...进行了重要更新。Premiere Pro新增了三个主要功能,分别是文生视频、图生视频和生成扩展(Generative Extend)。通过文生视频功能,用户可模拟调整摄像机角度、运动和缩放等参数,进一步细化视频;通过图生视频功能,用户可在...……更多
智谱AI发布基座大模型GLM-4,发起大模型开源基金
...源项目,为优秀开源开发者提供1000亿免费API tokens。GLM-4文生图和多模态理解得到增强。1月16日,在智谱AI(即北京智谱华章科技有限公司)首届技术开放日上,智谱AI发布新一代基座大模型GLM-4,支持128K的上下文窗口长度,单次...……更多
...一而足,主要难点包括算力成本高企、生态建设难度大、高质量的数据短缺等。自6月底发布之初,小i机器人的华藏大模型就直击痛点,提出了“可控、可定制、可交付”的特点,并特别介绍其大模型产品的最低算力成本为10万...……更多
APUS带你穿越千载重回故里,看AI眼中的《轩辕大帝》
...,践行加速AI落地应用的社会责任,持续推动AI产业健康高质量发展。 ……更多
一毛钱写两本红楼梦,智谱AI再降价,已服务30万企业用户
...如《红楼梦》写两遍。而在企业V3版的价格下,用CogView-3文生图模型生成一张图只要6分钱。智谱AI也公布了过去一年的产品、商业化进展:当前,智谱AI的开放平台已服务30万企业级客户,日均调用量达400亿token,过去6个月API每日...……更多
AI 3D生成天花板再拉升!清华团队炼成3D Scaling Law
...模型头部玩家VAST更新了旗下的大模型Tripo,是基于千万级高质量原生自有数据库训出来的那种超强版本。而3D生成新工具的玩法也更进一步,文字、单图、多图都能作为输入。至于几何精细度和图片还原度等方面的效果嘛,先小...……更多
更多关于科技的资讯:
中新经纬10月31日电 (魏薇)“跨境支付服务远不止‘把钱收回来’,更包括基于跨境贸易生态的增值服务、基于交易数据的供应链金融等
2025-10-31 19:12:00
邢台市经开区:创力科技与中建科工举行签约仪式
图片来源:河北省科学技术厅近日,邢台市经开区河北创力机电科技有限公司与中建科工智能科技有限公司举行签约仪式。邢台市经开区相关负责同志
2025-10-31 20:51:00
中新经纬10月31日电 国家发展改革委政策研究室副主任、新闻发言人李超表示,鼓励小、散、低效的存量算力设施向集约化、高效率转变
2025-10-31 13:34:00
企业选型终极指南:基于预算与行业,中国GEO服务商推荐(附TOP10指标对比)
在AI重构流量分配规则的2025年,生成式AI搜索优化(GEO)已成为企业不可或缺的战略投入。然而,面对市场上众多的GEO服务商
2025-10-31 11:00:00
增压好的热水器推荐:万和多款热水器待你选择
在城镇化加速与高层住宅普及的当下,老旧小区管道老化、高层建筑水压衰减等问题愈发突出,不少家庭正遭受 “细流澡”“忽冷忽热” 的沐浴困扰
2025-10-30 08:16:00
创新,是让世界重新认识中国制造
“创新”,这个词我们每天都在说。要让世界记住中国制造的创新,一定是要让人们能看得见、记得住、感受到。我给大家分享几个小故事
2025-10-30 08:35:00
河北日报讯(记者孙青)为激发青年创业活力,点燃青年创业梦想,日前,团石家庄市委正式启动“青年创业训练营——青年小店孵化计划”
2025-10-30 08:36:00
当故宫的红墙金瓦凝缩成书签的精致纹路,当敦煌的飞天壁画跃然咖啡杯的杯身,博物馆中的千年文明正通过文创产品打开新的传承通道
2025-10-30 08:44:00
校宝智慧校园发布招生智能化解决方案,为民办教育注入增长新动能
2025年10月29日,校宝智慧校园正式推出面向民办、国际化学校的招生智能化解决方案,包含流量获取、线索转化、组织建设与数据决策四大核心板块
2025-10-30 09:10:00
Soul App开源播客语音合成模型SoulX-Podcast,支持流畅自然多轮语音对话
近日,Soul App AI团队(Soul AI Lab)正式开源播客语音合成模型SoulX-Podcast。该模型是一款专为多人
2025-10-30 09:10:00
服务效能持续提升 中老年多元化保障需求凸显近日,中宏保险正式发布了《2025年第三季度中宏保险个险理赔服务报告》(以下简称"报告")
2025-10-30 09:10:00
AI+人工双核验:深瞳查重如何以精准核查守护科研诚信
在科研诚信日益重要的今天,图片查重已成为维护科研诚信的关键环节手段。作为国内首家推出图片查重服务的深瞳查重,深瞳查重始终将结果的准确性和可靠性放在首位
2025-10-30 09:10:00
德明利亮相安博会,推出面向智能安防的多维度存储解决方案
10月28日,深圳CPSE安博会在福田会展中心顺利开幕,展会聚焦AI与大数据的智能安防创新。德明利携工业级存储产品及多维矩阵方案亮相
2025-10-30 09:10:00
碧欧宝亮相2025德国品牌周,于外滩百年地标演绎德式健康美学
2025年10月23日,由德国工商总会主办的“Discover Germany 德国品牌周”在外滩百年地标老市府隆重启幕
2025-10-30 10:10:00
留学常用APP与交友软件推荐:学习、生活、社交一站式搞定
即将远赴海外求学,除了收拾行囊,在手机里提前装好实用的留学APP,也成了许多准留学生的必备功课。面对应用商店里海量的留学常用APP选择
2025-10-30 10:56:00