• 我的订阅
  • 头条热搜
36氪首发|「Tiamat」完成近千万美元A轮融资,想将AI生成图像的可控性做到极致
...:更重要的指标在于能不能在垂直领域有更好的精准性和可控性,能不能更好地让图像展现出人类理想的构图、或者一致性的角色等等。除此之外,我们自研的考虑也来自如何能让研发的成本结构更加精益和可控。从这一点来说...……更多
基于大模型做电商“内容工厂”,「极睿科技」获顺为领投B轮融资 | 36氪首发
...研究了市面上主流的Stable Diffusion等文生图模型,发现其可控性还是比较差——这意味这在To B落地会有不少难度。 “比如在电商领域,生成的商品图只有相似是不够的,哪怕是领口、袖口一角有一些细微区别,都叫货不对板,...……更多
“平替版Midjourney”,上线1年超700万用户,生成图片超7亿张
...个资产。Fiasson表示:“我们还将做更多工作,使AI创作在可控性和保真度方面更加强大,而且开箱即用。”“简易版Stable Diffusion”当前,AI生图主流产品使用需跨过付费订阅或技术设备两个门槛,如Midjourney每个月10-60美元限次数...……更多
第一批 AI 绘画公司已经倒闭了
...。在技术角度,需要提高的主要是两个方面,包括生成的可控性和细节描述能力。AI 绘画的可控性有待提升,对于数量、逻辑、关系、多图关联等问题暂无有效的解决方案。比如说要求生成 2 个苹果,左边是红色,右边是绿色。...……更多
阿里发“神笔马良版Sora”,轻轻一抹让猫咪转向,20个演示视频+10页技术报告解读
...运动控制的视频,同时也支持首尾帧控制,让视频生成的可控性又上了一个阶梯。//oss.zhidx.com/uploads/2024/08/66acd09cc2d2b_66acd09cbf165_66acd09cbf141_开篇.mp4Tora是首个面向轨迹的DiT框架模型,利用DiT的可扩展性,……更多
腾讯混元上线文生视频并开源,120秒内成片!还有提示词建议
...本编码、算力优化等多个方面,提升了视频生成的质量与可控性。此外,腾讯还通过微调、应用拓展及开源等措施进一步强化了模型的实际应用能力。1、四项关键技术升级首先,模型采用了一个超大规模的数据处理系统,能够...……更多
阿里巴巴推出atomovideo高保真图生视频框架
...生成兼容性:与现有的多种文生图(T2I)模型兼容高语义可控性:能够根据用户的特定需求生成定制化的视频内容▲图源AtomoVIdeo团队论文AtomoVideo使用预先训练好的T2I模型为基础,在每个空间卷积层和注意力层之后新添加一维时...……更多
ECCV 2024 | 南洋理工三维数字人生成新范式:结构扩散模型
...部细节和全身图像质量上比 AG3D 更有优势。3.3 应用3.3.1 可控性生成StructLDM 支持可控性生成,如相机视角、姿态、体型控制,以及三维虚拟试衣,并可在二维隐空间插值。3.3.2 组合式生成StructLDM 支持组合式生成,如把①②③④⑤...……更多
vivo发布自研大模型,为用户和开发者带来诸多惊喜
...观、真实、富有质感的人物形象。最后,BlueLM-Art还拥有可控性生成能力,能在图像创作中保持更高的主体一致性。基于蓝心图像大模型BlueLM-Art,vivo在蓝心小V中推出了图像创作、AI消除、图像风格化、艺术字创作等一系列AI功能...……更多
超越扩散模型!自回归新范式仅需2.9秒就生成高质量图像
...通过逐步的去噪过程,为图像生成提供了更强的稳定性和可控性,然而也导致生成过程极其耗时。而自回归模型的潜力,在受到大语言模型启发下,开始在这一领域逐渐被探索。比如VAR指出是因为自回归模型逐个预测token的行为...……更多
36氪首发 | 完成Pre-A+轮融资,语言大模型企业「澜舟科技」推出孟子MChat可控大模型
...领域数据和知识图谱;对功能、风格、人类认知等方面具可控性。作为“通用底座”,孟子MChat大模型提供了涵盖语言预训练模型、多模态预训练模型、垂直领域预训练模型、其他预训练模型等关键能力。通过在底座上固件“能...……更多
腾讯3D大模型全面开源,文本图像10秒转3D资产
...开源新SOTA实验结果显示,Hunyuan3D-1.0具有强大泛化能力和可控性,可重建各类尺度物体,大到建筑,小到工具花草。在两个公开3D数据集GSO、OmniObject3D上定量评估3D生成质量,包括Chamfer Distance(CD)、F-score (FS)指标,Hunyuan3D……更多
更快、更强、更可控:智谱“起舞弄清影”,视频生成卷出新高度!
...度,提高市场竞争力。与此同时,基于自研技术,智谱AI可控性更强,生成内容更连贯,对物理世界的理解更好,能够更准确地响应和遵循用户的指令、要求和偏好。这意味着智谱AI画面质量更高、能驾驭的风格更广,可以满足...……更多
“图片生成领域的DeepSeek”!智象未来图像生成大模型全面开源 登顶全球权威榜单
...支持对话式生成图像以及图像编辑,降低创作门槛,通过极致性价比、极致画质、极致性能、极致拓展“四大极致技术”,开启开源图像生成模型新范式,助力全球开发者与创作者实现“所想即所得”。科大校友创办 总部位于...……更多
...免费服务。面对竞争激烈的市场,Prakash认为,透明度、可控性与隐私将是Together取胜的关键。今年年底,公司计划将其团队规模从24人扩大到40人左右,并将剩余的种子资金用于进一步研发和产品开发。 ……更多
神奇!悟空图像整合亦心AI,让你秒出装修效果图
...、环境模型,用户可自由选择,能增加设计灵活性与画面可控性,从而更好地表达设计理念,最终增强渲染效果,输出高品质作品。原图 室内上色效果图室内上色效果图 室内上色效果图附3提示词:极简风格,客厅,高质量家...……更多
圆桌论坛:ChatGPT的第一性原理:通往AGI的路上还有哪些系统性机会? | WISE2023颠覆AIGC产业发展峰会
...术壁垒变成生态壁垒。从生成式的角度来说,生成质量的可控性和安全性以及公序良俗的对齐比较困难。特别是国内的To C应用没有想象中发展那么快速的情况下,To B应用在目前的状态下机会反而更多,通过短期迅速发展来积累...……更多
快手可灵大模型开放视频续写功能 可生成最长约3分钟视频
...延伸至约3分钟,充分显示了可灵强大的想象力与精细的可控性,极大地拓展了视频大模型的创作边界。化静为动 按需定制视觉叙事此前,“可灵”在文生视频方面已经展现出了创造逼真运动场景、精确模拟物理特性的强大能力...……更多
AI 已死?不,AIGC 给我们带来了新的希望 | 氪记 2022
...正发挥作用。在此之前,这些模型可能适用于对保真度和可控性要求较低的场景,如 C 端用户在娱乐创作平台上的猎奇式创作。 五、AI Coding:开始小规模应用 2023 年趋势 科技互联网巨头的 AI 编码占比增加,因此巨头孵化的项...……更多
“智算融合 共创未来”——开普云AI战略暨新产品发布会召开
...引入更多的参考控制条件,提高视频内容生成的一致性和可控性; 5.算力适配通用化,在模型推理运行方面,针对重点行业客户应用,与多家国内外算力厂商的产品适配,形成了算力模型一体化产品; 6.模型进步持续化,为保...……更多
「See Video, Get 3D」,智源开源无标注视频学习3D生成模型See3D
...可持续扩充,进一步增强模型能力的覆盖范围。b)相机可控性:模型可支持在任意复杂的相机轨迹下的场景生成,既可以实现场景级别的漫游,也能聚焦于场景内特定的物体细节,提供灵活多样的视角操控能力。c) 几何一致性...……更多
叫板Sora出圈后,Luma AI如何接住泼天的流量?
...域,目前图生视频比文生视频更加受欢迎,因为用户在乎可控性。所以所有能够提升可控性的,都是用户非常需要的功能点。《智能涌现》:期间行业哪些产品或者认知的动向,会对公司的产品研发节奏产生影响? Barkley:其实...……更多
第三届美图影像节发布6款产品 开启“AI工作流”新阶段
...语义理解、画面稳定性、动态连续性、主体一致性、内容可控性以及生成时长等方面,获得全方位提升。今年2月,文生视频模型Sora发布,并引发文生视频领域的竞争。但美图在实践过程中发现,用类似的文生视频模型辅助内容...……更多
全网刷频的Sora,有多“可怕”
...留在 2-4s 的时长范围内——一旦超过了这个时长,视频的可控性和质量都将大大下降。很多视频生成,更像是个固定人物配上动态背景,画面很单调,几乎没什么动作,这也是因为从文字到视频,在时空逻辑推理层面的局限。同...……更多
万字长文:产品经理视角下的AI绘画全解析
...舒适区,新增市场潜力区。1)画师舒适区来自于技术上可控性的演进,他会逐步往右退缩。但目前而言,Diffusion仍然在可控性方面做持续努力,这种努力短期内看来不可能触达完全限制领域(部分场景可能可以)。所以画师的...……更多
SIGGRAPH上首个Real-Time Live的中国团队用生成式AI创建3D世界
...3D 模型化可以锚定其收敛的方向,提高图像、视频生成的可控性。不过,3D 领域本身不像图像和视频那么简单,只有补齐完整链条,用户才会真正开始接受 3D + AI 的能力。这部分工作可能通过合作伙伴的 API,或者由其团队自行...……更多
腾讯混元宣布大语言模型和3D模型正式开源
...作者和艺术家自动化生产 3D 资产,具有强大泛化能力和可控性,可重建大到建筑,小到工具花草等各类尺度物体。 目前,两个模型均已经在腾讯业务场景中落地应用,经过实践的检验,是面向实用场景的应用级大模型。应用上...……更多
只要一张图就能还原绘画过程,这篇论文比Paints-UNDO实现得更早
...任意帧的图像输入,灵活控制绘画过程的生成。与之前的可控性生成方法类似,论文作者引入一个 ControlNet 的变体,来控制生成结果中的特定帧与参考图一致。3. 合成数据集与训练策略由于真实绘画过程数据较难获取,数量不足...……更多
...进步。不过,目前的人工智能绘画技术并不完美。首先,可控性仍然不高,即计算机不能很好理解人类指令的含义,即便是输入“画两个苹果,左边红色,右边绿色”这样的简单描述,生成的图像也可能有很大偏差;其次,细节...……更多
商汤升级“日日新5.0”大模型,对标GPT-4Turbo
...生成做到可控。我们打造了文生视频平台,强调对人物的可控性、情绪的表达、微表情等相关内容,同时我们也强调对于动作的可控性和交互性。”徐立带来了3段完全由大模型生成的视频。未来,输入一段文字或一个完整描述...……更多
更多关于科技的资讯:
2274台!河北省国和投资集团有限公司国庆车展销量刷新同期纪录
图为活动现场。河北新闻网讯(吴建春)国庆黄金周期间,河北省国和投资集团有限公司(简称“国和公司”)成功举办“石家庄国和裕华汽车园省直员工购车盛典”大型车展
2025-10-11 20:06:00
浪潮智慧科技深耕标准建设:3项主导数字山东技术规范成功获批
近日,山东省大数据局正式下发《关于发布〈矿产资源数据治理规范〉等11项数字山东技术规范的公告》,其中由浪潮智慧科技主导编制的《智慧渔业养殖系统建设规范》《数字孪生机场模型构建规范
2025-10-11 10:24:00
长白时评评论员 杨飞近日,陕西西安等地出台政策,全面暂停网约车“一口价”等低价营销行为,严禁任何形式的价格欺诈和恶意压价
2025-10-11 10:47:00
厦门网讯(厦门日报记者 林露虹 通讯员 管轩 雷飏)集护眼、通透、高刷新率于一体的天马 “天工屏”;“全球最窄四等边设计”的手机屏幕……今年以来
2025-10-10 08:28:00
2025河北国际工业设计周活动观察:全球智慧赋能未来智造
全球智慧赋能未来智造——2025河北国际工业设计周活动观察9月20日,2025河北国际工业设计周主会场活动在雄安新区举行
2025-10-10 08:40:00
工信部日前公布首批制造业数字化转型促进中心建设主体名单,太原福莱瑞达物流设备科技有限公司入选。制造业数字化转型促进中心是国家落实产业数字化战略的核心公共服务载体
2025-10-10 08:42:00
10月9日,从太原第二热电厂获悉,为全力保障太原市冬季供热安全稳定,持续提升供热服务质效,太原二热秉持“早谋划、早部署
2025-10-10 08:43:00
齐鲁晚报·齐鲁壹点客户端 李孟霏在刚刚过去的国庆中秋“双节”,山东移动威海乳山分公司移动社区营销团队实现品牌口碑与业务发展的双赢
2025-10-10 11:07:00
优优绿能(301590)成立于2015年,是国内直流充电桩模块领军企业之一,2024年在国内充电模块市占率达16%,位居行业第二
2025-10-10 23:06:00
恒润达生信披“迷雾”:“消失”的研发总监与首席科学家?
除研发核心人员离职或在外创办同行业企业外,上海恒润达生生物科技股份有限公司(下称“恒润达生”)招股书对研发团队人员信披的真实性
2025-10-10 23:06:00
互联网贷款普及后,不少初次接触的用户常因平台选择难、流程不熟悉犯愁。其实只要按步骤操作执行,安全又高效,下面由榕易有钱为大家梳理了几项关键步骤
2025-10-10 11:34:00
从志愿翻译到时装新星 河南姑娘在非洲书写青春与梦想
大河网讯 非洲大陆,机遇与挑战并存。越来越多的中国人选择在这里扎根创业,为当地发展注入新活力。毕业于河南工业大学的何方方便是其中之一
2025-10-10 12:11:00
姜杰秀:心中有梦,创业有方,用执着与努力让喜龙果出海
鲁网10月10日讯“我父亲就是做农副产品加工的,从小受父亲的熏陶,我对农副产品加工就有别样的情愫。于是,我就在农副产品加工上有了梦想
2025-10-10 13:56:00
中新经纬10月10日电 “市说新语”微信号10日消息,近日,国家市场监管总局(国家标准委)批准发布一批重要国家标准,涉及助老扶幼
2025-10-10 14:06:00
解锁工业自动化密码,威图与易盼2025IAS硬核破圈瞬间
"新质驱动、高端引领、数智赋能" ,2025中国国际工业博览会聚焦新工业新经济,旨在拉开加快构建一流产业生态,开启智能制造新时代的帷幕
2025-10-10 14:59:00