• 我的订阅
  • 头条热搜
最强开源文生图模型一夜易主!SD原班人马打造,要发SOTA视频生成模型
...是多模态生成模型的重灾区。FLUX.1生成的人手图像虽然还不够完美,但实现了很大的进步。FLUX.1共有专业版、开发者版、快速版三种版本。其中,FLUX.1[pro]是最先进的一个版本,具有顶级的即时跟踪、视觉质量、图像细节和输出...……更多
AI出图更快、更懂你心意,高美感文生图模型修炼了哪些技术秘籍?
...秀」和「卖家秀」,实际上是给出的 prompt 对于模型来说不够详细和明确,而豆包·文生图模型引入了一个「Rephraser」,在遵循用户原始意图的同时,为提示词增加更多的细节描述,所有用户也将因此体验到更完美的生成效果。 ...……更多
不够惊艳?还是更务实?谷歌对上OpenAI,能否打好翻身...
科技巨头谷歌和AI(人工智能)新锐巨头OpenAI正在AI领域激烈竞争。当地时间5月14日,在谷歌I/O开发者大会上的主题演讲中,谷歌为旗下大模型Gemini推出了一系列更新,展示了由升级版Gemini驱动的AI助手项目Project Astra、对标Sora的...……更多
Adobe推视频生成大杀器!最长生成5秒视频,一键重拍成为现实,已开放公测
...缆晃动和背景移动等问题,生成的视频在某些细节处理上不够精确。目前,Adobe的文生视频和图生视频,二者生成的视频时长均最多5秒,最高分辨率为720P,帧率为每秒24帧。OpenAI的Sora声称可以生成长达一分钟的视频,并能在保...……更多
字节跳动发布文生图sdxl-lightning
...开放模型SDXL-Lightning。据悉,该模型能够在极短的时间内生成高质量和高分辨率的图像,是目前最快的文生图模型之一。文生图是一种利用人工智能技术,根据文本描述生成图像的技术。目前,文生图领域的主流模型都采用了扩...……更多
文生图参数量升至240亿!Playground v3发布:深度融合LLM,图形设计能力超越人类
...Flux-pro生成的皮肤纹理过于平滑,类似于3D渲染的效果,不够真实;Ideogram-2提供了更真实的皮肤纹理,但在遵循提示词方面表现不好,提示词很长的情况下,就会丢失关键细节。相比之下,PGv3在遵循提示和生成真实图像方面都表...……更多
腾讯混元大模型批量上新:10秒生成AI图像,超过180个腾讯业务接入 | 最前线
...已经从参数量,进一步到更具体的模型选型——用大模型还是小模型?如何更切实地降低模型应用成本?康战辉介绍,当前腾讯内部业务的应用很多还是以效果为主。但每个业务都会根据自己的实际情况和场景,来选择合适模型...……更多
下载次数破39万!CMU、Meta联合发布VQAScore文生图优化方案:Imagen3已采用
...导读】VQAScore是一个利用视觉问答模型来评估由文本提示生成的图像质量的新方法;GenAI-Bench是一个包含复杂文本提示的基准测试集,用于挑战和提升现有的图像生成模型。两个工具可以帮助研究人员自动评估AI模型的性能,还能...……更多
英伟达推出全新文生图ai模型
...明,联合推出安全的商业文生图AI模型,能够在6秒时间内生成4张照片,比以前的模型性能提高了一倍,速度处于行业领先水平。图源:英伟达GettyImages表示全新文生图AI模型部分基于英伟达Edify模型架构,该架构隶属于英伟达Picas...……更多
超越扩散模型!自回归新范式仅需2.9秒就生成高质量图像
...量子位 | 公众号 QbitAI超越扩散模型!自回归范式在图像生成领域再次被验证——中科大、哈工大、度小满等机构提出通用文生图模型STAR。仅需2.9秒就可生成高质量图像,超越当前一众包括SDXL在内扩散模型的性能。此外在生成图...……更多
谷歌 AI 绘画 4 大牛携手创业,天使估值 7 个亿
...,UC伯克利博士毕业。他不仅是Imagen论文的corecontribution,还是 DiffusionModel奠基之作《DenoisingDiffusionProbabilisticModels》的一作。博士毕业于UC伯克利计算机科学专业的Jonathan,之前在OpenAI当过1年的研……更多
AI生成式视频往何处去 “灵动 AI”亮相网易未来大会
...表现力受到一定限制。例如:人物表情在视频中的一致性不够,容易出现“恐怖谷效应”。她希望在视频生成效果控制上,技术能够做到更加精准。但在AI的世界里,创造性的想法一定是大于技术。 英诺天使基金合伙人王晟站在...……更多
OpenAI发布文生视频模型Sora,奥尔特曼选取网友提示词
...能准确呈现细节,还能理解物体在物理世界中的存在,并生成具有丰富情感的角色。该模型还可以根据提示、静止图像甚至填补现有视频中的缺失帧来生成视频。一位时髦女士漫步在东京街头,周围是温暖闪烁的霓虹灯和动感的...……更多
Sora这就落伍了?Meta“最强视频模型”不用DiT,用Llama大力出奇迹了
...,来更好完成模型对全局上下文信息的捕捉能力,本质上还是扩散的思路。但Flow Matching则不再从这个扩散过程入手做训练,而是更“暴力”,直接寻找更抽象的“近路”,而不是一步步寻找找路过程里的脚印:Flow Matching基于轨...……更多
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
...模型Sora因其“逼真”和“富有想象力”被广泛赞誉,其生成视频可达60秒也颠覆了传统视频生成领域平均只有4秒的视频生成长度。OpenAI官网介绍,Sora是一种扩散模型,它从看起来像静态噪声的视频开始生成视频,然后通过多个...……更多
最新AI生图模型Flux1.1刷屏!添加单反相机文件名获得超写实图像
...只需一个简单技巧,就能去除图中的“AI味”,无论人物还是风景都能达到照片级效果。评论区网友的反应be like:我分不清,真的分不清啊。这个技巧用起来也非常简单,在提示词中模仿单反相机的文件命名格式即可。比如“CR2...……更多
“Sora目前仍不够可靠,应用场景受限”
...指出,目前Sora可以用来解决一些创意辅助的场景,但是不够可靠,所以应用的场景是受限的。OpenAI公司坦承,目前Sora模型也有弱点。它可能难以准确模拟复杂场景的物理特性,且可能无法理解因果关系。例如,该系统最近生成...……更多
更快、更强、更可控:智谱“起舞弄清影”,视频生成卷出新高度!
...的起点,如果要走上AGI这条路,只停留在语言这个层面是不够的,一定要以高度抽象的认知能力为核心,把视觉、听觉等一系列模态的认知能力融合在一起。“我们仍然会按照我们的步调、我们对这件事情的认知,一步步地去实...……更多
快手发布大模型产品“可图” 20多种创新AI图像玩法限免上线
...通过人像保持技术,可轻松保留人像的自然特征,并一键生成各种风格的人像作品,满足不同社交及营销场景的个性化形象需求。例如,用户只需上传一张面部轮廓清晰的照片,并选择偏好的风格,调节保留面部特征的程度,便...……更多
基于大模型做电商“内容工厂”,「极睿科技」获顺为领投B轮融资 | 36氪首发
...少难度。 “比如在电商领域,生成的商品图只有相似是不够的,哪怕是领口、袖口一角有一些细微区别,都叫货不对板,需要重新制作。”武彬解释。基于大模型生成的短视频种草视频因此,“ECGPT”和“FashionCLIP”两个行业垂...……更多
MSRA:视觉生成六大技术问题
...的困难出现在中等噪声水平,在这里似然函数往往学习得不够准确。在生成过程中,使用无分类器引导可以看作对学习不佳的似然函数的矫正。在模型评估过程中,鉴于不同噪声水平的任务对最终结果的重要性不同,对这些NLL损...……更多
比Stable Diffusion便宜118倍!1890美元训出11.6亿参数高质量文生图模型
...,模型性能得到持续改善。然而,本着省钱的目的,这里还是选择使用小型的混合器。作者将噪声分布修改为 (−0.6, 1.2),这改善了字幕和生成图像之间的对齐。如下图所示,在75% masking ratio下,作者还研究了采用不同patch大小所...……更多
腾讯混元文生图大模型升级并对外开源
...DiT架构。混元DiT是一个基于Diffusiontransformer的文本到图像生成模型,此模型具有中英文细粒度理解能力,混元DiT能够与用户进行多轮对话,根据上下文生成并完善图像。这也是业内首个中文原生的DiT架构文生图开源模型,支持中...……更多
新扩散模型OmniGen一统图像生成,架构还高度简化、易用
大型语言模型(LLM)的出现统一了语言生成任务,并彻底改变了人机交互。然而,在图像生成领域,能够在单一框架内处理各种任务的统一模型在很大程度上仍未得到探索。近日,智源推出了新的扩散模型架构 OmniGen,一种新的...……更多
快手文生图大模型开源,支持ai创作图像
...可以上传参考图,“可图”将参考上传图像的风格主题,生成符合文本描述的作品。AI形象定制方面,支持风格化、写实两种模式,用户上传头像后可以选择红钻贵族、我的小时候、粘土世界、炫彩琉璃、梦幻莫奈、甜蜜情人节...……更多
...牌仍不愿迈出第一步,很可能是担心失去控制。如果它们还是采取严格保护品牌形象和标志的传统方法,它们就可能在采用文生图AI模型时落后于人。如今的现实是,要对AI技术实现绝对控制仍然是空想。虽然生成式AI在使作品保...……更多
单图解锁全景视角!北大/港中文/腾讯等推出ViewCrafter | 已开源
...结果如下所示:实验结果证明,不管是在新视角生成质量还是在相机控制的精准程度上,团队使用的基于点云的控制信号都要优于基于普吕克坐标的控制信号。另外,团队验证了模型对粗糙点云的鲁棒性。如图所示,对于作为控...……更多
Sora概念盘中拉升,字节跳动或将与OpenAI短兵相接
...一致性方面均有着非常大的突破,大幅度改善过去AI视频不够连贯真实的问题。此前,豆包大模型公布低于行业99%的定价,引领国内大模型开启降价潮。火山引擎总裁谭待认为,大模型价格已不再是阻碍创新的门槛,随着企业大...……更多
马斯克说人类愿赌服输!OpenAI首个文生视频模型炸街,哪些行业又将颠覆
...帮的内容。” 张均表示,Open AI在此前推出的ChatGPT主要还是应用于没有艺术性和不确定的场景,现在很多公司在使用ChatGPT做文本优化,非常节省时间,“用A工具把视频链接直接变成文本,再用GPT秒改,再排查相关词组后,只需...……更多
Sora冲击波 抢人“饭碗”促生新职业?
...了相同的指令,从生成的内容来看,不论是在视频的时长还是在画面的内容上,Sora生成的视频都远胜另外三家。在AI视频领域,除了国外的竞争者外,国内也有不少企业已经入局。360创始人周鸿祎在其社交平台发布对Sora的评论...……更多
更多关于科技的资讯:
消息称华为Mate70 Pro将配备1.5K等深四曲屏、支持ToF 3D人脸识别+侧边指纹
11月8日消息,博主 @数码闲聊站 昨日发文爆料,称某厂新机配备6.88英寸左右的1.5K 120Hz等深四曲屏、并且支持ToF 3D人脸识别+侧边指纹
2024-11-09 09:48:00
字节跳动推动平等文化:倡导“同学”称呼,消除层级感,打造开放沟通环境
【ITBEAR】字节跳动推动平等交流文化,倡导员工互称“同学”近日,知名互联网公司字节跳动在内部推动了一系列文化变革,旨在打造更加平等和开放的工作环境
2024-11-09 09:50:00
李开复:现在卖AI大模型的方式行不通,需考虑技术和业务成本、要有客户买单
李开复“今天我们不谈太多AGI(通用人工智能)和未来梦想,更多要看到商机在哪里。”零一万物CEO李开复直言不讳地表示。钛媒体App 11月8日消息
2024-11-09 09:50:00
华鲲振宇AI合作伙伴大会:全面智能化时代 给出大模型实践最优解
全面智能化的今天,客户需要什么样的解决方案?“智改数转”已全面深入各行各业,在进行数智化转型时,企业面临两个最大的问题
2024-11-09 09:51:00
进博会“朋友圈”扩大:京东健康携手默沙东、赫力昂等全球多家药企共推服务创新
第七届进博会已于 11 月 5 日开幕,吸引了 152 个国家、地区和国际组织近 3500 家企业参会。进博会期间,京东健康与默克
2024-11-09 09:51:00
Matter 1.4标准发布!增强智能家居互操作性,升级亮点一文看尽
智东西11月8日消息,据The Verge报道,负责制定智能家居互操作性标准Matter的组织CSA(连接标准联盟)于11月7日发布了Matter 1
2024-11-09 09:52:00
一个弹窗整懵Claude,瞬间玩不转电脑了
纳尼?AI Agent容易受到弹幕影响!甚至比人类更容易。事情是这样的,3位来自斯坦福、港大的研究人员发现:人类有时会被弹窗分散注意力
2024-11-09 09:52:00
智能体首达Kaggle Grandmaster,华为结构化推理补齐思维链短板
前些时日,AI 大模型开始掌握操作计算机的能力,但整体而言,它们与物理世界互动的能力仍处于早期阶段。为了提高 LLM 在复杂的现实世界中的表现
2024-11-09 09:53:00
感官协同配合的精细操纵,人大胡迪团队探索机器人模态时变性挑战
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室
2024-11-09 09:53:00
智慧医疗中的便携式工控机加固应用:提升可靠性与稳定性
一、智慧医疗为什么用到便携机加固工控机:智慧医疗系统中需要处理大量的患者的数据,包括影像体征监测和诊断信息等,便携式加固工控机能够在移动端环境中快速准确的处理这些数据
2024-11-09 09:54:00
自主研制!我国科研团队在这一领域取得突破
不同物质的反射光或透射光波长不同、光谱各异,但人眼仅可接收有限特定波长的光,因此无法超脱红绿蓝“三原色”的“调色盘”。 北京理工大学张军院士团队自主研制出百通道百万像素的高光谱实时成像器件
2024-11-09 09:54:00
国产AI可以拍微电影了!4K、60帧高清画质,自带音效
国产AI,正式把视频生成拉进了有声电影时代。自从Sora引爆视频生成之后,基本上所有AI生成的视频都属于“默片”的效果
2024-11-09 09:54:00
智慧城市“深圳七杰”,为何跑出一位年轻的“AI老玩家”?
最近,深圳获了个国际大奖!11月7日,2024年全球智慧城市大会在西班牙巴塞罗那成功举办。深圳从64个国家和地区429个申报城市中脱颖而出荣获“城市大奖”
2024-11-09 09:54:00
把Waymo玩成GTA游戏!全生成式的车辆行驶轨迹视频合成器来了
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室
2024-11-09 09:54:00
全球唯一!腾讯助力深圳市摘得“2024世界智慧城市大奖”
北京时间11月7日,2024年度“世界智慧城市大奖”于西班牙巴塞罗那揭晓,中国深圳市凭借卓越的智慧城市建设成果,作为中国唯一代表城市摘得“城市大奖”这一重量级奖项
2024-11-09 09:54:00