生成,视觉,问题,技术,模型,图像头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...Next-Scale Prediction》（视觉自回归建模：通过 Next-Scale 预测生成可扩展图像），论文一作为田柯宇（此前因涉攻击内部大模型，被字节起诉）。参见机器之心报道《GPT 超越扩散、视觉生成 Scaling Law 时刻！北大 & 字节提出 VAR 范...……更多

2024-12-05 09:47:00论文,清华,亚军,字节,北大,模型

2022生成模型进展有多快，新论文盘点9类生成模型代表作

ChatGPT的出现，彻底将生成AI推向爆发。但别忘了，AI生成模型可不止ChatGPT一个，光是基于文本输入的就有7种——图像、视频、代码、3D模型、音频、文本、科学知识……尤其2022年，效果好的AI生成模型层出不穷，又以OpenAI、Meta...……更多

2023-01-30 16:34:00生成,模型,新论,代表作,盘点,进展

单图解锁全景视角！北大/港中文/腾讯等推出ViewCraft

...腾讯等机构的研究人员提出，可以从单张或稀疏输入图像生成精确相机可控的新视角视频。还支持场景级文生3D、图生3D、以及稀疏视角重建等应用。目前论文和代码均已开源，并提供了在线Huggingface demo供用户使用。ViewCrafter：...……更多

2024-09-19 13:37:00全景,腾讯,中文,视角,北大,视角

最强开源文生图模型一夜易主！SD原班人马打造，要发SOTA视

...图模型霸主Stable Diffusion原班人马，宣布推出全新的图像生成模型FLUX.1。FLUX.1包含专业版、开发者版、快速版三种模型，其中前两款模型击败SD3-Ultra等主流模型，较小规模的FLUX.1[schnell]也超越了Midjourney v6.0、DALL·E 3等更大的……更多

2024-08-05 09:39:00文生,人马,模型,生成,视频,模型

Meta版Sora深夜横空出世，小扎放出16秒高清大片！92

【新智元导读】Meta版Sora，就在刚刚惊艳来袭。Movie Gen可生成1080p、16秒、每秒16帧的高清长视频，还能生成音效、编辑视频、上传图像生成个性化视频。甚至Meta还放出了92页论文，模型架构、训练细节一并公开，干货满满！毫无...……更多

2024-10-08 09:52:00高清,架构,大片,细节,论文,技术

扩散模型训练方法一直错了！谢赛宁：Representatio

...我们可能一直都在用错误的方法训练扩散模型。」即使对生成模型而言，表征也依然有用。基于此，他们提出了 REPA，即表征对齐技术，其能让「训练扩散 Transformer 变得比你想象的更简单。」Yann LeCun 也对他们的研究表示了认可...……更多

2024-10-15 09:57:00模型,训练,方法,模型,训练,视觉

AI生成式视频往何处去 “灵动 AI”亮相网易未来大会

...始人雷海波、AI绘画知名博主娜乌斯嘉三人，共同就《AI生成视频往何处去？》分享精彩观点，英诺天使基金合伙人王晟为本次对话主理人。易子立首先教授表示，随着AI热潮的来临，很多企业已经在尝试使用AI工具，但文生图、...……更多

2023-12-26 17:49:00网易,生成,大会,视频,文生,生成

超越扩散模型！自回归新范式仅需2.9秒就生成高质量图像

...量子位 | 公众号 QbitAI超越扩散模型！自回归范式在图像生成领域再次被验证——中科大、哈工大、度小满等机构提出通用文生图模型STAR。仅需2.9秒就可生成高质量图像，超越当前一众包括SDXL在内扩散模型的性能。此外在生成图...……更多

2024-06-27 09:17:00范式,仅需,高质量,生成,模型,图像

马斯克评OpenAI首个视频生成模型：人类认赌服输

OpenAI周四发布了首个视频生成模型Sora，并展示了几段效果炸裂的演示视频。一位X用户分享了Sora生成的一名女子在东京街头漫步的视频，并评论称：“OpenAI今天宣布了Sora，它使用混合扩散和变压器模型架构生成长达1分钟的视频...……更多

2024-02-16 22:16:00马斯,马斯克,生成,模型,人类,视频

oppo首个端侧应用70亿参数大模型findx7系列

...FindX7系列首次实现端侧应用70亿参数的大语言模型，以及生成式的视觉模型，在保障用户隐私安全的情况下，带来响应更快、处理能力更强、生成质量更高的本地AI体验。” 得益于完整的端侧应用的AndesGPT70亿参数大语言模型，Fi...……更多

2023-12-28 10:13:00模型,参数,应用,技术,模型,芯片

多模态竞技场对标90B Llama 3.2！Pixtral

...小变化可能会极大地改变某些模型的性能（比如要求模型生成与参考答案完全匹配时，6.0和6就可能是不同的）。为了缓解这个问题，作者建议使用「Explicit」提示来明确指定参考答案所需的格式。多模态性能上表显示，在多模...……更多

2024-11-20 09:43:00模态,竞技场,竞技,报告,技术,模态

腾讯混元上线文生视频并开源，120秒内成片！还有提示词建议

...智东西12月3日报道，今天，腾讯混元大模型正式上线视频生成能力，这是在腾讯文生文、文生图、3D生成之后的最新技术进展。据腾讯混元多模态生成技术负责人凯撒现场介绍，此次更新中，HunYuan-Video模型经历了四项核心改进：...……更多

2024-12-04 09:49:00文生,腾讯,提示,建议,视频,生成

这家川企如何出海抢市场

...球率先上线一站式AI长视频制作平台Clipfly，集合了AI视频生成、AI视频增强、视频编辑等功能，短短两个月已在海外拥有10万名用户。竞逐人工智能新赛道，很多初创公司“拿着锤子找钉子”，先做大模型，再去找应用场景，但实...……更多

2024-03-28 06:40:00市场,视频,成都,模型,场景,行业

更快、更强、更可控：智谱“起舞弄清影”，视频生成卷出新高度！

智谱AI再次放大招，上线AI视频生成功能“清影”——曾被国际科技媒体The Information评为最有可能成为“中国OpenAI”5家企业之一的智谱AI，如今在视频生成领域再下一城。不同于至今没有对公众开放、“犹抱琵琶半遮面”的Sora，...……更多

2024-07-27 10:00:00更快,生成,高度,视频,清影,视频

36氪首发｜「Tiamat」完成近千万美元A轮融资，想将AI

...天使轮融资。36氪曾报道过的「Tiamat」是一家国内AI图像生成技术服务商，成立于2021年。其自研的MorpherVLM是国内首个基于概念融合范式提出的近百亿级跨模态生成模型，通过异构的视觉编码-解码网络结构，并引入基于用户反馈...……更多

2023-02-28 09:33:00可控性,极致,融资,生成,图像,模型

AI画家的「滑铁卢」：为什么冰可乐不愿意住进茶杯里？

... 的要求时，会发生什么呢？在 2023 年 10 月大规模 AI 图像生成模型刚刚兴起时，我们便进行了这种尝试，得到了以下结果：考虑到 AI 模型更新换代带来的性能提升，我们在 2024 年 7 月又使用了最先进的模型进行了同样的尝试： ...……更多

2024-08-07 09:32:00滑铁卢,茶杯,画家,可乐,茶杯,可乐

刚刚，Llama 3.2 来了！支持图像推理，还有可在手机上

... 1B 和 3B 版本，则都是纯文本模型，但也具备多语言文本生成和工具调用能力。Meta 表示，这些模型可让开发者构建个性化的、在设备本地上运行的通用应用 —— 这类应用将具备很强的隐私性，因为数据无需离开设备。在本地运...……更多

2024-09-27 13:42:00推理,可在,图像,运行,版本,支持

长上下文能力只是吹牛？最强GPT-4o正确率仅55.8%，开

...了 LoCoVQA，一种带有干扰项的长上下文视觉问答 (VQA) 基准生成器。LoCoVQA可以提供与问题相关的图像序列，以及一组可配置的视觉干扰项，从而准确评估VLM如何在杂乱的上下文中仅提取与查询相关的信息。从原理上讲，这也是一...……更多

2024-07-23 17:12:00正确率,长上,下文,模型,只是,能力

Sam Altman或筹数十亿美元自造AI芯片，DeepMi

AI创投周报是阿尔法公社推出的聚焦于以生成式AI为代表的人工智能新浪潮的创投资讯周报。阿尔法公社希望发现和投资非凡创业者（AlphaFounders），相信非凡创业者们在技术、商业和社会方面的巨大推动力，他们指引着创投生态...……更多

2024-01-29 09:20:00首席,科学家,芯片,创业,科学,模型

多模态模型免微调接入互联网，即插即用新框架，效果超闭源方案

...反馈的开源检索增强框架SearchLVLMs。该框架主要包括查询生成、搜索引擎调用、分层过滤三个部分。以视觉问答为例，该框架会基于问题和图片生成查询关键词，并调用搜索引擎查找相关信息，再由粗到细地对检索结果进行过...……更多

2024-11-11 13:34:00模态,接入,框架,模型,效果,互联网

麻省理工的科学家可以让最流行的人工智能图像生成器提速30倍

...在不影响质量的情况下，给像Dall·E3和Stable Diffusion这样的生成式人工智能系统带来了巨大的提振。一项新的研究表明，由于一项技术可以将整个100个阶段的过程浓缩为一步，流行的人工智能（AI）驱动的图像生成器的运行速度可...……更多

2024-03-27 13:42:00麻省理工,麻省,生成器,人工智能,提速,科学家

谢赛宁新作：表征学习有多重要？一个操作刷新SOTA，DiT训

...经充分认识并认可了表征学习的重要性，那么视觉领域的生成模型呢？最近，谢赛宁团队发表的一篇研究就拿出了非常有力的证据：Representation matters！扩散模型如何突破瓶颈？成本高又难训练的DiT/SiT模型如何提升效率？对于这...……更多

2024-10-23 09:55:00新作,速度,训练,学习,模型,训练

用AI当导演，一个人就能拍电影？

...对话互动,敢于质疑与承认错误。那么,如此强大的AI可以生成一部电影吗?AI创作电影的画面AI在电影方面的应用引发了业内的思考，上海温哥华电影学院电影制作系的高级讲师奥黛·阿瓦迪亚注意到AI的最新趋势，在去年12月底研发...……更多

2023-11-07 14:46:00导演,电影,个人,电影,生成,人工智能

“平替版Midjourney”，上线1年超700万用户，生成

...据报道，该公司产品发布1年，用户突破700万人，平台共生成超过7亿张图像，并获得投资者青睐。2023年12月7日，Leonardo.ai宣布获得3100万美元种子轮融资，投资方包括 Blackbird、Side Stage Ventures、Smash Capital、TIRTA Ventur……更多

2024-02-21 13:46:00生成,用户,图片,用户,生成,模型