• 我的订阅
  • 头条热搜
MSRA:视觉生成六大技术问题
文生图、文生视频,视觉生成赛道火热,但仍存在亟需解决的问题。微软亚洲研究院研究员古纾旸对此进行了梳理,他认为视觉信号拆分是最本质的问题。生成模型的目标是拟合目标数据分布,然而,目标数据分布过于复杂,...……更多
OpenAI发布文生视频模型Sora,奥尔特曼选取网友提示词
...能准确呈现细节,还能理解物体在物理世界中的存在,并生成具有丰富情感的角色。该模型还可以根据提示、静止图像甚至填补现有视频中的缺失帧来生成视频。一位时髦女士漫步在东京街头,周围是温暖闪烁的霓虹灯和动感的...……更多
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
...模型Sora因其“逼真”和“富有想象力”被广泛赞誉,其生成视频可达60秒也颠覆了传统视频生成领域平均只有4秒的视频生成长度。OpenAI官网介绍,Sora是一种扩散模型,它从看起来像静态噪声的视频开始生成视频,然后通过多个...……更多
撞墙还是新起点?自回归模型在图像领域展现出Scaling潜力
自回归方法,在图像生成中观察到了 Scaling Law。「Scaling Law 撞墙了?」这恐怕是 AI 社区最近讨论热度最高的话题。该话题始于 The Information 的一篇文章。这篇文章透露,OpenAI 下一代旗舰模型的质量提升幅度不及前两款旗舰模型...……更多
最新美国国家人工智能科学院院士介绍
...言处理技术的实际应用具有重要意义,为智能问答、文本生成和机器翻译等任务提供了更好的解决方案。LucasBeyer,来自谷歌人工智能实验室。他在计算机视觉领域取得了重大突破,特别是在图像识别和物体检测方面,为谷歌的...……更多
清华团队提出大模型“密度定律”;足球领域首个视觉语言基础模型
...主的纯视觉 GUI agentGoogle DeepMind:利用运动轨迹控制视频生成大模型数学新基准:成功率最高 2%Meta 推出「高效追踪一切」模型SOLAMI:首个端到端社交视觉-语言-动作建模框架RevThink:使用逆向思维增强 LLM 推理想要第一时间获取每...……更多
Meta提出“可持续思维链”,让大模型在连续潜空间中推理
...日值得关注的大模型前沿论文北大团队提出「自定义漫画生成」框架UniReal:通过学习真实世界动态实现通用图像生成和编辑苹果团队提出「可扩展视频生成」方法利用扩散 Transformer 进行视频运动迁移ObjCtrl-2.5D:无需训练的「图...……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
...也不容易,因为我们需要的是多模态数据,但LLM无法直接生成图像,DALL-E、Stable Diffusion等图像生成模型又无法同步生成文本。一个直觉的解决方案是将二者结合在一起,直接生成但文生图模型实际上很难对图像细节做到细微精...……更多
南洋理工大学开发3D编辑技术MVDrag3D ,只需拖拽就能实现精准P图
...构,使得复杂的结构编辑(如明显的拓扑变化或新纹理的生成)非常繁琐而难以实现。近年来,一部分学者利用基于 3D 高斯模型的方法提高了 3D 编辑的灵活性,但仍面临着优化时间长或过度饱和的问题,并且在实现大规模结构...……更多
苹果300亿参数大模型首亮相,还买了家AI公司|焦点分析
...谨慎,他觉得苹果工作模式是先做再说,“我认为苹果在生成式人工智能和人工智能方面存在着巨大的机会,而无需透露更多细节或超出自己的范围。”据The Information2023年9月的一次报道,苹果每天在人工智能上投资数百万美元...……更多
下载次数破39万!CMU、Meta联合发布VQAScore文生图优化方案:Imagen3已采用
...导读】VQAScore是一个利用视觉问答模型来评估由文本提示生成的图像质量的新方法;GenAI-Bench是一个包含复杂文本提示的基准测试集,用于挑战和提升现有的图像生成模型。两个工具可以帮助研究人员自动评估AI模型的性能,还能...……更多
与OpenAI o1技术理念相似,TDPO-R算法有效缓解奖励过优化问题
...型和大模型对齐。OpenAI 最近发布的 o1 模型在数学、代码生成和长程规划等复杂任务上取得了突破性进展,据业内人士分析披露,其关键技术在于基于强化学习的搜索与学习机制。通过迭代式的自举过程,o1 基于现有大语言模型...……更多
Meta 公司发布 Imagine Yourself AI 模型
...家 8 月 23 日消息,从社交媒体到虚拟现实,个性化图像生成因其在各种应用中的潜力而日益受到关注。传统方法通常需要针对每位用户进行大量调整,从而限制了效率和可扩展性,为此 Meta 公司创新提出了“Imagine Yourself” AI 模...……更多
新扩散模型OmniGen一统图像生成,架构还高度简化、易用
大型语言模型(LLM)的出现统一了语言生成任务,并彻底改变了人机交互。然而,在图像生成领域,能够在单一框架内处理各种任务的统一模型在很大程度上仍未得到探索。近日,智源推出了新的扩散模型架构 OmniGen,一种新的...……更多
开源社区参数量最大的文生视频模型来了,腾讯版Sora免费使用
...小伙伴又多了一个选择!今日,腾讯宣布旗下的混元视频生成大模型(HunYuan-Video )对外开源,模型参数量 130 亿,可供企业与个人开发者免费使用。目前该模型已上线腾讯元宝 APP,用户可在 AI 应用中的「AI 视频」板块申请试用...……更多
Meta推出AI新模型VFusion3D,微美全息布局AIGC+3D内容加速产业转型升级
...,Meta(META.US)和牛津大学的研究人员开发了一种新的3D生成式AI模型VFusion3D,能够从单张图像或文本描述生成高质量的3D对象,可能会改变虚拟现实、游戏和数字设计等领域。AI新模型VFusion3D来袭据悉,VFusion3D界面简单直观,允...……更多
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...阅读原文即可直达,包含评用于模型评测和预训练的数据生成代码) Hugging Face 链接:huggingface.co/vcr-org VCR 数据集简介为了开发 VCR 任务,研究人员构建了一个由图像 - 文字生成 VCR 合成图像的流程。在该流程中可以通过控制遮...……更多
从未见过现实世界数据,MIT在虚拟环境中训练出机器狗,能跑酷
...是 pi 的数据都会少七八个数量级。MIT 的这个团队希望用生成模型来作为机器人学习的新数据源,用工程手段来取代传统的数据收集,实现一条通过由生成模型加持的物理仿真来训练机器人视觉的技术路线。随着机器人在训练过...……更多
阿里国际发布最新开源多模态模型Ovis,多模态能力再升级
...像。与大型语言模型(LLMs)相比,大语言模型在处理和生成文本数据方面有专长,而多模态大模型能够处理非文本数据,如图像等等。根据多模态权威综合评测平台OpenCompass的数据,Ovis1.6-Gemma2-9B在30B参数以下的模型中取得了综...……更多
快手可灵大模型开放视频续写功能 可生成最长约3分钟视频
本文转自:中国新闻网快手的视频生成大模型“可灵”自面世以来,以其惊艳效果引发了国内外的广泛关注。 6月21日,可灵再度进化,正式推出图生视频功能,支持用任意静态图像生成5s视频,并且可搭配不同的文本内容,实...……更多
OpenAI推出生成式模型Sora,内容创作领域开启新纪元
...们生活的方方面面。而就在2月16日,OpenAI宣布推出全新的生成式人工智能模型“Sora”。据了解,通过文本指令,Sora可以直接输出长达60秒的视频,并且包含高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色。这意...……更多
叫板Sora出圈后,Luma AI如何接住泼天的流量?
...的硅谷AI公司,在和《智能涌现》的交流中,复盘了视频生成模型Dream Machine AI爆火的过程。在硅谷率先发布一款效果能对标OpenAI Sora的视频模型,对一家初创公司而言并不容易——更何况,Luma AI在视频生成领域算得上是“半路出...……更多
...明团队发布了一项国际联合研究成果MDT,与人工智能文字生成视频大模型Sora核心组件DiT相比,训练速度提升10倍以上,再次刷新SoTA最佳图像生成质量和学习速度。近日,相关成果公布于预印本服务器arXiv。2024年初,美国OpenAI公...……更多
惊掉下巴!被字节起诉800万实习生,拿下NeurIPS 2024最佳论文
...具有较好的泛化能力:VAR首次使得类似GPT的AR模型在图像生成中超越了扩散Transformer。当前,自回归模型(AR)主要用于语言模型从左到右、逐字顺序生成文本token。同时,也用于图像生成中,即以光栅扫描的顺序从左到右,从上...……更多
「See Video, Get 3D」,智源开源无标注视频学习3D生成模型See3D
... Labs 推出首个【空间智能】模型,仅输入单张图片,即可生成一个逼真的 3D 世界,这被认为是迈向空间智能的第一步。几乎同时,国内智源研究院推出了首个利用大规模无标注的互联网视频学习的 3D生成模型See3D---See Video, Get 3D...……更多
Adobe推视频生成大杀器!最长生成5秒视频,一键重拍成为现实,已开放公测
...消息,10月14日,Adobe在Adobe MAX大会上宣布推出Firefly视频生成模型,并强化了现有的图像、矢量和设计模型。Firefly视频模型已进入有限公开测试阶段,成为首个可安全用于商业用途的生成式AI视频模型。最新的Firefly图像模型Firefly...……更多
《卖身契》修复记:AI重现“打工人”喜剧魅力,留住老电影的黄
...首次将AIGC视觉大模型引入到影片修复,对大模型进行了生成质量和效率等方面的算法优化。如今随着Sora等大模型在视觉领域的发展,视觉大模型不仅运用在视频生成、修改、融合和延伸等多种场景,还可以应用到剪辑和特效制...……更多
北大字节VAR最佳论文、厦大清华亚军,NeurIPS 2024最佳论文出炉
...Next-Scale Prediction》(视觉自回归建模:通过 Next-Scale 预测生成可扩展图像),论文一作为田柯宇(此前因涉攻击内部大模型,被字节起诉)。参见机器之心报道《GPT 超越扩散、视觉生成 Scaling Law 时刻!北大 & 字节提出 VAR 范...……更多
2022生成模型进展有多快,新论文盘点9类生成模型代表作
ChatGPT的出现,彻底将生成AI推向爆发。但别忘了,AI生成模型可不止ChatGPT一个,光是基于文本输入的就有7种——图像、视频、代码、3D模型、音频、文本、科学知识……尤其2022年,效果好的AI生成模型层出不穷,又以OpenAI、Meta...……更多
单图解锁全景视角!北大/港中文/腾讯等推出ViewCrafter | 已开源
...腾讯等机构的研究人员提出,可以从单张或稀疏输入图像生成精确相机可控的新视角视频。还支持场景级文生3D、图生3D、以及稀疏视角重建等应用。目前论文和代码均已开源,并提供了在线Huggingface demo供用户使用。ViewCrafter:...……更多
更多关于科技的资讯:
永辉超市:北京第三家“学习胖东来”超市开业,一线员工平均薪资上涨一千多元
3月28日消息,北京第三家、大兴首家永辉超市“学习胖东来”自主调改店点亮鸿坤广场,该店在此前积累的经验中再次升级,以顾客需求为中心
2025-03-28 18:43:00
专家教“银发族”玩转AI!渝北区图书馆这场专题讲座受热捧
3月28日,重庆市渝北区图书馆“临空文化讲堂”走进区老干部活动中心,为老干部文学艺术社的150名离退休干部带来了一场生动实用的“AI时代——轻松玩转智能创作”专题讲座
2025-03-28 18:57:00
重量超2万吨!我国首个海洋氢氨醇一体化项目建设完工
快科技3月28日消息,据报道,我国首个海洋氢氨醇一体化项目已在山东烟台建设完工,正式进入调试阶段。该项目的顺利推进为后续投运及海上制氢全流程实证检验奠定了重要基础
2025-03-28 19:06:00
想提高效率却混乱!马斯克让联邦员工写周报邮箱爆满狂退信
快科技3月28日消息,据媒体报道,当地时间3月26日,马斯克领导的政府效率改革团队推行新政遭遇技术故障。该部门要求全美200万联邦雇员每周以邮件形式提交工作进展报告
2025-03-28 19:06:00
赠洁面小样1支:曼秀雷敦氨基酸洗面奶12元狂促
天猫曼秀雷敦男士旗舰店,曼秀雷敦氨基酸洗面奶150ml日常售价40.7元,下单赠送洁面小样1支(约50g),叠加21元限时券
2025-03-28 19:36:00
黑寡妇同属!一只“褐寡妇”蜘蛛被查获:被咬一口老疼了
快科技3月28日消息,大名鼎鼎的“黑寡妇”蜘蛛相比很多人都有耳闻,实际上还有一种“褐寡妇”,二者同属。海关发布通报,近日
2025-03-28 19:36:00
放弃日本45亿重大项目!电动汽车专家徐福国回国任教
快科技3月28日消息,据媒体报道,电动汽车控制系统专家徐福国,放弃了一项由日本政府资助、投资45亿日元(约2.2亿元人民币)的重大项目
2025-03-28 19:36:00
亚马逊AWS中国裁员10% 官方回应:严重失实、持续在积极招聘
3月28日下午消息,据相关媒体报道,AWS大中华区近期通过“三年期不续签和PIP”两种方式陆续进行裁员,范围大致涵盖了所有部门
2025-03-28 19:36:00
8件套14.9元包邮!田七春日花园牙膏发车
天猫田七旗舰店,田七春日花园系列牙膏 90g标价79.9元,今日下单4件,限时赠送30g小样 * 4支。领取49 元优惠券 + 叠加立减
2025-03-28 19:36:00
Manus发布付费方案:最高每月199美元
快科技3月28日消息,内测许久的Manus宣布收费,升级计划选项让用户获取更多积分。收费方案有Manus Starter和Manus Pro
2025-03-28 19:36:00
网易云音乐听劝了:优化了歌单界面 歌名一目了然
快科技3月28日消息,今日晚间,网易云音乐通过官方微博发布了一则优化歌单界面公告。据公告内容,网易云音乐发文称:发现用户反馈
2025-03-28 19:36:00
世界上最大的宫殿!缅甸最后一个王朝的宫殿墙塌了
3月28日消息,据媒体报道,3月28日,缅甸发生7.9级强震,曼德勒皇宫的宫墙倒塌。该皇宫是缅甸最后一个王朝贡榜王朝的宫殿
2025-03-28 19:36:00
海康威视亮相第27届高速公路信息化大会
3月27日,第27届中国高速公路信息化大会暨技术产品博览会在青岛红岛国际会展中心盛大开幕。本次会议,海康威视以“智汇高速
2025-03-28 19:36:00
强强联手!安璟汇集团与山西特医食品科技战略签约,共筑精准营养健康生态
2025年3月20日,安璟汇六周年战略盛典暨客户答谢会现场迎来震撼时刻:山西特医食品科技董事长赵晋彪、副总经理赵子谦,与安璟汇集团签署2025战略合作协议
2025-03-28 19:45:00
天齐锂业二代接班首年巨亏79亿 创始人声援:充满信心
快科技3月28日消息,近日,国内锂资源龙头天齐锂业股份有限公司举行2024年度业绩说明会。值得关注的是,在刚刚过去的2024年
2025-03-28 15:06:00