• 我的订阅
  • 头条热搜
MSRA:视觉生成六大技术问题
文生图、文生视频,视觉生成赛道火热,但仍存在亟需解决的问题。微软亚洲研究院研究员古纾旸对此进行了梳理,他认为视觉信号拆分是最本质的问题。生成模型的目标是拟合目标数据分布,然而,目标数据分布过于复杂,...……更多
OpenAI发布文生视频模型Sora,奥尔特曼选取网友提示词
...能准确呈现细节,还能理解物体在物理世界中的存在,并生成具有丰富情感的角色。该模型还可以根据提示、静止图像甚至填补现有视频中的缺失帧来生成视频。一位时髦女士漫步在东京街头,周围是温暖闪烁的霓虹灯和动感的...……更多
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
...模型Sora因其“逼真”和“富有想象力”被广泛赞誉,其生成视频可达60秒也颠覆了传统视频生成领域平均只有4秒的视频生成长度。OpenAI官网介绍,Sora是一种扩散模型,它从看起来像静态噪声的视频开始生成视频,然后通过多个...……更多
最新美国国家人工智能科学院院士介绍
...言处理技术的实际应用具有重要意义,为智能问答、文本生成和机器翻译等任务提供了更好的解决方案。LucasBeyer,来自谷歌人工智能实验室。他在计算机视觉领域取得了重大突破,特别是在图像识别和物体检测方面,为谷歌的...……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
...也不容易,因为我们需要的是多模态数据,但LLM无法直接生成图像,DALL-E、Stable Diffusion等图像生成模型又无法同步生成文本。一个直觉的解决方案是将二者结合在一起,直接生成但文生图模型实际上很难对图像细节做到细微精...……更多
南洋理工大学开发3D编辑技术MVDrag3D ,只需拖拽就能实现精准P图
...构,使得复杂的结构编辑(如明显的拓扑变化或新纹理的生成)非常繁琐而难以实现。近年来,一部分学者利用基于 3D 高斯模型的方法提高了 3D 编辑的灵活性,但仍面临着优化时间长或过度饱和的问题,并且在实现大规模结构...……更多
苹果300亿参数大模型首亮相,还买了家AI公司|焦点分析
...谨慎,他觉得苹果工作模式是先做再说,“我认为苹果在生成式人工智能和人工智能方面存在着巨大的机会,而无需透露更多细节或超出自己的范围。”据The Information2023年9月的一次报道,苹果每天在人工智能上投资数百万美元...……更多
下载次数破39万!CMU、Meta联合发布VQAScore文生图优化方案:Imagen3已采用
...导读】VQAScore是一个利用视觉问答模型来评估由文本提示生成的图像质量的新方法;GenAI-Bench是一个包含复杂文本提示的基准测试集,用于挑战和提升现有的图像生成模型。两个工具可以帮助研究人员自动评估AI模型的性能,还能...……更多
与OpenAI o1技术理念相似,TDPO-R算法有效缓解奖励过优化问题
...型和大模型对齐。OpenAI 最近发布的 o1 模型在数学、代码生成和长程规划等复杂任务上取得了突破性进展,据业内人士分析披露,其关键技术在于基于强化学习的搜索与学习机制。通过迭代式的自举过程,o1 基于现有大语言模型...……更多
Meta 公司发布 Imagine Yourself AI 模型
...家 8 月 23 日消息,从社交媒体到虚拟现实,个性化图像生成因其在各种应用中的潜力而日益受到关注。传统方法通常需要针对每位用户进行大量调整,从而限制了效率和可扩展性,为此 Meta 公司创新提出了“Imagine Yourself” AI 模...……更多
新扩散模型OmniGen一统图像生成,架构还高度简化、易用
大型语言模型(LLM)的出现统一了语言生成任务,并彻底改变了人机交互。然而,在图像生成领域,能够在单一框架内处理各种任务的统一模型在很大程度上仍未得到探索。近日,智源推出了新的扩散模型架构 OmniGen,一种新的...……更多
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...阅读原文即可直达,包含评用于模型评测和预训练的数据生成代码) Hugging Face 链接:huggingface.co/vcr-org VCR 数据集简介为了开发 VCR 任务,研究人员构建了一个由图像 - 文字生成 VCR 合成图像的流程。在该流程中可以通过控制遮...……更多
Meta推出AI新模型VFusion3D,微美全息布局AIGC+3D内容加速产业转型升级
...,Meta(META.US)和牛津大学的研究人员开发了一种新的3D生成式AI模型VFusion3D,能够从单张图像或文本描述生成高质量的3D对象,可能会改变虚拟现实、游戏和数字设计等领域。AI新模型VFusion3D来袭据悉,VFusion3D界面简单直观,允...……更多
从未见过现实世界数据,MIT在虚拟环境中训练出机器狗,能跑酷
...是 pi 的数据都会少七八个数量级。MIT 的这个团队希望用生成模型来作为机器人学习的新数据源,用工程手段来取代传统的数据收集,实现一条通过由生成模型加持的物理仿真来训练机器人视觉的技术路线。随着机器人在训练过...……更多
阿里国际发布最新开源多模态模型Ovis,多模态能力再升级
...像。与大型语言模型(LLMs)相比,大语言模型在处理和生成文本数据方面有专长,而多模态大模型能够处理非文本数据,如图像等等。根据多模态权威综合评测平台OpenCompass的数据,Ovis1.6-Gemma2-9B在30B参数以下的模型中取得了综...……更多
快手可灵大模型开放视频续写功能 可生成最长约3分钟视频
本文转自:中国新闻网快手的视频生成大模型“可灵”自面世以来,以其惊艳效果引发了国内外的广泛关注。 6月21日,可灵再度进化,正式推出图生视频功能,支持用任意静态图像生成5s视频,并且可搭配不同的文本内容,实...……更多
...明团队发布了一项国际联合研究成果MDT,与人工智能文字生成视频大模型Sora核心组件DiT相比,训练速度提升10倍以上,再次刷新SoTA最佳图像生成质量和学习速度。近日,相关成果公布于预印本服务器arXiv。2024年初,美国OpenAI公...……更多
OpenAI推出生成式模型Sora,内容创作领域开启新纪元
...们生活的方方面面。而就在2月16日,OpenAI宣布推出全新的生成式人工智能模型“Sora”。据了解,通过文本指令,Sora可以直接输出长达60秒的视频,并且包含高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色。这意...……更多
Adobe推视频生成大杀器!最长生成5秒视频,一键重拍成为现实,已开放公测
...消息,10月14日,Adobe在Adobe MAX大会上宣布推出Firefly视频生成模型,并强化了现有的图像、矢量和设计模型。Firefly视频模型已进入有限公开测试阶段,成为首个可安全用于商业用途的生成式AI视频模型。最新的Firefly图像模型Firefly...……更多
《卖身契》修复记:AI重现“打工人”喜剧魅力,留住老电影的黄
...首次将AIGC视觉大模型引入到影片修复,对大模型进行了生成质量和效率等方面的算法优化。如今随着Sora等大模型在视觉领域的发展,视觉大模型不仅运用在视频生成、修改、融合和延伸等多种场景,还可以应用到剪辑和特效制...……更多
2022生成模型进展有多快,新论文盘点9类生成模型代表作
ChatGPT的出现,彻底将生成AI推向爆发。但别忘了,AI生成模型可不止ChatGPT一个,光是基于文本输入的就有7种——图像、视频、代码、3D模型、音频、文本、科学知识……尤其2022年,效果好的AI生成模型层出不穷,又以OpenAI、Meta...……更多
单图解锁全景视角!北大/港中文/腾讯等推出ViewCrafter | 已开源
...腾讯等机构的研究人员提出,可以从单张或稀疏输入图像生成精确相机可控的新视角视频。还支持场景级文生3D、图生3D、以及稀疏视角重建等应用。目前论文和代码均已开源,并提供了在线Huggingface demo供用户使用。ViewCrafter:...……更多
最强开源文生图模型一夜易主!SD原班人马打造,要发SOTA视频生成模型
...图模型霸主Stable Diffusion原班人马,宣布推出全新的图像生成模型FLUX.1。FLUX.1包含专业版、开发者版、快速版三种模型,其中前两款模型击败SD3-Ultra等主流模型,较小规模的FLUX.1[schnell]也超越了Midjourney v6.0、DALL·E 3等更大的……更多
Meta版Sora深夜横空出世,小扎放出16秒高清大片!92页论文曝光技术细节,Llama 3架构立功
【新智元导读】Meta版Sora,就在刚刚惊艳来袭。Movie Gen可生成1080p、16秒、每秒16帧的高清长视频,还能生成音效、编辑视频、上传图像生成个性化视频。甚至Meta还放出了92页论文,模型架构、训练细节一并公开,干货满满!毫无...……更多
超越扩散模型!自回归新范式仅需2.9秒就生成高质量图像
...量子位 | 公众号 QbitAI超越扩散模型!自回归范式在图像生成领域再次被验证——中科大、哈工大、度小满等机构提出通用文生图模型STAR。仅需2.9秒就可生成高质量图像,超越当前一众包括SDXL在内扩散模型的性能。此外在生成图...……更多
扩散模型训练方法一直错了!谢赛宁:Representation matters
...我们可能一直都在用错误的方法训练扩散模型。」即使对生成模型而言,表征也依然有用。基于此,他们提出了 REPA,即表征对齐技术,其能让「训练扩散 Transformer 变得比你想象的更简单。」Yann LeCun 也对他们的研究表示了认可...……更多
AI生成式视频往何处去 “灵动 AI”亮相网易未来大会
...始人雷海波、AI绘画知名博主娜乌斯嘉三人,共同就《AI生成视频往何处去?》分享精彩观点,英诺天使基金合伙人王晟为本次对话主理人。 易子立首先教授表示,随着AI热潮的来临,很多企业已经在尝试使用AI工具,但文生图、...……更多
多模态竞技场对标90B Llama 3.2!Pixtral 12B技术报告全公开
...小变化可能会极大地改变某些模型的性能(比如要求模型生成与参考答案完全匹配时,6.0和6就可能是不同的)。 为了缓解这个问题,作者建议使用「Explicit」提示来明确指定参考答案所需的格式。多模态性能上表显示,在多模...……更多
马斯克评OpenAI首个视频生成模型:人类认赌服输
OpenAI周四发布了首个视频生成模型Sora,并展示了几段效果炸裂的演示视频。一位X用户分享了Sora生成的一名女子在东京街头漫步的视频,并评论称:“OpenAI今天宣布了Sora,它使用混合扩散和变压器模型架构生成长达1分钟的视频...……更多
oppo首个端侧应用70亿参数大模型findx7系列
...FindX7系列首次实现端侧应用70亿参数的大语言模型,以及生成式的视觉模型,在保障用户隐私安全的情况下,带来响应更快、处理能力更强、生成质量更高的本地AI体验。” 得益于完整的端侧应用的AndesGPT70亿参数大语言模型,Fi...……更多
更多关于科技的资讯:
“透视眼”诞生!西工大光子CT核心技术取得重大突破
当一束X射线穿透身体,骨骼、肺部等组织的形态和结构就能清晰呈现,帮助医生诊断疾病。如今,一种更为“聪明”的CT技术正崭露头角——它不仅能“看见”你骨骼里的每一条裂缝
2025-06-01 17:38:00
奥运科技邂逅青春节拍!泰山瑞豹燃爆2025德州天衢新区新青年音乐节
大众网记者 张晓琳 徐瑞 德州报道5月31日,在金辰地产·2025德州天衢新区新青年音乐节的沸腾人海中,一群年轻人围在一辆碳纤维自行车旁
2025-06-01 19:34:00
杭州发放新一批补贴、消费券!包括手机、平板等
好消息:杭州萧山区、临平区、钱塘区发放新一轮消费补贴及消费券。其中,购买手机、平板、智能手表(手环)三大类消费电子产品
2025-06-01 19:43:00
全程可视+人车智慧匹配,青岛机场上线新功能,打网约车更方便了
齐鲁晚报·齐鲁壹点记者 赵波5月30日,青岛机场智慧候车系统正式上线试运行,该系统对网约车上客区进行系统改造,完成“硬件扩容+智慧系统”双阶段升级
2025-06-01 20:58:00
大众网记者 祝雅堃 菏泽报道促消费、惠民生,菏泽市在促消费、惠民生的道路上成效显著。随着各种政策利好不断叠加,线下消费体验的持续回暖
2025-06-01 22:27:00
大众网记者 祝雅堃 菏泽报道6月1日上午,菏泽汽车站旁热闹非凡,备受瞩目的菏泽汽车站天猫电器城市体验店正式开业。据悉,该店以“新零售
2025-06-01 22:37:00
2025好网民·在山东|医疗信息化战线的“网络卫士”——记济阳区精神卫生中心高级工程师董孟浩
在济南市济阳区精神卫生中心,有这样一位特殊的“白衣卫士”。他不是临床医生,却用代码和算法守护着患者的生命数据;他不拿手术刀
2025-06-01 11:32:00
2025好网民·在山东|刘旨夷:嘉祥疾控人深耕新媒体健康科普 用镜头守护全民健康防线
“预防大于治疗” 这是嘉祥县疾病预防控制中心健康教育科刘旨夷始终秉持的理念。她敏锐洞察到健康知识传播的时代需求,毅然转战健康教育岗位
2025-06-01 11:34:00
安顺啤酒“产品升级+口味创新” “小产业”释放“大能量”
初夏傍晚,安顺街头巷尾夜市飘来阵阵麦香,琥珀色的啤酒在杯盏间泛起细密泡沫。这一抹沁人心脾的清凉背后,正涌动着年产值上亿的产业浪潮
2025-06-01 11:53:00
菲仕兰张展红谈战略:三个关键词驱动双位数增长
5月30日下午,荷兰皇家菲仕兰专业营养品中国总裁张展红出席由菲仕兰联合中国乳制品工业协会共同主办的2025中国奶商指数发布会暨牛奶嘉年华活动
2025-06-01 13:19:00
5月30日,在萧山经济技术开发区海归小镇·传化科技城,2025杭州市海外高层次人才创新创业大赛数字医药特别专项赛开启“创客彩虹桥”路演活动
2025-06-01 08:55:00
FIFA世俱杯海信AI球迷大巴即将发车,以AI科技重塑足球观赛体验
5月31日,2025FIFA世俱杯海信AI球迷大巴城市巡游山东站活动将在济南泉城广场开启。作为2025FIFA世俱杯首个全球官方合作伙伴
2025-06-01 02:26:00
海信璀璨505U6真空冰箱双奖加冕 开启分子级锁鲜新时代
5月22日,在由中国家用电器协会指导、中国家电网主办的“AI无境 鲜美无界——2025中国冰箱行业高峰论坛”上,海信璀璨505U6真空冰箱以颠覆性的保鲜技术与市场表现
2025-06-01 02:30:00
全自动化无人生产车间!力诺瑞特正式投产世界首座太阳能集热器黑灯工厂
大众网记者 魏现芳 济南报道在《民营经济促进法》正式颁布实施之际,继2024年9月28日空气源热泵数智工厂投产之后,力诺瑞特于5月29日迎来发展历程中的又一高光时刻——正式投产世界首座太阳能平板集热器“黑灯工厂”
2025-06-01 02:35:00
容声515方糖冰箱双料夺冠,引领健康除菌新风尚!
5月22日,在由中国家用电器协会指导、中国家电网主办的“AI无境 鲜美无界——2025中国冰箱行业高峰论坛”上,容声515方糖冰箱凭借创新的健康除菌技术与市场表现
2025-06-01 02:26:00