• 我的订阅
  • 头条热搜
MSRA:视觉生成六大技术问题
文生图、文生视频,视觉生成赛道火热,但仍存在亟需解决的问题。微软亚洲研究院研究员古纾旸对此进行了梳理,他认为视觉信号拆分是最本质的问题。生成模型的目标是拟合目标数据分布,然而,目标数据分布过于复杂,...……更多
OpenAI发布文生视频模型Sora,奥尔特曼选取网友提示词
...能准确呈现细节,还能理解物体在物理世界中的存在,并生成具有丰富情感的角色。该模型还可以根据提示、静止图像甚至填补现有视频中的缺失帧来生成视频。一位时髦女士漫步在东京街头,周围是温暖闪烁的霓虹灯和动感的...……更多
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
...模型Sora因其“逼真”和“富有想象力”被广泛赞誉,其生成视频可达60秒也颠覆了传统视频生成领域平均只有4秒的视频生成长度。OpenAI官网介绍,Sora是一种扩散模型,它从看起来像静态噪声的视频开始生成视频,然后通过多个...……更多
最新美国国家人工智能科学院院士介绍
...言处理技术的实际应用具有重要意义,为智能问答、文本生成和机器翻译等任务提供了更好的解决方案。LucasBeyer,来自谷歌人工智能实验室。他在计算机视觉领域取得了重大突破,特别是在图像识别和物体检测方面,为谷歌的...……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
...也不容易,因为我们需要的是多模态数据,但LLM无法直接生成图像,DALL-E、Stable Diffusion等图像生成模型又无法同步生成文本。一个直觉的解决方案是将二者结合在一起,直接生成但文生图模型实际上很难对图像细节做到细微精...……更多
苹果300亿参数大模型首亮相,还买了家AI公司|焦点分析
...谨慎,他觉得苹果工作模式是先做再说,“我认为苹果在生成式人工智能和人工智能方面存在着巨大的机会,而无需透露更多细节或超出自己的范围。”据The Information2023年9月的一次报道,苹果每天在人工智能上投资数百万美元...……更多
Meta 公司发布 Imagine Yourself AI 模型
...家 8 月 23 日消息,从社交媒体到虚拟现实,个性化图像生成因其在各种应用中的潜力而日益受到关注。传统方法通常需要针对每位用户进行大量调整,从而限制了效率和可扩展性,为此 Meta 公司创新提出了“Imagine Yourself” AI 模...……更多
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...阅读原文即可直达,包含评用于模型评测和预训练的数据生成代码) Hugging Face 链接:huggingface.co/vcr-org VCR 数据集简介为了开发 VCR 任务,研究人员构建了一个由图像 - 文字生成 VCR 合成图像的流程。在该流程中可以通过控制遮...……更多
Meta推出AI新模型VFusion3D,微美全息布局AIGC+3D内容加速产业转型升级
...,Meta(META.US)和牛津大学的研究人员开发了一种新的3D生成式AI模型VFusion3D,能够从单张图像或文本描述生成高质量的3D对象,可能会改变虚拟现实、游戏和数字设计等领域。AI新模型VFusion3D来袭据悉,VFusion3D界面简单直观,允...……更多
阿里国际发布最新开源多模态模型Ovis,多模态能力再升级
...像。与大型语言模型(LLMs)相比,大语言模型在处理和生成文本数据方面有专长,而多模态大模型能够处理非文本数据,如图像等等。根据多模态权威综合评测平台OpenCompass的数据,Ovis1.6-Gemma2-9B在30B参数以下的模型中取得了综...……更多
快手可灵大模型开放视频续写功能 可生成最长约3分钟视频
本文转自:中国新闻网快手的视频生成大模型“可灵”自面世以来,以其惊艳效果引发了国内外的广泛关注。 6月21日,可灵再度进化,正式推出图生视频功能,支持用任意静态图像生成5s视频,并且可搭配不同的文本内容,实...……更多
OpenAI推出生成式模型Sora,内容创作领域开启新纪元
...们生活的方方面面。而就在2月16日,OpenAI宣布推出全新的生成式人工智能模型“Sora”。据了解,通过文本指令,Sora可以直接输出长达60秒的视频,并且包含高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色。这意...……更多
...明团队发布了一项国际联合研究成果MDT,与人工智能文字生成视频大模型Sora核心组件DiT相比,训练速度提升10倍以上,再次刷新SoTA最佳图像生成质量和学习速度。近日,相关成果公布于预印本服务器arXiv。2024年初,美国OpenAI公...……更多
《卖身契》修复记:AI重现“打工人”喜剧魅力,留住老电影的黄
...首次将AIGC视觉大模型引入到影片修复,对大模型进行了生成质量和效率等方面的算法优化。如今随着Sora等大模型在视觉领域的发展,视觉大模型不仅运用在视频生成、修改、融合和延伸等多种场景,还可以应用到剪辑和特效制...……更多
2022生成模型进展有多快,新论文盘点9类生成模型代表作
ChatGPT的出现,彻底将生成AI推向爆发。但别忘了,AI生成模型可不止ChatGPT一个,光是基于文本输入的就有7种——图像、视频、代码、3D模型、音频、文本、科学知识……尤其2022年,效果好的AI生成模型层出不穷,又以OpenAI、Meta...……更多
单图解锁全景视角!北大/港中文/腾讯等推出ViewCrafter | 已开源
...腾讯等机构的研究人员提出,可以从单张或稀疏输入图像生成精确相机可控的新视角视频。还支持场景级文生3D、图生3D、以及稀疏视角重建等应用。目前论文和代码均已开源,并提供了在线Huggingface demo供用户使用。ViewCrafter:...……更多
最强开源文生图模型一夜易主!SD原班人马打造,要发SOTA视频生成模型
...图模型霸主Stable Diffusion原班人马,宣布推出全新的图像生成模型FLUX.1。FLUX.1包含专业版、开发者版、快速版三种模型,其中前两款模型击败SD3-Ultra等主流模型,较小规模的FLUX.1[schnell]也超越了Midjourney v6.0、DALL·E 3等更大的……更多
Meta版Sora深夜横空出世,小扎放出16秒高清大片!92页论文曝光技术细节,Llama 3架构立功
【新智元导读】Meta版Sora,就在刚刚惊艳来袭。Movie Gen可生成1080p、16秒、每秒16帧的高清长视频,还能生成音效、编辑视频、上传图像生成个性化视频。甚至Meta还放出了92页论文,模型架构、训练细节一并公开,干货满满!毫无...……更多
超越扩散模型!自回归新范式仅需2.9秒就生成高质量图像
...量子位 | 公众号 QbitAI超越扩散模型!自回归范式在图像生成领域再次被验证——中科大、哈工大、度小满等机构提出通用文生图模型STAR。仅需2.9秒就可生成高质量图像,超越当前一众包括SDXL在内扩散模型的性能。此外在生成图...……更多
AI生成式视频往何处去 “灵动 AI”亮相网易未来大会
...始人雷海波、AI绘画知名博主娜乌斯嘉三人,共同就《AI生成视频往何处去?》分享精彩观点,英诺天使基金合伙人王晟为本次对话主理人。 易子立首先教授表示,随着AI热潮的来临,很多企业已经在尝试使用AI工具,但文生图、...……更多
马斯克评OpenAI首个视频生成模型:人类认赌服输
OpenAI周四发布了首个视频生成模型Sora,并展示了几段效果炸裂的演示视频。一位X用户分享了Sora生成的一名女子在东京街头漫步的视频,并评论称:“OpenAI今天宣布了Sora,它使用混合扩散和变压器模型架构生成长达1分钟的视频...……更多
oppo首个端侧应用70亿参数大模型findx7系列
...FindX7系列首次实现端侧应用70亿参数的大语言模型,以及生成式的视觉模型,在保障用户隐私安全的情况下,带来响应更快、处理能力更强、生成质量更高的本地AI体验。” 得益于完整的端侧应用的AndesGPT70亿参数大语言模型,Fi...……更多
长上下文能力只是吹牛?最强GPT-4o正确率仅55.8%,开源模型不如瞎蒙
...了 LoCoVQA,一种带有干扰项的长上下文视觉问答 (VQA) 基准生成器。LoCoVQA可以提供与问题相关的图像序列,以及一组可配置的视觉干扰项,从而准确评估VLM如何在杂乱的上下文中仅提取与查询相关的信息。从原理上讲,这也是一...……更多
...球率先上线一站式AI长视频制作平台Clipfly,集合了AI视频生成、AI视频增强、视频编辑等功能,短短两个月已在海外拥有10万名用户。竞逐人工智能新赛道,很多初创公司“拿着锤子找钉子”,先做大模型,再去找应用场景,但实...……更多
AI画家的「滑铁卢」:为什么冰可乐不愿意住进茶杯里?
... 的要求时,会发生什么呢?在 2023 年 10 月大规模 AI 图像生成模型刚刚兴起时,我们便进行了这种尝试,得到了以下结果:考虑到 AI 模型更新换代带来的性能提升,我们在 2024 年 7 月又使用了最先进的模型进行了同样的尝试: ...……更多
刚刚,Llama 3.2 来了!支持图像推理,还有可在手机上运行的版本
... 1B 和 3B 版本,则都是纯文本模型,但也具备多语言文本生成和工具调用能力。Meta 表示,这些模型可让开发者构建个性化的、在设备本地上运行的通用应用 —— 这类应用将具备很强的隐私性,因为数据无需离开设备。在本地运...……更多
更快、更强、更可控:智谱“起舞弄清影”,视频生成卷出新高度!
智谱AI再次放大招,上线AI视频生成功能“清影”——曾被国际科技媒体The Information评为最有可能成为“中国OpenAI”5家企业之一的智谱AI,如今在视频生成领域再下一城。不同于至今没有对公众开放、“犹抱琵琶半遮面”的Sora,...……更多
Sam Altman或筹数十亿美元自造AI芯片,DeepMind首席科学家或将辞职创业
AI创投周报是阿尔法公社推出的聚焦于以生成式AI为代表的人工智能新浪潮的创投资讯周报。阿尔法公社希望发现和投资非凡创业者(AlphaFounders),相信非凡创业者们在技术、商业和社会方面的巨大推动力,他们指引着创投生态...……更多
麻省理工的科学家可以让最流行的人工智能图像生成器提速30倍
...在不影响质量的情况下,给像Dall·E3和Stable Diffusion这样的生成式人工智能系统带来了巨大的提振。一项新的研究表明,由于一项技术可以将整个100个阶段的过程浓缩为一步,流行的人工智能(AI)驱动的图像生成器的运行速度可...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...处理由区域同自由格式文本混合而成的输入,并可以无缝生成每个可定位对象的坐标和文本,由此在输出中定位所提及的对象。假设已经给定提取得出的图像特征图 Z ∈ R H×W×C 和二值化区域掩模 M,团队首先在 M 内随机采样 N ...……更多
更多关于科技的资讯:
全国首个万兆家庭云电竞PC在济南交付 开启云端游戏新场景
鲁网10月16日讯2025年10月13日,山东济南中铁逸都小区迎来全国通信与云游戏领域的一项重大突破——山东联通产互、济南联通联合华为完成全国首台万兆家庭云电竞PC的正式交付与开通
2025-10-16 11:58:00
□南京日报/紫金山新闻记者曹丽珍近期,金融机构2026年度秋季校园招聘大幕(以下简称秋招)开启。当前,金融行业数字化转型正在加速推进
2025-10-16 07:38:00
南报网讯(通讯员宁数轩记者马道军)10月15日,记者从市数据局了解到,由南京大数据集团牵头建设运营的南京数据要素创新中心——“宁数服”近日成功入选首批“江苏省数据产业公共示范平台”名单
2025-10-16 07:39:00
南报网讯(记者王国俊)10月13日,中国联通、中国移动、中国电信三大电信运营商相继官宣eSIM手机商用试验获批。昨天记者从南京相关运营商获悉
2025-10-16 07:39:00
千米产线“擀面皮” 火红钢坯变钢卷
以 “高智绿” 三重发力筑牢南京钢铁产业根基,探访梅钢热轧厂——千米产线“擀面皮” 火红钢坯变钢卷梅钢热轧产线厂房外景
2025-10-15 08:08:00
南报网讯(记者朱旖旎通讯员汪维)近日,栖霞区人工智能产业链新联会正式成立。这是我市首家聚焦于人工智能产业链的新联会,旨在搭建政企沟通桥梁
2025-10-15 08:08:00
厦门网讯(厦门日报记者 林露虹)10月16日—19日,2025厦门国际时尚周将在厦门中山路、鼓浪屿等文旅地标举行。本届时尚周以“自在发生”为主题
2025-10-15 08:21:00
河北日报讯(记者刘光昱)10月14日,为期3天的2025第十四届中国创新创业大赛新一代信息技术领域全国赛在雄安会展中心开赛
2025-10-15 08:24:00
“正大杯”2025年全球大学生就业创业实战大赛全国总决赛首轮赛事圆满收官
10月11日至13日,"正大杯"2025年全球大学生就业创业实战大赛全国总决赛首轮赛事在北京圆满举办。本届大赛以"创未来
2025-10-15 09:08:00
兴业银行“消保大模型智审平台”获评AIIA“2025年度人工智能金融专项优秀案例”
东南网龙岩10月14日讯(通讯员 肖夏玲)近日,在中国人工智能产业发展联盟(以下简称AIIA)、工业和信息化部新闻宣传中心
2025-10-15 09:40:00
京东11.11开场, 海外用户大件也包邮,收货更快更省
10月14日,京东11.11惊喜开放日在京举行。身处海外的华人用户,只需通过京东 APP 进入全球售平台,即可同步享受 “又好又便宜” 的购物体验
2025-10-15 09:45:00
锐志机械圆满收官PACK EXPO拉斯维加斯:聚焦纸袋包装的可持续发展
锐志机械圆满完成于9月29日至10月1日在拉斯维加斯举办的 PACK EXPO 参展工作。作为全球具有影响力的包装行业盛会之一
2025-10-15 10:08:00
百世软件推AI商品智能管理功能:一键上架,助力卖家高效出海
10月14日,百世集团旗下百世软件正式宣布,其面向海外市场的核心产品千易软件全新上线AI商品智能管理功能。该功能深度融合AI技术
2025-10-15 10:39:00
政府点单 企业接单 郑州航空港发布首批45个招商场景清单
大河网讯 近日,郑州航空港正式发布《郑州航空港区2025年第一批招商场景清单》,围绕十大产业集群系统性开放45个具体发展场景
2025-10-15 11:02:00
中国移动咪咕多部短剧获奖,闪耀2025视听中国马栏山微短剧之夜
2025年10月14日,“2025视听中国马栏山微短剧之夜”在湖南圆满落幕。此次活动由中国网络视听协会、湖南省广播电视局
2025-10-15 11:09:00