• 我的订阅
  • 头条热搜
SAM是如何做到“分割一切”的
本文转自:科技日报又一通用模型发布SAM是如何做到“分割一切”的视觉中国供图SAM是一类处理图像分割任务的通用模型。与以往只能处理某种特定类型图片的图像分割模型不同,SAM可以处理所有类型的图像。相比于以往的图...……更多
OpenAI发布文生视频模型Sora,奥尔特曼选取网友提示词
...凌晨,OpenAI再次扔出一枚深水炸弹,发布了首个文生视频模型Sora。据介绍,Sora可以直接输出长达60秒的视频,并且包含高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色。目前官网上已经更新了48个视频demo,在这...……更多
技术报告揭秘Sora六大核心优势,影视等行业面临颠覆
...。而这些视频全都是通过OpenAI2月15日发布的最新视频生成模型Sora制作的,用户震惊之余,也给予了Sora高度评价,将其描述为“绝无仅有”和“游戏规则改变者”。图片来源:X平台Sora采用了OpenAI文生图模型DALL-E3背后的强大技术...……更多
OpenAI空降视频生成模型:一口气生成60s,风格画质尺寸灵活定制 | 最前线
...被打破——OpenAI又出王炸,发布了可以生成60秒视频的AI模型Sora。OpenAI官宣Sora。同样在2月16日发布的谷歌最新多模态模型Gemini Pro 1.5,则被Sora迅速夺走了关注度。网友为Gemini和Sora制作的梗图。根据OpenAI官方发布的推文和技术报...……更多
马斯克评OpenAI首个视频生成模型:人类认赌服输
OpenAI周四发布了首个视频生成模型Sora,并展示了几段效果炸裂的演示视频。一位X用户分享了Sora生成的一名女子在东京街头漫步的视频,并评论称:“OpenAI今天宣布了Sora,它使用混合扩散和变压器模型架构生成长达1分钟的视频...……更多
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5”
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5” 3月14日,商汤科技发布多模态多任务通用大模型“书生(INTERN)2.5”,在多模态多任务处理能力方面实现多项全新突破,其卓越的图文跨模态开放任务处理能力可...……更多
deepmind研究:未知物体也能轻松识别分割
...DetCon和ReLICv2。 除此之外,Odin方法不仅可以应用在ResNet模型中,还可以应用到更复杂的模型中,如SwimTransformer。在数据上,Odin框架学习的优势很明显,那在可视化的图像中,Odin的优势在何处体现了呢?将使用Odin生成的分割图...……更多
快速准确定位识别生物大分子 中国团队基于人工智能研究提出新方法
...DeepETPicker优选简化标签来替代真实标签,并采用更高效的模型架构、更丰富的数据增强技术和重叠分区策略来提升小训练集时模型的性能;为提高颗粒定位的速度,DeepETPicker采用图形处理器(GPU)加速的平均池化-非极大值抑制后处...……更多
OpenAI发布首个文生视频模型Sora,网友:工作要丢了!
...凌晨,OpenAI再次扔出一枚深水炸弹,发布了首个文生视频模型Sora。据介绍,Sora可以直接输出长达60秒的视频,并且包含高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色。目前官网上已经更新了48个视频demo,在这...……更多
高斯混合模型在概率建模中的应用
...模方法逐渐成为实现复杂问题的关键手段之一。高斯混合模型(GaussianMixtureModel,简称GMM)作为一种经典的概率建模技术,已经被广泛地应用于数据挖掘、模式识别、图像处理等领域。本文将介绍什么是高斯混合模型,它的基本...……更多
美女刷屏真假难辨网友:警惕ai网恋诈骗
...岗”。根据各帖子发布者透露,这些AI照片都出自同一个模型,Chilloutmix。 多个模型融合进化,照片级AI诞生ChilloutMix,二月初出现在模型分享社区CivitAI(不少爱好者称之为c站)。不到两周时间,下载数量超过5万。简单来说,...……更多
迎战GPT-4V!谷歌PaLI-3视觉语言模型问世,更小、更快、更强
...况,这一举动引起了业界的广泛关注。然而,在视觉语言模型的角逐中,谷歌也不甘示弱。 近日,Google Research、Google DeepMind 和 Google Cloud 共同推出了一个更小、更快、更强大的视觉语言模型(VLM)——PaLI-3,该模型与相似的体...……更多
AI视觉迎GPT-3时刻!国内市场规模将达6000亿 受益上市公司梳理
AI视觉领域迎来新模型“炸场”,图像识别门槛大幅降低。据财联社报道,Meta上周三发布了一个人工智能模型,可以从图像中挑选出单个对象,以及一个图像注释数据集。该模型名为Segment Anything Model(SAM),Meta官方表示这是有...……更多
微美全息构建基于深度迁移学习的图像分类融合模型, 提高图像分类的准确性和效率
...美全息(NASDAQ:WIMI)构建基于深度迁移学习的图像分类融合模型,提高图像分类的准确性和效率深度学习在计算机视觉领域得到越来越广泛的应用,尤其是在图像分类任务上。然而,由于数据集的限制和模型的复杂性,深度学习模...……更多
2023 的人工智能之年
...风格或纹理应用于文字和短语。Midjourney:Midjourney 的 V.5 模型在图像生成领域是一个重要的里程碑,它展示了在效率、连贯性和高分辨率方面的显著改进。最新的 alpha 版本,Midjourney V.6,引入了额外的增强功能,如更精准的提示...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...构成威胁,Arm 和台积电将获胜。”有网友说到苹果在大模型发展上的状况。也有网友认为,苹果在大模型上的发力将为其在未来的手机市场竞争中带来优势。他们认为,开源模型加上移动设备的本地数据,即本地化的原生 LLM,...……更多
本周硅谷发生了什么?| 高通第三代骁龙8;谷歌20亿美元追投Anthropic;联想拿出能跑大模型个人PC
...on CPU、骁龙8 Gen3等在内的王炸产品,后有联系拿出能跑大模型的个人PC。还有谷歌20亿追投Anthropic,并曝光多模态模型Gemini和工具Stubbs,将为用户更多便捷和创新的应用开发方式。Meta公布第三季度财报,实现23%的营收增长,是公...……更多
本文转自:中国科学报南开大学等让人工智能模型训练提速10倍以上本报讯(通讯员高雨桐 记者陈彬)南开大学、南开国际先进研究院(深圳福田)教授程明明团队发布了一项国际联合研究成果MDT,与人工智能文字生成视频大...……更多
非接触式结构光三维扫描技术的优势凸显
...有各自的技术优势,但也存在一定的不足,如创建完一个模型后,还需要专业软件对模型进行后处理,以及对于扫描光源环境的匹配度,不能做到控制自如等。国内全栈式3D数字化解决方案提供商积木易搭推出了一款基于非接触...……更多
最新美国国家人工智能科学院院士介绍
...。他在自然语言处理领域取得了显著成果,特别是在语言模型和对话系统方面。Zhu的工作使得机器能够更自然地与人类进行交互,提高了智能助手的性能和用户体验。RichardSutton,强化学习之父、阿尔伯塔大学教授。他对强化学...……更多
《卖身契》修复记:AI重现“打工人”喜剧魅力,留住老电影的黄
...香港电影修复计划”中,技术人员就曾首次将AIGC视觉大模型引入到影片修复,对大模型进行了生成质量和效率等方面的算法优化。如今随着Sora等大模型在视觉领域的发展,视觉大模型不仅运用在视频生成、修改、融合和延伸等...……更多
...,并基于该标注数据提取不同颜色空间的特征训练决策树模型。为了保证结果的鲁棒性,作者使用5张不同情况下的图像,包括晴天、阴影、光反射、雨天等,从图像中选取135000个像素进行训练,经过消除噪声等步骤后生成的掩...……更多
Sora技术报告揭秘6大核心优势,AGI或在1年内实现?
◎当地时间2月15日,OpenAI发布了最新的视频生成模型Sora。出色的视频制作能力瞬间“点燃”科技圈。英伟达人工智能研究院首席研究科学家JimFan直言,这是视频生成领域的GPT-3时刻。360集团创始人、董事长周鸿祎则称,随着Sora...……更多
meta推出两款基于ai的图像编辑工具
...AI工具的更多信息,IT之家整理如下。官方介绍称,EmuEdit模型仅用文字指令就可以准确编辑图像,而通过分解文字转视频(Text-to-Video,T2V)的生成过程,开发团队公布了一种名为EmuVideo的方法,可以改善最终生成视频的品质和多...……更多
腾讯和清华大学联合推出全新图生视频模型
...,腾讯和清华大学、香港科技大学联合推出全新图生视频模型“Follow-Your-Click”,目前已经上架GitHub(代码四月公开),同时还发表了一篇研究论文(IT之家附DOI:2403.08268)。这款图生视频模型主要功能包括局部动画生成和多对象...……更多
Sora冲击波
...,OpenAI再投一颗“深水炸弹”,毫无预兆发布的文生视频模型Sora,让AI圈又一次“一夜变天”。一是时长,二是逼真程度,Sora实现了两个老大难问题的同时解决,以至于外界毫不吝啬地将其形容为“颠覆性”的存在。360创始人...……更多
标贝科技上亿像素点图像标注能力 实现标注精度和效率双提升
【每日科技网】国内大模型的发展如火如荼,也给其背后的推手——数据标注行业再添一把火。同时伴随细分领域垂类大模型越来越多,数据需求向精细化、场景化发展,需要使用更大像素、更高分辨率的图像以提供丰富细致...……更多
一文读懂安检机器的工作原理
...确性。现有的多视角X射线安检设备包括单射线源多视角模型和垂直式多视角模型等。下图展示了这两种模型的结构。单射线源多视角模型 |图源[5]上图布局将同一射线源发出的射线分成平行的两束,分别照射在传送带的不同位置...……更多
Sora刷屏视频出现多处失误 模拟真实世界仍需闯关
...这样的AI系统理解物理世界,生成视频的过程与基于世界模型的因果预测完全不同。翻阅OpenAI披露的数十份视频,杨立昆的观点具体表现为老奶奶吹蜡烛火苗却不动、东京街头步伐错误的女郎、玻璃杯碎后错误的液体流向、在跑...……更多
当Sora能做真实的3D视频,离它能设计战舰也就不远了
...以及表情生动的多角色。其实,早在Sora之前,AI视频生成模型领域就已经打得热火朝天了。最初是Runway和Midjourney你追我赶。2023年2月初,Runway首次推出Gen-1,并在6月份开放了第二代Gen-2。Gen-2通过文本、图片、文本+图片,采用扩...……更多
更多关于科技的资讯:
AI也怕“没电”?盖茨砸10亿美元建核电站,科技巨头们如何布局
美国电力研究所的分析发现,到2030年,数据中心将消耗美国4.6%到9.1%的电力。上周,比尔·盖茨投资10亿美元兴建的核电站在美国怀俄明州破土动工
2024-06-18 08:48:00
下半年一大波搭载骁龙芯片的新机蓄势待发
随着时间的推移,数码领域的竞争愈发激烈,尤其是在芯片领域。当下,随着六月的来临,下半年一大波搭载骁龙芯片的新机发布已蓄势待发
2024-06-18 08:48:00
vivox100ultra,顶级器件+前沿算法的综合体
去年vivoX系列数字家族的打头机型是X90Pro+,而到了今年X100系列,顶级版本首次引入了Ultra这个概念,也就是说
2024-06-18 08:47:00
三星galaxywatchultra外观曝光
眼看发布的时间越来越逼近,关于三星GalaxyWatchUltra随之而来,更新一波的外观图片又被曝光出来了。从图片中我们可以看到
2024-06-18 08:57:00
618购物狂欢节,这3部手机成为心仪之选?
618购物狂欢节如火如荼,这3部手机可以说是销量猛涨,成为公认地值得买!这期间,不少人免不了买买买,而你又是否也在这股热潮中寻觅到了心仪之选
2024-06-18 08:50:00
vivoy28s5g即将发布,采用平直边缘设计
vivo即将推出新款Y系列智能手机——vivoY28s5G,该手机已出现在NCC认证数据库中。根据认证信息显示,这款手机采用平直边缘设计
2024-06-18 09:05:00
vivos19pro的优点在哪里?
每个女孩子的手机里,大概都有一个必备软件:美图秀秀。数据显示,美图秀秀全球月活用户量达到夸张的1.3亿,稳居国内图片编辑类软件第一名
2024-06-18 09:00:00
vivo手机s系列和x系列该如何选择?
vivo手机深受用户喜爱,做工质量和售后服务都有保障,拍照体验还很不错,有一大批忠实用户,目前vivo手机共有3个系列
2024-06-18 08:59:00
watchos11终于允许用户更换默认铃声了
6月18日消息,watchOS11系统为AppleWatch用户带来了众多新功能,涵盖健康追踪、健身增强、实时活动、翻译应用以及新表盘
2024-06-18 09:06:00
今年以来,随着“以旧换新”政策的深入推进和市场的不断变化,莘县澳新电器服务有限公司紧跟时代步伐,不断创新营销策略和服务模式
2024-06-18 09:07:00
手机摄像头像素的详细解释
要了解手机的像素,通常是指手机的摄像头像素。手机摄像头像素通常用万像素(MP)表示,代表着摄像头的分辨率和拍摄画质。在选择手机时
2024-06-18 09:02:00
iphone17系列将采用全新的设计和制造工艺
众所周知,这几年的iPhone手机挤牙膏的技术还是很夸张的,从新机的配置特性上进行区别,就连iOS系统也是如此。尤其是苹果首次推出基于大模型的人工智能服务——AppleIntelligence
2024-06-18 09:02:00
ai文案自动扣图技术的发展
自职业生涯伊始,我便致力于寻找提高工作效率之工具。人工智能(AI)技术的兴起,对我的工作产生了深远影响。尤其是AI文案自动扣图工具
2024-06-18 09:04:00
findx7系列,是2024年最强封神旗舰!
看来FindX7系列,就是2024年最强封神旗舰!熟悉FindX7Ultra的朋友应该都知道,这款产品在影像方面的硬件堆料是十分给力
2024-06-18 08:58:00
当心理学装上了AI的大脑,学科将去向何方
“我们处在一个前所未有的进化十字路口。”清华大学心理与认知科学系主任刘嘉认为,人工智能(AI)的出现将提供一个全新的互动
2024-06-18 09:08:00