• 我的订阅
  • 头条热搜
SAM是如何做到“分割一切”的
本文转自:科技日报又一通用模型发布SAM是如何做到“分割一切”的视觉中国供图SAM是一类处理图像分割任务的通用模型。与以往只能处理某种特定类型图片的图像分割模型不同,SAM可以处理所有类型的图像。相比于以往的图...……更多
OpenAI发布文生视频模型Sora,奥尔特曼选取网友提示词
...凌晨,OpenAI再次扔出一枚深水炸弹,发布了首个文生视频模型Sora。据介绍,Sora可以直接输出长达60秒的视频,并且包含高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色。目前官网上已经更新了48个视频demo,在这...……更多
技术报告揭秘Sora六大核心优势,影视等行业面临颠覆
...。而这些视频全都是通过OpenAI2月15日发布的最新视频生成模型Sora制作的,用户震惊之余,也给予了Sora高度评价,将其描述为“绝无仅有”和“游戏规则改变者”。图片来源:X平台Sora采用了OpenAI文生图模型DALL-E3背后的强大技术...……更多
OpenAI空降视频生成模型:一口气生成60s,风格画质尺寸灵活定制 | 最前线
...被打破——OpenAI又出王炸,发布了可以生成60秒视频的AI模型Sora。OpenAI官宣Sora。同样在2月16日发布的谷歌最新多模态模型Gemini Pro 1.5,则被Sora迅速夺走了关注度。网友为Gemini和Sora制作的梗图。根据OpenAI官方发布的推文和技术报...……更多
马斯克评OpenAI首个视频生成模型:人类认赌服输
OpenAI周四发布了首个视频生成模型Sora,并展示了几段效果炸裂的演示视频。一位X用户分享了Sora生成的一名女子在东京街头漫步的视频,并评论称:“OpenAI今天宣布了Sora,它使用混合扩散和变压器模型架构生成长达1分钟的视频...……更多
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5”
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5” 3月14日,商汤科技发布多模态多任务通用大模型“书生(INTERN)2.5”,在多模态多任务处理能力方面实现多项全新突破,其卓越的图文跨模态开放任务处理能力可...……更多
deepmind研究:未知物体也能轻松识别分割
...DetCon和ReLICv2。 除此之外,Odin方法不仅可以应用在ResNet模型中,还可以应用到更复杂的模型中,如SwimTransformer。在数据上,Odin框架学习的优势很明显,那在可视化的图像中,Odin的优势在何处体现了呢?将使用Odin生成的分割图...……更多
快速准确定位识别生物大分子 中国团队基于人工智能研究提出新方法
...DeepETPicker优选简化标签来替代真实标签,并采用更高效的模型架构、更丰富的数据增强技术和重叠分区策略来提升小训练集时模型的性能;为提高颗粒定位的速度,DeepETPicker采用图形处理器(GPU)加速的平均池化-非极大值抑制后处...……更多
OpenAI发布首个文生视频模型Sora,网友:工作要丢了!
...凌晨,OpenAI再次扔出一枚深水炸弹,发布了首个文生视频模型Sora。据介绍,Sora可以直接输出长达60秒的视频,并且包含高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色。目前官网上已经更新了48个视频demo,在这...……更多
美女刷屏真假难辨网友:警惕ai网恋诈骗
...岗”。根据各帖子发布者透露,这些AI照片都出自同一个模型,Chilloutmix。 多个模型融合进化,照片级AI诞生ChilloutMix,二月初出现在模型分享社区CivitAI(不少爱好者称之为c站)。不到两周时间,下载数量超过5万。简单来说,...……更多
高斯混合模型在概率建模中的应用
...模方法逐渐成为实现复杂问题的关键手段之一。高斯混合模型(GaussianMixtureModel,简称GMM)作为一种经典的概率建模技术,已经被广泛地应用于数据挖掘、模式识别、图像处理等领域。本文将介绍什么是高斯混合模型,它的基本...……更多
迎战GPT-4V!谷歌PaLI-3视觉语言模型问世,更小、更快、更强
...况,这一举动引起了业界的广泛关注。然而,在视觉语言模型的角逐中,谷歌也不甘示弱。 近日,Google Research、Google DeepMind 和 Google Cloud 共同推出了一个更小、更快、更强大的视觉语言模型(VLM)——PaLI-3,该模型与相似的体...……更多
AI视觉迎GPT-3时刻!国内市场规模将达6000亿 受益上市公司梳理
AI视觉领域迎来新模型“炸场”,图像识别门槛大幅降低。据财联社报道,Meta上周三发布了一个人工智能模型,可以从图像中挑选出单个对象,以及一个图像注释数据集。该模型名为Segment Anything Model(SAM),Meta官方表示这是有...……更多
你真的知道“渲染引擎”吗?一文看懂
...染、创造逼真视觉效果的关键组件,负责将二维或三维的模型、纹理、光照等数据,转化为人们肉眼可见的二维图像。渲染引擎的工作原理基于计算机图形学和视觉感知理论。它首先接收来自应用程序的几何数据(如顶点坐标/...……更多
李飞飞空间智能之后,上交、智源、北大提出空间大模型SpatialBot
...成绩在东南大学取得学士学位。他的研究兴趣为多模态大模型、具身智能。此工作为其在上海交通大学访问和北京智源人工智能研究院实习期间完成,导师为本文通讯作者赵波教授。此前,李飞飞老师提出了空间智能 (Spatial Intel...……更多
微美全息构建基于深度迁移学习的图像分类融合模型, 提高图像分类的准确性和效率
...美全息(NASDAQ:WIMI)构建基于深度迁移学习的图像分类融合模型,提高图像分类的准确性和效率深度学习在计算机视觉领域得到越来越广泛的应用,尤其是在图像分类任务上。然而,由于数据集的限制和模型的复杂性,深度学习模...……更多
2023 的人工智能之年
...风格或纹理应用于文字和短语。Midjourney:Midjourney 的 V.5 模型在图像生成领域是一个重要的里程碑,它展示了在效率、连贯性和高分辨率方面的显著改进。最新的 alpha 版本,Midjourney V.6,引入了额外的增强功能,如更精准的提示...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...构成威胁,Arm 和台积电将获胜。”有网友说到苹果在大模型发展上的状况。也有网友认为,苹果在大模型上的发力将为其在未来的手机市场竞争中带来优势。他们认为,开源模型加上移动设备的本地数据,即本地化的原生 LLM,...……更多
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...想要达成通用人工智能 AGI 的终极目标,首先要达成的是模型要能完成人类所能轻松做到的任务。为了做到这一点,大模型开发的关键指导之一便是如何让机器像人类一样思考和推理。诸如注意力机制和思维链(Chain-of-Thought)等...……更多
CVPR最佳论文被生成式AI占领,清华武大华南农大上科校友获奖
...赢家!一篇是Rich Human Feedback for Text-to-Image Generation,受大模型中的RLHF技术启发,团队用人类反馈来改进Stable Diffusion等文生图模型。这项研究来自UCSD、谷歌等,共同一作华南农业大学校友Youwei Liang、清华校友……更多
本周硅谷发生了什么?| 高通第三代骁龙8;谷歌20亿美元追投Anthropic;联想拿出能跑大模型个人PC
...on CPU、骁龙8 Gen3等在内的王炸产品,后有联系拿出能跑大模型的个人PC。还有谷歌20亿追投Anthropic,并曝光多模态模型Gemini和工具Stubbs,将为用户更多便捷和创新的应用开发方式。Meta公布第三季度财报,实现23%的营收增长,是公...……更多
本文转自:中国科学报南开大学等让人工智能模型训练提速10倍以上本报讯(通讯员高雨桐 记者陈彬)南开大学、南开国际先进研究院(深圳福田)教授程明明团队发布了一项国际联合研究成果MDT,与人工智能文字生成视频大...……更多
非接触式结构光三维扫描技术的优势凸显
...有各自的技术优势,但也存在一定的不足,如创建完一个模型后,还需要专业软件对模型进行后处理,以及对于扫描光源环境的匹配度,不能做到控制自如等。国内全栈式3D数字化解决方案提供商积木易搭推出了一款基于非接触...……更多
最新美国国家人工智能科学院院士介绍
...。他在自然语言处理领域取得了显著成果,特别是在语言模型和对话系统方面。Zhu的工作使得机器能够更自然地与人类进行交互,提高了智能助手的性能和用户体验。RichardSutton,强化学习之父、阿尔伯塔大学教授。他对强化学...……更多
《卖身契》修复记:AI重现“打工人”喜剧魅力,留住老电影的黄
...香港电影修复计划”中,技术人员就曾首次将AIGC视觉大模型引入到影片修复,对大模型进行了生成质量和效率等方面的算法优化。如今随着Sora等大模型在视觉领域的发展,视觉大模型不仅运用在视频生成、修改、融合和延伸等...……更多
“3D视频版Sora”来了!
...AI独角兽Stability AI推出其首个视频生视频(video-to-video)模型Stable Video 4D(SV4D),该模型能够将单个物体的视频输入,转换为8个不同视角的多个新视频,用户可任意指定摄像机角度。目前,SV4D可以通过一次推理,在约40秒内生成...……更多
metareality推出sapiensai视觉模型
...24日消息,MetaReality实验室最新推出了名为Sapiens的AI视觉模型,适用于二维姿势预估、身体部位分割、深度估计和表面法线预测4种以人为中心的基本视觉任务。这些模型的参数数量各不相同,从3亿到20亿不等。它们采用视觉转换...……更多
...,并基于该标注数据提取不同颜色空间的特征训练决策树模型。为了保证结果的鲁棒性,作者使用5张不同情况下的图像,包括晴天、阴影、光反射、雨天等,从图像中选取135000个像素进行训练,经过消除噪声等步骤后生成的掩...……更多
Meta 公司发布 Imagine Yourself AI 模型
...可扩展性,为此 Meta 公司创新提出了“Imagine Yourself” AI 模型。传统个性化图像生成方法挑战目前的个性化图像生成方法通常依赖于为每个用户调整模型,这种方法效率低下,而且缺乏通用性。虽然较新的方法试图在不进行调整...……更多
Sora技术报告揭秘6大核心优势,AGI或在1年内实现?
◎当地时间2月15日,OpenAI发布了最新的视频生成模型Sora。出色的视频制作能力瞬间“点燃”科技圈。英伟达人工智能研究院首席研究科学家JimFan直言,这是视频生成领域的GPT-3时刻。360集团创始人、董事长周鸿祎则称,随着Sora...……更多
更多关于科技的资讯:
扎克伯格最新发声:智能眼镜未来会像手机一样普及,苹果将成Meta主要对手
在本周的一次采访中,Meta首席执行官马克·扎克伯格谈到了让Meta在多次技术浪潮中保持前位的策略方法,并指出了苹果的战略不足
2024-09-21 18:17:00
“月满峨眉·金顶探月” 蜀山登月-无人机带你领略超级月亮之美
在中秋佳节的团圆之夜,峨眉山以壮丽的自然风光和科技创新为媒,呈现了一场惊艳的超级月亮直播盛宴。9月17日,中秋满月达到“近地点满月”的罕见天象
2024-09-21 18:17:00
武汉大学首个人形机器人“天问”亮相:身长 1.7m、体重 65kg
IT之家 9 月 20 日消息,武汉大学首个人形机器人“天问”亮相。据武汉大学工业科学研究院副教授李淼介绍,“天问”一名的取名灵感来源于《楚辞》中屈原的千古名篇《天问》
2024-09-21 18:17:00
高通被曝洽谈收购英特尔 后者8月刚宣布裁员
【CNMO科技消息】9月21日,有国外媒体报道,相关知情人士表示芯片巨头高通正在洽谈收购英特尔。如果这笔交易成功,将成为半导体行业最大的并购案之一
2024-09-21 18:19:00
秒光!天猫服饰5折会场太火爆,品牌连夜补货,网友直呼:真香!
9月20日晚8点,天猫突发“大额降温补贴”,一线大牌秋冬新品全部5折。8点刚过,数百万消费者冲进天猫,5折补贴券瞬间秒光
2024-09-21 13:08:00
家电以旧换新正当时,新国品海信中央空调携重磅权益礼遇
“金九银十”装修季,选购空调正当时,更优惠、省心地买到高品质的空调产品是消费者的朴素愿望。在此方面,国家今年以来大力推广的消费品以旧换新政策东风
2024-09-21 13:48:00
国网天津城南供电公司:中压发电车“上岗” 检修施工“零”停电 扫码阅读手机版
9月19日7时,津南区北闸口镇天北里市场一如既往热闹了起来,市场内熙熙攘攘、早点铺子人头攒动。在市场不远处的天北里小区内
2024-09-21 13:54:00
近年数字潮玩运动馆火爆全网
2024年,为什么越来越多的人关注数字潮玩运动馆?首先,数字潮玩运动馆是通过数字智能科技、IT信息、互联网技术和体育,娱乐
2024-09-21 14:15:00
据英国《金融时报》网站9月12日报道,英国内政部警务和犯罪预防国务大臣戴安娜·约翰逊的手提包10日在高级警务官员年度会议上被偷
2024-09-21 14:16:00
FCB-EW9500H摄像头,2160P/60视频输出标准
FCB-EW9500H医疗术野摄像头以其卓越的2160P超高清分辨率和60帧流畅视频输出,不仅重新定义了清晰与流畅的界限
2024-09-21 14:20:00
游戏代理真的好做吗?怎么挑选一家靠谱的手游代理平台
游戏代理真的好做吗?实际上无论是自主创业或是挑选别的领域去工作中,大家都难以避免会问自己这种问题,例如这个项目怎么样?我能做好他吗
2024-09-21 14:20:00
凯茉锐|ILX-LR1相机在《黑神话:悟空》中的细节创新
在《黑神话:悟空》这款备受瞩目的游戏开发过程中,全画幅可扩展系统遥控相机ILX-LR1以其卓越的性能和独特的设计,为游戏的三维重建和场景细节捕捉带来了前所未有的创新
2024-09-21 14:21:00
世界制造业大会|合肥:推动车规级“芯屏”导入整车厂
大皖新闻讯 随着新能源汽车与智能网联汽车的快速发展,屏幕、芯片在汽车上的应用越来越广泛和紧密。作为“芯屏汽合”产业发展集聚地
2024-09-21 14:21:00
索尼FCB模组FCB-EV9520L低延时远程监控解决方案
在远程监控领域,对实时性的追求从未停歇。索尼凭借其创新技术,推出了FCB-EV9520L模组,这一产品以其卓越的低延时性能
2024-09-21 14:24:00
微弱光线下的清晰视界 —— FCB-EV9500L医疗摄像头
FCB-EV9500L医疗术野摄像头,以其超凡的低光敏感度和卓越的图像处理能力,为我们在微弱光线下打开了全新的视界。下面凯茉锐小编为您详细介绍
2024-09-21 14:25:00