• 我的订阅
  • 头条热搜
SAM是如何做到“分割一切”的
本文转自:科技日报又一通用模型发布SAM是如何做到“分割一切”的视觉中国供图SAM是一类处理图像分割任务的通用模型。与以往只能处理某种特定类型图片的图像分割模型不同,SAM可以处理所有类型的图像。相比于以往的图...……更多
OpenAI发布文生视频模型Sora,奥尔特曼选取网友提示词
...凌晨,OpenAI再次扔出一枚深水炸弹,发布了首个文生视频模型Sora。据介绍,Sora可以直接输出长达60秒的视频,并且包含高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色。目前官网上已经更新了48个视频demo,在这...……更多
字节版Sora火爆24小时,同名论文再次被热议
...憋了个大的——一口气推出Seaweed和PixelDance两款豆包视频模型,支持文生/图生视频,时长可达10s。以PixelDance为例,其最大特色在于多主体交互,一致性多镜头生成。啥意思??——直接来看几个官方demo。First kill,现在手上有这...……更多
技术报告揭秘Sora六大核心优势,影视等行业面临颠覆
...。而这些视频全都是通过OpenAI2月15日发布的最新视频生成模型Sora制作的,用户震惊之余,也给予了Sora高度评价,将其描述为“绝无仅有”和“游戏规则改变者”。图片来源:X平台Sora采用了OpenAI文生图模型DALL-E3背后的强大技术...……更多
OpenAI空降视频生成模型:一口气生成60s,风格画质尺寸灵活定制 | 最前线
...被打破——OpenAI又出王炸,发布了可以生成60秒视频的AI模型Sora。OpenAI官宣Sora。同样在2月16日发布的谷歌最新多模态模型Gemini Pro 1.5,则被Sora迅速夺走了关注度。网友为Gemini和Sora制作的梗图。根据OpenAI官方发布的推文和技术报...……更多
马斯克评OpenAI首个视频生成模型:人类认赌服输
OpenAI周四发布了首个视频生成模型Sora,并展示了几段效果炸裂的演示视频。一位X用户分享了Sora生成的一名女子在东京街头漫步的视频,并评论称:“OpenAI今天宣布了Sora,它使用混合扩散和变压器模型架构生成长达1分钟的视频...……更多
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5”
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5” 3月14日,商汤科技发布多模态多任务通用大模型“书生(INTERN)2.5”,在多模态多任务处理能力方面实现多项全新突破,其卓越的图文跨模态开放任务处理能力可...……更多
deepmind研究:未知物体也能轻松识别分割
...DetCon和ReLICv2。 除此之外,Odin方法不仅可以应用在ResNet模型中,还可以应用到更复杂的模型中,如SwimTransformer。在数据上,Odin框架学习的优势很明显,那在可视化的图像中,Odin的优势在何处体现了呢?将使用Odin生成的分割图...……更多
快速准确定位识别生物大分子 中国团队基于人工智能研究提出新方法
...DeepETPicker优选简化标签来替代真实标签,并采用更高效的模型架构、更丰富的数据增强技术和重叠分区策略来提升小训练集时模型的性能;为提高颗粒定位的速度,DeepETPicker采用图形处理器(GPU)加速的平均池化-非极大值抑制后处...……更多
OpenAI发布首个文生视频模型Sora,网友:工作要丢了!
...凌晨,OpenAI再次扔出一枚深水炸弹,发布了首个文生视频模型Sora。据介绍,Sora可以直接输出长达60秒的视频,并且包含高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色。目前官网上已经更新了48个视频demo,在这...……更多
美女刷屏真假难辨网友:警惕ai网恋诈骗
...岗”。根据各帖子发布者透露,这些AI照片都出自同一个模型,Chilloutmix。 多个模型融合进化,照片级AI诞生ChilloutMix,二月初出现在模型分享社区CivitAI(不少爱好者称之为c站)。不到两周时间,下载数量超过5万。简单来说,...……更多
高斯混合模型在概率建模中的应用
...模方法逐渐成为实现复杂问题的关键手段之一。高斯混合模型(GaussianMixtureModel,简称GMM)作为一种经典的概率建模技术,已经被广泛地应用于数据挖掘、模式识别、图像处理等领域。本文将介绍什么是高斯混合模型,它的基本...……更多
迎战GPT-4V!谷歌PaLI-3视觉语言模型问世,更小、更快、更强
...况,这一举动引起了业界的广泛关注。然而,在视觉语言模型的角逐中,谷歌也不甘示弱。 近日,Google Research、Google DeepMind 和 Google Cloud 共同推出了一个更小、更快、更强大的视觉语言模型(VLM)——PaLI-3,该模型与相似的体...……更多
AI视觉迎GPT-3时刻!国内市场规模将达6000亿 受益上市公司梳理
AI视觉领域迎来新模型“炸场”,图像识别门槛大幅降低。据财联社报道,Meta上周三发布了一个人工智能模型,可以从图像中挑选出单个对象,以及一个图像注释数据集。该模型名为Segment Anything Model(SAM),Meta官方表示这是有...……更多
你真的知道“渲染引擎”吗?一文看懂
...染、创造逼真视觉效果的关键组件,负责将二维或三维的模型、纹理、光照等数据,转化为人们肉眼可见的二维图像。渲染引擎的工作原理基于计算机图形学和视觉感知理论。它首先接收来自应用程序的几何数据(如顶点坐标/...……更多
李飞飞空间智能之后,上交、智源、北大提出空间大模型SpatialBot
...成绩在东南大学取得学士学位。他的研究兴趣为多模态大模型、具身智能。此工作为其在上海交通大学访问和北京智源人工智能研究院实习期间完成,导师为本文通讯作者赵波教授。此前,李飞飞老师提出了空间智能 (Spatial Intel...……更多
微美全息构建基于深度迁移学习的图像分类融合模型, 提高图像分类的准确性和效率
...美全息(NASDAQ:WIMI)构建基于深度迁移学习的图像分类融合模型,提高图像分类的准确性和效率深度学习在计算机视觉领域得到越来越广泛的应用,尤其是在图像分类任务上。然而,由于数据集的限制和模型的复杂性,深度学习模...……更多
2023 的人工智能之年
...风格或纹理应用于文字和短语。Midjourney:Midjourney 的 V.5 模型在图像生成领域是一个重要的里程碑,它展示了在效率、连贯性和高分辨率方面的显著改进。最新的 alpha 版本,Midjourney V.6,引入了额外的增强功能,如更精准的提示...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...构成威胁,Arm 和台积电将获胜。”有网友说到苹果在大模型发展上的状况。也有网友认为,苹果在大模型上的发力将为其在未来的手机市场竞争中带来优势。他们认为,开源模型加上移动设备的本地数据,即本地化的原生 LLM,...……更多
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...想要达成通用人工智能 AGI 的终极目标,首先要达成的是模型要能完成人类所能轻松做到的任务。为了做到这一点,大模型开发的关键指导之一便是如何让机器像人类一样思考和推理。诸如注意力机制和思维链(Chain-of-Thought)等...……更多
CVPR最佳论文被生成式AI占领,清华武大华南农大上科校友获奖
...赢家!一篇是Rich Human Feedback for Text-to-Image Generation,受大模型中的RLHF技术启发,团队用人类反馈来改进Stable Diffusion等文生图模型。这项研究来自UCSD、谷歌等,共同一作华南农业大学校友Youwei Liang、清华校友……更多
本周硅谷发生了什么?| 高通第三代骁龙8;谷歌20亿美元追投Anthropic;联想拿出能跑大模型个人PC
...on CPU、骁龙8 Gen3等在内的王炸产品,后有联系拿出能跑大模型的个人PC。还有谷歌20亿追投Anthropic,并曝光多模态模型Gemini和工具Stubbs,将为用户更多便捷和创新的应用开发方式。Meta公布第三季度财报,实现23%的营收增长,是公...……更多
本文转自:中国科学报南开大学等让人工智能模型训练提速10倍以上本报讯(通讯员高雨桐 记者陈彬)南开大学、南开国际先进研究院(深圳福田)教授程明明团队发布了一项国际联合研究成果MDT,与人工智能文字生成视频大...……更多
非接触式结构光三维扫描技术的优势凸显
...有各自的技术优势,但也存在一定的不足,如创建完一个模型后,还需要专业软件对模型进行后处理,以及对于扫描光源环境的匹配度,不能做到控制自如等。国内全栈式3D数字化解决方案提供商积木易搭推出了一款基于非接触...……更多
最新美国国家人工智能科学院院士介绍
...。他在自然语言处理领域取得了显著成果,特别是在语言模型和对话系统方面。Zhu的工作使得机器能够更自然地与人类进行交互,提高了智能助手的性能和用户体验。RichardSutton,强化学习之父、阿尔伯塔大学教授。他对强化学...……更多
《卖身契》修复记:AI重现“打工人”喜剧魅力,留住老电影的黄
...香港电影修复计划”中,技术人员就曾首次将AIGC视觉大模型引入到影片修复,对大模型进行了生成质量和效率等方面的算法优化。如今随着Sora等大模型在视觉领域的发展,视觉大模型不仅运用在视频生成、修改、融合和延伸等...……更多
“3D视频版Sora”来了!
...AI独角兽Stability AI推出其首个视频生视频(video-to-video)模型Stable Video 4D(SV4D),该模型能够将单个物体的视频输入,转换为8个不同视角的多个新视频,用户可任意指定摄像机角度。目前,SV4D可以通过一次推理,在约40秒内生成...……更多
metareality推出sapiensai视觉模型
...24日消息,MetaReality实验室最新推出了名为Sapiens的AI视觉模型,适用于二维姿势预估、身体部位分割、深度估计和表面法线预测4种以人为中心的基本视觉任务。这些模型的参数数量各不相同,从3亿到20亿不等。它们采用视觉转换...……更多
...,并基于该标注数据提取不同颜色空间的特征训练决策树模型。为了保证结果的鲁棒性,作者使用5张不同情况下的图像,包括晴天、阴影、光反射、雨天等,从图像中选取135000个像素进行训练,经过消除噪声等步骤后生成的掩...……更多
Meta 公司发布 Imagine Yourself AI 模型
...可扩展性,为此 Meta 公司创新提出了“Imagine Yourself” AI 模型。传统个性化图像生成方法挑战目前的个性化图像生成方法通常依赖于为每个用户调整模型,这种方法效率低下,而且缺乏通用性。虽然较新的方法试图在不进行调整...……更多
更多关于科技的资讯:
纯国产高速激光打印机来了!龙芯2P0500主控打印机首批量产出货
快科技9月27日消息,日前,基于龙芯2P0500的极印高速激光打印机首批量产订单下线交付,标志着龙芯专用打印产品量产正式走向开放市场
2024-09-29 10:00:00
喜大普奔!微信公众号可以修改封面了!
9月27日,微信公众号发布新规——图文消息支持修改封面。传媒茶话会测试发现,通过“修改”入口进入文章后,修改页面的最底部已经新增修改封面的功能
2024-09-29 10:00:00
14年了,苹果又在美国本土制造芯片了,拜登:美国制造的重大胜利
美国本土可以生产4nm芯片了?据说,台积电在亚利桑那州的新工厂已经开始用上了先进的4N工艺,说白了,这就是5纳米技术的升级版
2024-09-29 13:32:00
顶固最接地气的长期主义:与“健康”同行
在历史的长河中,健康一直是人类追求的永恒主题。从苏东坡“宁可食无肉,不可居无竹”的诗意生活,到现代人对品质家居的渴望,健康的理念贯穿其中
2024-09-29 10:26:00
本文转自:人民网-北京频道人民网北京9月29日电 (记者董兆瑞)随着回天行动计划的稳步实施及昌平区“两谷一园”创新格局加速形成
2024-09-29 10:49:00
如何定义个贷不良资产处置3.0时代?
前言在金融领域,个贷不良资产处置的演变经历了显著的变革。1.0时代的处置特征依赖于传统的人工催收和法律诉讼,而2.0时代则引入了基础信息化手段
2024-09-29 10:53:00
吉利汽车CEO淦家阅:全新一代雷神超级电混续航超2000km
快科技9月29日消息,日前,在2024世界新能源汽车大会上,吉利汽车集团CEO淦家阅透露:吉利年内将发布全新一代雷神超级电混
2024-09-29 11:03:00
存储产业寒冬将至:金士顿已率先启动降价策略!
快科技9月29日消息,据媒体报道,近期,尽管存储大厂美光的财报一度给市场带来暖意,但摩根士丹利的报告却预测存储产业的寒冬即将到来
2024-09-29 11:03:00
Etsy店铺运营秘籍
Etsy是个汇集了无数手工艺品、复古商品和独特创意作品的电商平台,为全球的手工艺人和小型企业提供了一个展示和销售创意成果的舞台
2024-09-29 11:04:00
世界级的碰撞在郎酒庄园上演!中国郎的“世界级”梦想逐步照进现实
并肩同行,共绘世界建筑新篇章。9月27日,2024世界建筑节 中国盛典(以下简称:2024 WAF China)在郎酒庄园举行
2024-09-29 11:13:00
打破传统医疗服务的地域与机构壁垒,京东方健康视图板块上线
文|罗曾近日,京东方健康在智慧医疗领域有了新进展。据悉,其在合肥、成都、苏州三家自建医院正式推出创新健康视图板块,该板块是京东方医院服务号
2024-09-29 11:14:00
拿起手机、打开网约车软件,不一会儿,一辆自动驾驶出租车停到面前,扫二维码上车,系好安全带,在车载屏幕上点击“一切已准备好”
2024-09-29 11:16:00
张雪峰公司新增互联网游戏服务
张雪峰公司新增电竞相关业务天眼查App显示,近日,苏州峰狂文化科技有限公司发生工商变更,经营范围新增互联网游戏服务,演出经纪
2024-09-29 11:31:00
余承东:智能驾驶让人开车不劳累了 车相当于一个移动的家
快科技9月29日消息,日前,鸿蒙智行会客厅节目中,余承东与马东对话时表示,智能驾驶让人开车不劳累了,车相当于一个移动的家
2024-09-29 11:33:00
vivo韩伯啸公布X200标准版正面实拍图:等深四曲面 窄边框设计
快科技9月29日消息,今日vivo韩伯啸公布了X200标准版正面实拍图,称其采用超窄黑边全等深微四曲的设计,兼顾直屏的体验和曲屏的美感
2024-09-29 11:33:00