• 我的订阅
  • 头条热搜
SAM是如何做到“分割一切”的
本文转自:科技日报又一通用模型发布SAM是如何做到“分割一切”的视觉中国供图SAM是一类处理图像分割任务的通用模型。与以往只能处理某种特定类型图片的图像分割模型不同,SAM可以处理所有类型的图像。相比于以往的图...……更多
OpenAI发布文生视频模型Sora,奥尔特曼选取网友提示词
...凌晨,OpenAI再次扔出一枚深水炸弹,发布了首个文生视频模型Sora。据介绍,Sora可以直接输出长达60秒的视频,并且包含高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色。目前官网上已经更新了48个视频demo,在这...……更多
技术报告揭秘Sora六大核心优势,影视等行业面临颠覆
...。而这些视频全都是通过OpenAI2月15日发布的最新视频生成模型Sora制作的,用户震惊之余,也给予了Sora高度评价,将其描述为“绝无仅有”和“游戏规则改变者”。图片来源:X平台Sora采用了OpenAI文生图模型DALL-E3背后的强大技术...……更多
OpenAI空降视频生成模型:一口气生成60s,风格画质尺寸灵活定制 | 最前线
...被打破——OpenAI又出王炸,发布了可以生成60秒视频的AI模型Sora。OpenAI官宣Sora。同样在2月16日发布的谷歌最新多模态模型Gemini Pro 1.5,则被Sora迅速夺走了关注度。网友为Gemini和Sora制作的梗图。根据OpenAI官方发布的推文和技术报...……更多
马斯克评OpenAI首个视频生成模型:人类认赌服输
OpenAI周四发布了首个视频生成模型Sora,并展示了几段效果炸裂的演示视频。一位X用户分享了Sora生成的一名女子在东京街头漫步的视频,并评论称:“OpenAI今天宣布了Sora,它使用混合扩散和变压器模型架构生成长达1分钟的视频...……更多
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5”
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5” 3月14日,商汤科技发布多模态多任务通用大模型“书生(INTERN)2.5”,在多模态多任务处理能力方面实现多项全新突破,其卓越的图文跨模态开放任务处理能力可...……更多
deepmind研究:未知物体也能轻松识别分割
...DetCon和ReLICv2。 除此之外,Odin方法不仅可以应用在ResNet模型中,还可以应用到更复杂的模型中,如SwimTransformer。在数据上,Odin框架学习的优势很明显,那在可视化的图像中,Odin的优势在何处体现了呢?将使用Odin生成的分割图...……更多
快速准确定位识别生物大分子 中国团队基于人工智能研究提出新方法
...DeepETPicker优选简化标签来替代真实标签,并采用更高效的模型架构、更丰富的数据增强技术和重叠分区策略来提升小训练集时模型的性能;为提高颗粒定位的速度,DeepETPicker采用图形处理器(GPU)加速的平均池化-非极大值抑制后处...……更多
OpenAI发布首个文生视频模型Sora,网友:工作要丢了!
...凌晨,OpenAI再次扔出一枚深水炸弹,发布了首个文生视频模型Sora。据介绍,Sora可以直接输出长达60秒的视频,并且包含高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色。目前官网上已经更新了48个视频demo,在这...……更多
高斯混合模型在概率建模中的应用
...模方法逐渐成为实现复杂问题的关键手段之一。高斯混合模型(GaussianMixtureModel,简称GMM)作为一种经典的概率建模技术,已经被广泛地应用于数据挖掘、模式识别、图像处理等领域。本文将介绍什么是高斯混合模型,它的基本...……更多
美女刷屏真假难辨网友:警惕ai网恋诈骗
...岗”。根据各帖子发布者透露,这些AI照片都出自同一个模型,Chilloutmix。 多个模型融合进化,照片级AI诞生ChilloutMix,二月初出现在模型分享社区CivitAI(不少爱好者称之为c站)。不到两周时间,下载数量超过5万。简单来说,...……更多
迎战GPT-4V!谷歌PaLI-3视觉语言模型问世,更小、更快、更强
...况,这一举动引起了业界的广泛关注。然而,在视觉语言模型的角逐中,谷歌也不甘示弱。 近日,Google Research、Google DeepMind 和 Google Cloud 共同推出了一个更小、更快、更强大的视觉语言模型(VLM)——PaLI-3,该模型与相似的体...……更多
AI视觉迎GPT-3时刻!国内市场规模将达6000亿 受益上市公司梳理
AI视觉领域迎来新模型“炸场”,图像识别门槛大幅降低。据财联社报道,Meta上周三发布了一个人工智能模型,可以从图像中挑选出单个对象,以及一个图像注释数据集。该模型名为Segment Anything Model(SAM),Meta官方表示这是有...……更多
你真的知道“渲染引擎”吗?一文看懂
...染、创造逼真视觉效果的关键组件,负责将二维或三维的模型、纹理、光照等数据,转化为人们肉眼可见的二维图像。渲染引擎的工作原理基于计算机图形学和视觉感知理论。它首先接收来自应用程序的几何数据(如顶点坐标/...……更多
微美全息构建基于深度迁移学习的图像分类融合模型, 提高图像分类的准确性和效率
...美全息(NASDAQ:WIMI)构建基于深度迁移学习的图像分类融合模型,提高图像分类的准确性和效率深度学习在计算机视觉领域得到越来越广泛的应用,尤其是在图像分类任务上。然而,由于数据集的限制和模型的复杂性,深度学习模...……更多
2023 的人工智能之年
...风格或纹理应用于文字和短语。Midjourney:Midjourney 的 V.5 模型在图像生成领域是一个重要的里程碑,它展示了在效率、连贯性和高分辨率方面的显著改进。最新的 alpha 版本,Midjourney V.6,引入了额外的增强功能,如更精准的提示...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...构成威胁,Arm 和台积电将获胜。”有网友说到苹果在大模型发展上的状况。也有网友认为,苹果在大模型上的发力将为其在未来的手机市场竞争中带来优势。他们认为,开源模型加上移动设备的本地数据,即本地化的原生 LLM,...……更多
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...想要达成通用人工智能 AGI 的终极目标,首先要达成的是模型要能完成人类所能轻松做到的任务。为了做到这一点,大模型开发的关键指导之一便是如何让机器像人类一样思考和推理。诸如注意力机制和思维链(Chain-of-Thought)等...……更多
CVPR最佳论文被生成式AI占领,清华武大华南农大上科校友获奖
...赢家!一篇是Rich Human Feedback for Text-to-Image Generation,受大模型中的RLHF技术启发,团队用人类反馈来改进Stable Diffusion等文生图模型。这项研究来自UCSD、谷歌等,共同一作华南农业大学校友Youwei Liang、清华校友……更多
本周硅谷发生了什么?| 高通第三代骁龙8;谷歌20亿美元追投Anthropic;联想拿出能跑大模型个人PC
...on CPU、骁龙8 Gen3等在内的王炸产品,后有联系拿出能跑大模型的个人PC。还有谷歌20亿追投Anthropic,并曝光多模态模型Gemini和工具Stubbs,将为用户更多便捷和创新的应用开发方式。Meta公布第三季度财报,实现23%的营收增长,是公...……更多
本文转自:中国科学报南开大学等让人工智能模型训练提速10倍以上本报讯(通讯员高雨桐 记者陈彬)南开大学、南开国际先进研究院(深圳福田)教授程明明团队发布了一项国际联合研究成果MDT,与人工智能文字生成视频大...……更多
非接触式结构光三维扫描技术的优势凸显
...有各自的技术优势,但也存在一定的不足,如创建完一个模型后,还需要专业软件对模型进行后处理,以及对于扫描光源环境的匹配度,不能做到控制自如等。国内全栈式3D数字化解决方案提供商积木易搭推出了一款基于非接触...……更多
最新美国国家人工智能科学院院士介绍
...。他在自然语言处理领域取得了显著成果,特别是在语言模型和对话系统方面。Zhu的工作使得机器能够更自然地与人类进行交互,提高了智能助手的性能和用户体验。RichardSutton,强化学习之父、阿尔伯塔大学教授。他对强化学...……更多
《卖身契》修复记:AI重现“打工人”喜剧魅力,留住老电影的黄
...香港电影修复计划”中,技术人员就曾首次将AIGC视觉大模型引入到影片修复,对大模型进行了生成质量和效率等方面的算法优化。如今随着Sora等大模型在视觉领域的发展,视觉大模型不仅运用在视频生成、修改、融合和延伸等...……更多
...,并基于该标注数据提取不同颜色空间的特征训练决策树模型。为了保证结果的鲁棒性,作者使用5张不同情况下的图像,包括晴天、阴影、光反射、雨天等,从图像中选取135000个像素进行训练,经过消除噪声等步骤后生成的掩...……更多
...步介绍,Akool的主要自研架构包括用于数字虚拟人的扩散模型和3维NerF结构的生成模型框架、基于能量的扩散模型框架。吕家俊告诉36氪,用这些自研框架开发的图片视频应用,具有生成结果质量高,清晰度高,多样性好等特点。...……更多
Sora技术报告揭秘6大核心优势,AGI或在1年内实现?
◎当地时间2月15日,OpenAI发布了最新的视频生成模型Sora。出色的视频制作能力瞬间“点燃”科技圈。英伟达人工智能研究院首席研究科学家JimFan直言,这是视频生成领域的GPT-3时刻。360集团创始人、董事长周鸿祎则称,随着Sora...……更多
meta推出两款基于ai的图像编辑工具
...AI工具的更多信息,IT之家整理如下。官方介绍称,EmuEdit模型仅用文字指令就可以准确编辑图像,而通过分解文字转视频(Text-to-Video,T2V)的生成过程,开发团队公布了一种名为EmuVideo的方法,可以改善最终生成视频的品质和多...……更多
腾讯和清华大学联合推出全新图生视频模型
...,腾讯和清华大学、香港科技大学联合推出全新图生视频模型“Follow-Your-Click”,目前已经上架GitHub(代码四月公开),同时还发表了一篇研究论文(IT之家附DOI:2403.08268)。这款图生视频模型主要功能包括局部动画生成和多对象...……更多
Sora冲击波
...,OpenAI再投一颗“深水炸弹”,毫无预兆发布的文生视频模型Sora,让AI圈又一次“一夜变天”。一是时长,二是逼真程度,Sora实现了两个老大难问题的同时解决,以至于外界毫不吝啬地将其形容为“颠覆性”的存在。360创始人...……更多
更多关于科技的资讯:
连日来,百度旗下的萝卜快跑在武汉迅速扩张引来各界关注。百度港股股价连续两日大涨,资本市场也刮起了无人驾驶风,一众企业站上了风口浪尖
2024-07-12 00:05:00
7月11日,媒体援引知情人士消息称,苹果告诉供应商和合作伙伴,苹果公司计划在今年下半年出货至少9000万部iPhone 16设备
2024-07-12 01:08:00
本报讯(记者 张恒新)7月8日,毕节市“5G+网络安全靶场”发布会在毕节市工业职业技术学院举行。发布会上开展了网络安全攻防演练等活动
2024-07-12 06:03:00
本报讯(四川日报全媒体记者 王密)近日,主打“复古”“通勤”的某单车品牌西南首店在成都城南亮相。该门店销售人员介绍,伴随着成都的“骑行热”
2024-07-12 06:09:00
□四川日报全媒体记者 罗海韵 陈云鸽全国首部AIGC生成式连续性叙事科幻短剧集《三星堆:未来启示录》7月8日上线在抖音平台与观众见面
2024-07-12 06:09:00
本文转自:人民日报防晒衣如何更防晒?(经济新方位·身边的创新)——产业链上下游协同,从需求中找市场本报记者 王崟欣防晒衣
2024-07-12 06:30:00
本文转自:环球时报据报道,自动驾驶出行服务平台萝卜快跑(Apollo Go)目前在武汉的辐射面积3000多平方公里,触达人口超770万
2024-07-12 06:52:00
起步、转弯、列队……杭州西湖区飞步科技总部,一块巨大的屏幕实时展示着宁波舟山港码头的忙碌景象——梅山港区的无人驾驶集卡(集装箱卡车)车队井然有序地运作
2024-07-12 07:34:00
iPhone 17 Pro Max将配增大四摄摄像头
据说苹果将其四棱变焦镜头带到了iPhone16Pro和iPhone16ProMax,但在谈到规格时,据说这两款旗舰都配备了据报道将保留的摄像头与iPhone15ProMax相比没有变化
2024-07-11 22:18:00
观察:智能投影机市场的疲惫期已然到来
一转眼,上半年已过完,对于智能投影机市场来说,“中考”以失败而告终。对于下半年来说,“双11”和“双12”以及年底旺季能否让智能投影机市场迎来翻身仗
2024-07-11 22:18:00
苹果将推出由硬塑料制成Apple Watch SE新版本
苹果早在2017年就发布了iPhoneX,这标志着iPhone自2007年首次推出以来的十年,该设备在全屏设计和FaceID方面向前迈出了一大步
2024-07-11 22:18:00
iPhone 15 Pro Max原型机触觉按钮从未进入商用
苹果的iPhone15Pro和iPhone15ProMax最初计划使用触觉反馈按钮,而不是我们在商业机型上看到的常规按钮
2024-07-11 22:19:00
Redmi性能魔王!K70至尊版即将登场
“性能梦想机”真我GT6已经官宣,Redmi的性能魔王,马上也要来了。小米高层和合作方,已经在为RedmiK70至尊版频频预热
2024-07-11 22:19:00
高跟踩踏照样没事!OPPO发布千元耐用神机,双面抗摔耐磨
高跟踩踏照样没事!7月2日,OPPO发布耐用战神——OPPOA3,起售价为1599元(8+256G)。OPPOA3还有12+256G
2024-07-11 22:19:00
下半年小直屏旗舰选择多种多样
曾经,在三星的影响下,曲面屏一直都被看做是旗舰机的标志之一。不过随着三星自己在旗舰上放弃曲屏,以及小米13通过小直屏大卖后
2024-07-11 22:19:00