模型,图像,杨戈,数据,物体,提示头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

SAM是如何做到“分割一切”的

本文转自：科技日报又一通用模型发布SAM是如何做到“分割一切”的视觉中国供图SAM是一类处理图像分割任务的通用模型。与以往只能处理某种特定类型图片的图像分割模型不同，SAM可以处理所有类型的图像。相比于以往的图...……更多

2023-04-17 01:26:00模型,图像,杨戈,数据,物体,提示

幻觉不一定有害，新框架用AI的「幻觉」优化图像分割技术

...骏驰教授的指导下完成的。在人工智能领域，大型预训练模型（如 GPT 和 LLaVA）的 “幻觉” 现象常被视为一个难以克服的挑战，尤其是在执行精确任务如图像分割时。然而，最新发表于 NeurIPS 2024 的研究《Leveraging Hallucinations to R...……更多

2024-11-05 09:49:00幻觉,有害,框架,图像,技术,任务

OpenAI发布文生视频模型Sora，奥尔特曼选取网友提示词

...凌晨，OpenAI再次扔出一枚深水炸弹，发布了首个文生视频模型Sora。据介绍，Sora可以直接输出长达60秒的视频，并且包含高度细致的背景、复杂的多角度镜头，以及富有情感的多个角色。目前官网上已经更新了48个视频demo，在这...……更多

2024-02-16 18:44:00文生,奥尔,奥尔特曼,特曼,模型,提示

字节版Sora火爆24小时，同名论文再次被热议

...憋了个大的——一口气推出Seaweed和PixelDance两款豆包视频模型，支持文生/图生视频，时长可达10s。以PixelDance为例，其最大特色在于多主体交互，一致性多镜头生成。啥意思？？——直接来看几个官方demo。First kill，现在手上有这...……更多

2024-09-26 13:41:00字节,火爆,再次,小时,论文,指令

技术报告揭秘Sora六大核心优势，影视等行业面临颠覆

...。而这些视频全都是通过OpenAI2月15日发布的最新视频生成模型Sora制作的，用户震惊之余，也给予了Sora高度评价，将其描述为“绝无仅有”和“游戏规则改变者”。图片来源：X平台Sora采用了OpenAI文生图模型DALL-E3背后的强大技术...……更多

2024-02-17 21:07:00颠覆,核心,优势,报告,影视,行业

OpenAI空降视频生成模型：一口气生成60s，风格画质尺寸

...被打破——OpenAI又出王炸，发布了可以生成60秒视频的AI模型Sora。OpenAI官宣Sora。同样在2月16日发布的谷歌最新多模态模型Gemini Pro 1.5，则被Sora迅速夺走了关注度。网友为Gemini和Sora制作的梗图。根据OpenAI官方发布的推文和技术报...……更多

2024-02-18 06:20:00生成,一口,空降,画质,模型,一口气

马斯克评OpenAI首个视频生成模型：人类认赌服输

OpenAI周四发布了首个视频生成模型Sora，并展示了几段效果炸裂的演示视频。一位X用户分享了Sora生成的一名女子在东京街头漫步的视频，并评论称：“OpenAI今天宣布了Sora，它使用混合扩散和变压器模型架构生成长达1分钟的视频...……更多

2024-02-16 22:16:00马斯,马斯克,生成,模型,人类,视频

商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5”

商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5” 3月14日，商汤科技发布多模态多任务通用大模型“书生（INTERN）2.5”，在多模态多任务处理能力方面实现多项全新突破，其卓越的图文跨模态开放任务处理能力可...……更多

2023-03-15 13:30:00商汤,模态,书生,模型,任务,社区

deepmind研究：未知物体也能轻松识别分割

...DetCon和ReLICv2。除此之外，Odin方法不仅可以应用在ResNet模型中，还可以应用到更复杂的模型中，如SwimTransformer。在数据上，Odin框架学习的优势很明显，那在可视化的图像中，Odin的优势在何处体现了呢？将使用Odin生成的分割图...……更多

2023-01-31 13:58:00物体,研究,物体,图像,目标,网络

突破次元壁！新加坡国立发布GenXD：拿捏真实感3D、4D动

【新智元导读】GenXD模型结合CamVid-30K数据集突破了3D和4D场景生成的挑战，能从单张图片生成逼真的动态3D和4D场景。这一进展为虚拟世界构建带来新的可能性，让动态场景的生成更加快速和真实。在我们熟知的2D图像和视频生成...……更多

2024-11-14 09:45:00新加坡,真实感,国立,场景,突破,动态

快速准确定位识别生物大分子中国团队基于人工智能研究提出新方

...DeepETPicker优选简化标签来替代真实标签，并采用更高效的模型架构、更丰富的数据增强技术和重叠分区策略来提升小训练集时模型的性能；为提高颗粒定位的速度，DeepETPicker采用图形处理器(GPU)加速的平均池化-非极大值抑制后处...……更多

2024-03-12 18:50:00大分,大分子,人工智能,中国,人工,定位

OpenAI发布首个文生视频模型Sora，网友：工作要丢了！

2024-02-16 18:20:00文生,模型,网友,工作,视频,模型

美女刷屏真假难辨网友：警惕ai网恋诈骗

...岗”。根据各帖子发布者透露，这些AI照片都出自同一个模型，Chilloutmix。多个模型融合进化，照片级AI诞生ChilloutMix，二月初出现在模型分享社区CivitAI（不少爱好者称之为c站）。不到两周时间，下载数量超过5万。简单来说，...……更多

2023-02-15 15:50:00网恋,真假,诈骗,网友,美女,模型

高斯混合模型在概率建模中的应用

...模方法逐渐成为实现复杂问题的关键手段之一。高斯混合模型（GaussianMixtureModel，简称GMM）作为一种经典的概率建模技术，已经被广泛地应用于数据挖掘、模式识别、图像处理等领域。本文将介绍什么是高斯混合模型，它的基本...……更多

2023-10-23 03:37:00高斯,概率,混合,模型,应用,高斯

迎战GPT-4V！谷歌PaLI-3视觉语言模型问世，更小、更

...况，这一举动引起了业界的广泛关注。然而，在视觉语言模型的角逐中，谷歌也不甘示弱。近日，Google Research、Google DeepMind 和 Google Cloud 共同推出了一个更小、更快、更强大的视觉语言模型（VLM）——PaLI-3，该模型与相似的体...……更多

2023-10-17 16:31:00更快,模型,视觉,语言,训练,模型

AI视觉迎GPT-3时刻！国内市场规模将达6000亿受益上

AI视觉领域迎来新模型“炸场”，图像识别门槛大幅降低。据财联社报道，Meta上周三发布了一个人工智能模型，可以从图像中挑选出单个对象，以及一个图像注释数据集。该模型名为Segment Anything Model（SAM），Meta官方表示这是有...……更多

2023-04-17 10:44:00上市公司,视觉,时刻,规模,市场,公司

你真的知道“渲染引擎”吗？一文看懂

...染、创造逼真视觉效果的关键组件，负责将二维或三维的模型、纹理、光照等数据，转化为人们肉眼可见的二维图像。渲染引擎的工作原理基于计算机图形学和视觉感知理论。它首先接收来自应用程序的几何数据（如顶点坐标/...……更多

2024-06-28 13:06:00一文,引擎,引擎,图像,二维,纹理

LeCun 的世界模型初步实现！基于预训练视觉特征，零样本规

...Yann LeCun 批评 LLM 的推文之一相反，他更注重所谓的世界模型（World Model），也就是根据世界数据拟合的一个动态模型。比如驴，正是有了这样的世界模型，它们才能找到更省力的负重登山方法。近日，LeCun 团队发布了他们在世界...……更多

2024-11-19 09:48:00样本,模型,特征,视觉,训练,规划

李飞飞空间智能之后，上交、智源、北大提出空间大模型Spati

...成绩在东南大学取得学士学位。他的研究兴趣为多模态大模型、具身智能。此工作为其在上海交通大学访问和北京智源人工智能研究院实习期间完成，导师为本文通讯作者赵波教授。此前，李飞飞老师提出了空间智能 (Spatial Intel...……更多

2024-08-08 09:39:00空间,北大,模型,智能,深度,模型

百万鲁棒数据训练，3D场景大语言模型新SOTA！IIT等发布

...数据生成引擎（RIG）生成的大规模数据进行训练，以提高模型在3D场景理解中的鲁棒性和泛化能力，在多个3D多模态学习基准测试中取得了优异的性能，超越了以往的方法，且无需针对特定任务的微调。多模态大语言模型（Multi-mo...……更多

2024-10-16 13:35:00模型,场景,训练,语言,数据,物体

微美全息构建基于深度迁移学习的图像分类融合模型, 提高图像分

...美全息(NASDAQ:WIMI)构建基于深度迁移学习的图像分类融合模型，提高图像分类的准确性和效率深度学习在计算机视觉领域得到越来越广泛的应用，尤其是在图像分类任务上。然而，由于数据集的限制和模型的复杂性，深度学习模...……更多

2023-10-23 16:02:00图像,分类,全息,深度,模型,准确性

2023 的人工智能之年

...风格或纹理应用于文字和短语。Midjourney：Midjourney 的 V.5 模型在图像生成领域是一个重要的里程碑，它展示了在效率、连贯性和高分辨率方面的显著改进。最新的 alpha 版本，Midjourney V.6，引入了额外的增强功能，如更精准的提示...……更多

2023-12-29 05:02:00之年,人工智能,人工,智能,生成,人工智能

苹果的封闭生态为大模型打开！发布开源多模态大模型、每天为 A

...构成威胁，Arm 和台积电将获胜。”有网友说到苹果在大模型发展上的状况。也有网友认为，苹果在大模型上的发力将为其在未来的手机市场竞争中带来优势。他们认为，开源模型加上移动设备的本地数据，即本地化的原生 LLM，...……更多

2023-12-26 14:06:00模型,生态,模态,零碎,苹果,模型

Bengio团队提出多模态新基准，直指Claude 3.5和

...想要达成通用人工智能 AGI 的终极目标，首先要达成的是模型要能完成人类所能轻松做到的任务。为了做到这一点，大模型开发的关键指导之一便是如何让机器像人类一样思考和推理。诸如注意力机制和思维链（Chain-of-Thought）等...……更多

2024-06-29 09:37:00模态,基准,弱点,团队,模型,任务

CVPR最佳论文被生成式AI占领，清华武大华南农大上科校友获

...赢家！一篇是Rich Human Feedback for Text-to-Image Generation，受大模型中的RLHF技术启发，团队用人类反馈来改进Stable Diffusion等文生图模型。这项研究来自UCSD、谷歌等，共同一作华南农业大学校友Youwei Liang、清华校友……更多

2024-06-21 09:21:00华南,清华,农大,获奖,校友,生成