• 我的订阅
  • 头条热搜
腾讯AI实验室近日推出了渐进式条件扩散模型(PCDMs),这一突破性技术在姿态引导人物图像合成方面取得了显著进展。PCDMs由先验条件扩散模型、修复条件扩散模型和完善的条件扩散模型三个关键阶段组成,成功应对了源图像...……更多
英伟达超快stylegan回归
扩散模型的图像生成统治地位,终于要被GAN夺回了?就在大伙儿喜迎新年之际,英伟达一群科学家悄悄给StyleGAN系列做了个升级,变出个PLUS版的 StyleGAN-T,一下子在网上火了。无论是在星云爆炸中生成一只柯基:还是基于虚幻引...……更多
零成本突破多模态大模型瓶颈!多所美国顶尖高校华人团队,联合推出自增强技术CSR
新智元报道编辑:LRST【新智元导读】现有多模态大模型在对齐不同模态时面临幻觉和细粒度感知不足等问题,传统偏好学习方法依赖可能不适配的外源数据,存在成本和质量问题。Calibrated Self-Rewarding(CSR)框架通过自我增强学...……更多
...,包括获取待修复图像;将所述待修复图像输入图像分割模型,获得所述待修复图像中的亮斑图像区域;根据所述亮斑图像区域周围的非亮斑区域,对所述亮斑图像区域进行修复,得到目标图像。本方案通过采用图像分割模型用...……更多
google发布imagen3图像生成技术
...Google发布了Imagen3,这是该科技巨头Imagen生成式人工智能模型家族的最新产品。Google人工智能研究部门DeepMind负责人德米斯-哈萨比斯(DemisHassabis)说,与前代产品Imagen2相比,Imagen3能更准确地理解文字提示,并将其转化为图像,...……更多
用AI创作的心形图案被开发商做成实物展览,创作者起诉侵权索赔50万元
...泽华律师介绍,在“AI著作权第一案”中,法院对AI绘画模型使用者在生成图片上享有创作权益给出了首次认可,但该案判决也强调,利用人工智能生成内容是否构成作品,需要视个案情况而定。同时,“AI著作权第一案”也存在...……更多
腾讯联手多所大学推出StyleCrafter 可用于视频模型
...方法,可帮助通过风格控制适配器增强预训练的视频生成模型。论文表示,依靠StyleCrafter,模型可以根据参考图像生成不同风格的视频。为了促进内容与风格的分离,研究团队删除了文本提示中的风格描述,并使用解耦学习策略...……更多
《流浪地球》地下城怎么建?三维地学建模探秘地下空间
...技术,构建含断层、透镜体等复杂地学特征的结构和属性模型,实现地学模型的全流程一体化构建,并提供基于地学特征的可视化表达和分析功能。该产品具备高精度地下空间智能建模、复杂地质模型多精度网格剖分、动态更新...……更多
MMMU华人团队更新Pro版!多模态基准升至史诗级难度:过滤纯文本问题、引入纯视觉问答
...题、增加候选选项、引入纯视觉输入设置)更严格地评估模型的多模态理解能力;模型在新基准上的性能下降明显,表明MMMU-Pro能有效避免模型依赖捷径和猜测策略的情况。多模态大型语言模型(MLLMs)在各个排行榜上展现的性...……更多
阿里云通义千问 Qwen2-VL 第二代视觉语言模型开源
... 2 日消息,阿里云通义千问今日宣布开源第二代视觉语言模型 Qwen2-VL,并推出 2B、7B 两个尺寸及其量化版本模型。同时,旗舰模型 Qwen2-VL-72B 的 API 已上线阿里云百炼平台,用户可直接调用。 据阿里云官方介绍,相比上代模型,...……更多
标贝科技上亿像素点图像标注能力 实现标注精度和效率双提升
【每日科技网】国内大模型的发展如火如荼,也给其背后的推手——数据标注行业再添一把火。同时伴随细分领域垂类大模型越来越多,数据需求向精细化、场景化发展,需要使用更大像素、更高分辨率的图像以提供丰富细致...……更多
只要一张图就能还原绘画过程,这篇论文比Paints-UNDO实现得更早
...前在寻找 2025 fall 博士入学机会。最近,lvmin 带来了最新模型 Paints-UNDO。这款 AI 生成工具可以根据图片还原整个绘画过程,整个 AIGC 社区都为之震撼。Paints-UNDO 的演示 demo。早在 1 个月前,NUS,SJTU,Tiamat 等机构联合已经发布……更多
三星全年利润暴跌85%
...也在发生天翻地覆的改变。因为AI时代的来临,生成式大模型爆火,为了配合算力要求极高的AI服务器,DRAM和NAND存储芯片陆续被淘汰,而新的存储芯片HBM(High Bandwidth Memory,高带宽存储器)成了主流。据公开资料显示,HBM芯片是...……更多
华中科技大学白翔教授发布多模态大模型
...技大学软件学院白翔教授领衔的VLRLab团队发布了多模态大模型——“Monkey”。该模型号称能够实现对世界的“观察”,对图片进行深入的问答交流和精确描述。▲图源Monkey项目的GitHub页面IT之家注:多模态大模型是一类可以同时...……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
...的关注,但最近浙大、中科院等机构的学者们提出,先进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准,并设计了一种新颖的数据合成方法。无论是语言模型还是视觉模型,似乎都很难完成更抽象层...……更多
36氪首发|「Tiamat」完成近千万美元A轮融资,想将AI生成图像的可控性做到极致
...独家财务顾问。本轮融资额将用于继续打磨产品和自研大模型,拓展商业化能力等。数月前,「Tiamat」已经获得由DCM独家领投的数百万美元天使轮融资。36氪曾报道过的「Tiamat」是一家国内AI图像生成技术服务商,成立于2021年。...……更多
人工智能以纳米级精度检测癌症和病毒感染
...分子水平上检测和分析细胞内的微小结构。研究人员向该模型提供了许多不同类型细胞核在不同状态下的纳米级分辨率图像,从而对其进行了训练。通过分析细胞核成分在三维空间中的分布和排列方式,该模型学会了识别细胞中...……更多
英伟达gtc2024官宣成为ai领域的重头戏
...U连接在一起),并表示该系统可以支持多达10万亿参数的模型进行AI训练和实时LLM推理,成本和能耗将大幅降低。英伟达CEO黄仁勋在GTC2024重点展示了人工智能AI和仿真SIMULATION在汽车、电子元器件,生命科学,机器人领域中的GPU加...……更多
21.5万张X光,78万个问题!德州大学NIH等联合发布医学视觉问答数据集Medical-CXR-VQA
【新智元导读】多模态大语言模型(MLLM)在医学视觉问答(VQA)领域展现出巨大潜力,通过提供针对医学图像的具体临床问题的回答,有助于提高医疗专业人员的工作效率。然而,现有医学VQA数据集规模较小且问题过于简单,...……更多
OpenAI 总裁:GPT-4 并不完美但却绝对与众不同
...工智能研究公司OpenAI于昨日发布了备受期待的文本生成AI模型GPT-4。OpenAI联合创始人兼总裁格雷格・布罗克曼(GregBrockman)在接受采访时表示,GPT-4并不完美,但却绝对与众不同。GPT-4在其前身GPT-3的基础上,在许多关键方面进行...……更多
英国ai初创公司wayve公布gaia-1最新进展
10月9日消息,英国AI初创公司Wayve公布了旗下GAIA-1生成式模型的最新进展,在今年6月的时候,Wayve建立了将生成式模型用于自动驾驶的概念性验证,而在这几个月中,Wayve公司持续扩展GAIA-1,使其拥有90亿个参数,能够生成逼真的...……更多
BEV“超融合”感知部署 轻舟智航迈出量产从0到1的关键一步
...出色的 BEV感知能力,需要积累海量的已标注数据以支持模型的训练。如何找到更多高质量的数据并高效利用,是支持技术不断迭代的重要基石。轻舟智航充分利用作为高级别自动驾驶解决方案提供商在AI领域的先发优势,通过突...……更多
胡国华 无人机低空采集数据 智能管理城市行道树
...上实现城市行道树病虫害自动识别。其核心算法是‘YOLOv8模型’,全称为‘You Only Look Once(你只看一次)’。这是一种用于计算机视觉任务的对象检测算法。与传统的对象检测方法不同,YOLO将对象检测视为一个回归问题,直接...……更多
基于多尺度卷积神经网络的脑肿瘤分类与分割深度学习方法
...常只有一定数量的大切片间隙的数据可用,难以构建 3D 模型。本文方法基于的数据集包括了 233 名患者的 3064 个切片,涵盖了脑膜瘤、神经胶质瘤和垂体瘤的常见视图。这些切片被用于训练和性能测量,数据集提供了 5 倍交叉验...……更多
较传统采标方法降本80%,合成数据服务商「卓印智能」获天使轮融资 | 36氪首发
...天使轮融资,由天使湾创投独家投资。如今,随着通用大模型规模的迅速扩大,数据短缺已经成为一个更现实而迫切的问题。早在2022年11月,就有MIT等研究人员发布相关论文,指机器学习数据集可能会在2026年之前耗尽所有“高...……更多
万字长文解释 ChatGPT 在做什么,以及为什么它能发挥作用?
【CSDN 编者按】 ChatGPT 是由 OpenAI 开发的顶尖 AI 模型,旨在基于人们输入的内容生成类似的人类语言,凭借其强大的语言理解和文本生成能力,一经发布就引爆全球技术圈。近日,Wolfram 语言之父 Stephen Wolfram 在博客发布万字长...……更多
史上首个实时AI视频生成技术:DiT通用,速度提升10.6倍
...n-Sora、Open-Sora-Plan 和 Latte 在内的流行基于 DiT 的视频生成模型的质量。值得注意的是,作为一种不需要训练的方法,PAB 可以为任何未来基于 DiT 的视频生成模型提供加速,让其具备实时生成的能力。自今年起,OpenAI 的 Sora 和其...……更多
基于动态跟踪高精度3D测量技术探究主动弯曲网格壳数值模拟方法
...值模拟方法来分析受力情况及建立主动弯曲网格壳的数值模型。动态跟踪的高精度3D测量技术作为当今测量领域的前沿技术,具有高精度、高效率、高自动化等优点。在该项目中,中科广电CASAIM为华南理工大学提供先进的3D测量...……更多
苹果公司公布“mm1”多模态大模型
...dalLLMPre-training》的论文,其中介绍了一款“MM1”多模态大模型,该模型提供30亿、70亿、300亿三种参数规模,拥有图像识别和自然语言推理能力。IT之家注意到,苹果研究团队相关论文主要是利用MM1模型做实验,通过控制各种变量...……更多
架构优先、先易后难,华为的制造业生成式AI方法论
...进AI与制造行业深度融合的进程。基于统一平台,将AI大模型应用逐步落地在向制造强国的迈进过程中,AI的作用至关重要,助推从中国制造到中国智造的升级。我们能够看到,AI正在重塑整个制造业的流程,改变了研发设计、制...……更多
更多关于科技的资讯:
苹果突然打退堂鼓:据称已退出OpenAI本轮融资谈判
据媒体周五报道,苹果公司已退出了OpenAI融资轮的谈判,该轮融资预计将筹集65亿美元。媒体援引一位知情人士的话报道称
2024-09-28 17:32:00
董宇辉:不要妖魔化食品添加剂 国标范围内就没啥
快科技9月28日消息,近日董宇辉公开表示,不要妖魔化食品添加剂,国标范围内就没啥。董宇辉近期谈及食品添加剂时表示,第一大量添加剂只要在国标范围内
2024-09-28 18:02:00
鸿蒙智行傲界改名尊界 余承东:傲在中华传统文化里不太谦虚
快科技9月28日消息,余承东与马东直播时透露了鸿蒙智行傲界改名尊界的原因。余承东提到,尊界原命名为“傲界”,但傲这个字在中华传统文化里不太谦虚
2024-09-28 18:02:00
合肥光电半导体产业技术研究院三项目亮相科创展会
大皖新闻讯 9月26日,由合肥科创(人才)集团主办的2024合肥科创展会在合肥高新区中国声谷举办。来自合肥光电半导体产业技术研究院的“混合动力倾转旋翼复合翼eVTOL项目”“永磁
2024-09-28 18:16:00
华为云数字化技术发展沙龙在大渡口举行
9月27日消息,随着数字重庆建设的持续推进,软件产业与数据安全已成为城市发展的两大支柱。近日,一场主题为“推动软信产业发展
2024-09-28 18:19:00
华为pura70ultra到底有多牛?看完你就明白了
话说回来,华为此举可不只是为了和苹果“较劲”才这样无底线“降价”,作为国产手机品牌的骄傲,华为一直致力于将最前沿的技术带给消费者
2024-09-28 18:57:00
骁龙8 Gen4/天玑9400旗舰涨价板上钉钉了:有厂商拟定价4299元
快科技9月28日消息,有博主爆料,有厂商的迭代旗舰拟定价4299元(12GB+256GB),该博主还称,大部分新旗舰都将会涨价
2024-09-28 19:02:00
第三届中国抗衰大会开幕,GRANVER 吉返盾助力科学养老
“第三届中国抗衰老大会暨新质生产力推动抗衰老产业发展高峰论坛”近期在山东济南隆重开幕,大会以”科技引领抗衰老,新质生产力推动产业发展”为主题
2024-09-28 19:31:00
因殴打博主引发关注!网红东北雨姐夫妻实控约30家企业
9月28日消息,微博话题“东北雨姐夫妻实控约30家企业”冲上热搜榜,引发关注。据媒体报道,9月23日,打假博主“大娃”和“赏金猎人灰烬”爆料称
2024-09-28 19:32:00
鸿蒙智行“丈量祖国大好河山”活动隆重启动
在北京这座古韵今风交相辉映的城市里,随着金秋九月的尾声,9月28日这一天,一场盛大的发车仪式在永定门城楼下隆重举行,标志着鸿蒙智行与中国探险协会联合举办的“丈量祖国大美山河”活动正式拉开帷幕
2024-09-28 19:38:00
丈量祖国大美山河,何以鸿蒙智行?
翻开汽车工业百年历史,全球经历了一场又一场的巨变,汽车工业中心也在不断变迁。而在当今的新能源时代,中国新能源汽车正在引领全球创新
2024-09-28 19:40:00
“滴灌之星”系统开启数字化运营新篇章
9月28日消息,滴灌通澳交所发布“滴灌之星”系统,开启数字化运营新篇章。该系统旨在通过数字化手段,丰富交易产品,提升市场效率
2024-09-28 19:53:00
中国电商平台正式迈入互联互通新时代
9月28日消息,近期,中国电商领域掀起互联互通的新浪潮,各大头部平台纷纷打破壁垒,展开新一轮的合作。继淘宝天猫宣布支持微信支付后
2024-09-28 19:54:00
余承东揭秘鸿蒙智行旗下“傲界”更名原因
9月28日消息,余承东与马东在近期的直播中,揭秘了鸿蒙智行旗下车型从“傲界”更名为“尊界”的背后原因。据余承东透露,原命名中的“傲”字在中华文化中显得不够谦逊
2024-09-28 19:55:00
上海国际汽车城内的智慧出行设计谷正成为行业焦点
9月28日消息,上海国际汽车城内的智慧出行设计谷正成为行业焦点,汇聚了众多智慧出行领域的先锋力量。近日,国际智慧出行设计大会暨CCDIS中国汽车设计(国际)峰会在嘉定区隆重召开
2024-09-28 19:56:00