• 我的订阅
  • 头条热搜
广州视源电子科技股份有限公司申请图像分辨率放大模型训练专利,提高图像分辨率放大的计算效率
...示,广州视源电子科技股份有限公司申请一项名为“图像分辨率放大模型训练方法、装置、存储介质及设备”的专利,公开号CN 119693730 A,申请日期为2023年9月。专利摘要显示,本申请公开了一种图像分辨率放大模型训练方法、...……更多
抽卡效率提升4.8倍!东北大学等开源优化版Stable-Diffusion.cpp:分辨率越高越快,生成质量更好
...到2倍。整图生成速度对比:最高加速比达到4.79倍!图像分辨率越大,方法的加速效果越明显。在生成1024×1024分辨率图像时,相比于原版Sdcpp,优化后的Sdcpp在M1 Pro以及M2 Max上的推理速度提升可超过4.6 倍(FP32 类型)。对于其他...……更多
标贝科技上亿像素点图像标注能力 实现标注精度和效率双提升
...据需求向精细化、场景化发展,需要使用更大像素、更高分辨率的图像以提供丰富细致的信息进行训练和推理,标注数据的规模和复杂性也随之增加。如何提高超大像素图像数据标注的效率和精度,成为当前亟待解决的问题。例...……更多
人工智能以纳米级精度检测癌症和病毒感染
研究人员开发出了一种人工智能 AINU,它能利用纳米级分辨率图像区分癌细胞和正常细胞,并检测细胞中的早期病毒感染。这将带来更快、更准确的疾病诊断和更好的患者治疗效果。基因组调控中心(CRG)、巴斯克大学(UPV/EHU...……更多
英伟达开源NVLM 1.0屠榜多模态!纯文本性能不降反升
...无法直接进行模型对比和研究。并且,不同模型在处理高分辨率图像输入时的设计(如动态高分辨率)虽然可以提高了与OCR相关的任务(例如,OCRBench)的性能,但与低分辨率版本模型相比,在推理相关任务(例如,MMMU)上的准...……更多
文生视频让自动驾驶看到新方向
...过持续改良,陈颖聪教授团队搭建出的模型生成的3D模型分辨率更高,渲染效果更好,生成效率也有了显著提升。并且,生成3D模型的渲染方式与传统计算机图形学有非常紧密的关系,且其生成结果可以直接在标准的图像软件中...……更多
“重创”美科技股后,DeepSeek除夕再发新模型,文生图测试优于OpenAI
...的是,就在28日深夜,DeepSeek仅凭一己之力就掀翻了美国科技股。截至美股1月27日收盘,道指涨0.65%,标普500指数跌1.46%,纳指跌3.07%。英伟达暴跌16.97%,单日市值蒸发5890亿美元,创史上最大单日个股市值蒸发纪录。英伟达的暴跌...……更多
三星自研AI大语言模型 将应用于下一代智能手机
...示生成和编辑图像,包括样式更改和添加,甚至可以将低分辨率图像转换为高分辨率图像。 开发人工智能大语言模型系统,数据中心算力是基础。三星还拥有自主研发的超高速高带宽内存的新产品——HBM3E Shinebolt,为三星Gauss...……更多
小米新增超分辨率技术,仅限泊车场景,原因是算力所限?
...使用BEV大模型+占用网络方案,小米的创新点在于通过超分辨率技术实现感知精度的提升,并且提升BEV大模型的感知范围与精度。实质上,小米则是加强了Orin-X芯片的AI处理份额占比,用AI超分辨率计算做高精度感知。超分辨率占...……更多
三星公布自研生成式ai产品
...成和编辑创意图像,包括更改和添加风格,同时还可将低分辨率图像转换为高分辨率图像。三星表示,Gauss目前用于提高员工生产力,但将在不久的未来扩展到各种三星官方App,以提供新的用户体验。 ……更多
4090笔记本0.37秒直出大片!英伟达联手MIT清华祭出Sana架构,性能秒杀FLUX
...构创新,具备了惊人的图像生成速度,而且最高能实现4k分辨率。一台16GB的4090笔记本,仅需0.37秒,直接吐出1024×1024像素图片。如此神速AI生图工具,竟是出自英伟达MIT清华全华人团队之笔!正如其名字一样,Sana能以惊人速度合...……更多
惊掉下巴!被字节起诉800万实习生,拿下NeurIPS 2024最佳论文
...回归学习,采用粗到细的「下一个尺度预测」或「下一个分辨率预测」。 这种简单直观的方法使得自回归(AR)Transformer能够快速学习视觉分布,并且具有较好的泛化能力:VAR首次使得类似GPT的AR模型在图像生成中超越了扩散Tran...……更多
AI视觉进入“大模型时代”不仅“看得见”还“看得懂”
...泉卫星发射中心发射,能满足目标识别级的遥感感知的高分辨率、视频等多种探测需求。在今年夏天京津冀地区的防汛工作中,‘珞珈二号’观测到堤防决口的影像,第一时间发布预警,帮6300余名群众当天完成转移。”动态监...……更多
“伏羲慧眼”来了!国内首个应用临床眼科大模型
...“它主要的特点是可以在自然光线下,拍出一个超广角高分辨率的眼底图像,完成后会自动上传至终端,然后我们在终端接收。接收完成后,就可以对我们拍摄的图像生成一个报告讲解。”单明明解释,通过报告,我们可以看出...……更多
...理想光照情况下的高清晰图像采集。无人机巡检图像存在分辨率高、缺陷目标微小等特点,人眼辨识海量高分辨率图像中的销钉缺失、裂纹级隐患,难度高、耗时长,成为无人机巡检最薄弱一环。为此,该团队研发了高精度线路...……更多
连发两款模型“补课”,百度AI成色如何?
...单个最大6G的视频,而文心4.5仅支持12M的单个视频,在高分辨率的情况下可能只有10秒左右。对于图片和视频的理解,文心4.5则采用了时空维度表征压缩技术,提升对多模态数据的训练效率。比如,对于视频数据,可以降低帧率...……更多
你的名字 写在天上
...5kg的微纳光学遥感卫星,星上搭载了一台视频相机,空间分辨率为4.8m,幅宽为20km,可实现面阵成像、滑动成像、推帧成像和视频成像,具备光学遥感业务能力。卫星自发射入轨以来,已开展成像任务4150次以上,获取图像超39万...……更多
智慧芯同频共创,大模型智引未来,星宸科技开发者大会暨产品发布会圆满落幕
集微网消息,12月22日,星宸科技股份有限公司(以下简称:星宸科技)以“Leading AI Everywhere”为主题的2023开发者大会暨产品发布会在深圳益田威斯汀酒店隆重举行。大会上,星宸科技董事长&总经理林永育携手科大讯飞企业...……更多
超越扩散模型!自回归新范式仅需2.9秒就生成高质量图像
...1、文本特征作为起始token map,根据起始token map生成更高分辨率的token map这不仅增强了模型对新文本场景的适应性,确保模型可以泛化到新的文本提示,从整体上保证了文本描述与生成图像之间的一致性2、在每个transformer层引入...……更多
迎战GPT-4V!谷歌PaLI-3视觉语言模型问世,更小、更快、更强
...的研究,可能推动新一代规模更大的模型的发展。 更高分辨率的多模态学习最近,大型视觉语言模型在其更大的模型中使用预训练的图像编码器,其中一些使用监督分类进行预训练(如PaLI,PaLI-X,Flamingo,PaLM-E),一些使用预...……更多
meta推出全新ai图像生成器,可创建高分辨率图像
...现有的Emu图像生成模型提供支持,可根据文本提示创建高分辨率图像。它目前对美国的英语用户免费使用(后续是否收费未知),并且每个提示都会生成四个图像。此前,Meta图像生成模型因带有种族偏见的图像贴纸而面临争议...……更多
斯坦福、港大、英伟达用全息术+先进纳米光子实现普通尺寸AR眼镜
...造的超表面波导与HOLOYE LETO-3纯相位SLM相结合。这个SLM的分辨率为1080 × 1920像素,间距6.4 μm。由于我们的照明通过波导的背面,研究人员稍微倾斜SLM和照明,这样数字内容就不会被到达SLM之前耦合到波导中的任何不需要的光...……更多
行空板MultinomialNB模型实现古诗词作者快速识别
...R开发板。 ·设置TesseractOCR的路径。 ·打开摄像头并设置分辨率和缓冲区大小。 ·创建一个全屏窗口用于显示图像。 ②定义函数: ·定义drawChinese函数,用于在图像上绘制中文字符。 ③加载模型: ·使用joblib加载预训练的Mul...……更多
2B多模态新SOTA!华科、华南理工发布Mini-Monkey,专治「切分增大分辨率」后遗症
...解了传统图像切分策略带来的锯齿效应,提升了模型在高分辨率图像处理和文档理解任务的性能。它在多项基准测试中取得了领先的成绩,证明了其在多模态理解和文档智能领域的潜力。最近,提升多模态大模型处理高分辨率图...……更多
苹果300亿参数大模型首亮相,还买了家AI公司|焦点分析
...效果苹果做了各种变量实验,通过修改数据源、修改图像分辨率等,来看各种因素对模型效果的影响。△摘自苹果发布的论文《MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training》目前,苹果发现让多模态大模型变得更聪明.……更多
英伟达超快stylegan回归
...数量是StyleGAN3的3倍,基于ImageNet训练,能生成1024×1024高分辨率的图像,并借鉴了StyleGAN2和StyleGAN3的部分架构设计。它的整体架构如下:具体到细节上,作者们对生成器、判别器和文本对齐权衡机制进行了重新设计,用FID对样本...……更多
DeepSeek-VL2 开源:AI视觉模型迈入 MoE 时代
...故事生成等新能力架构:视觉部分使用切图策略支持动态分辨率图像,语言部分采用 MoE 架构低成本高性能训练:继承 DeepSeek-VL 的三阶段训练流程,同时通过负载均衡适配图像切片数量不定的困难,对图像和文本数据使用不同流...……更多
北大、快手开源视频生成模型Pyramid Flow,1分钟生成5秒视频
...视频生成模型。Pyramid Flow能根据文本描述制作长达10秒、分辨率为1280×768、每秒24帧的视频。Pyramid Flow采用了金字塔流匹配算法,优化了视频生成的效率和质量。这一算法将视频生成过程分解为多个阶段,每个阶段对应着不同的...……更多
什么是ai绘图工具?
...图平台甚至都是使用它的模型来提供进阶的绘图服务。高分辨率图像生成:能够生成高质量、细节丰富的图像。 丰富的风格和主题选择:支持多种艺术风格和主题,满足不同创作需求。灵活的配置选项:用户可以根据需求调整...……更多
阿里开源版Sora上线即屠榜 4070就能跑 免费商用
...消费级显卡上本地部署还是比较吃力的。 不过14B(支持分辨率720P)之外,还有一个1.3B的小号版本(支持分辨率480P),在一块4090上占用显存是8个多GB,消耗时间4分21秒。如此观之,用12GB的4070,也是能带动的。同时阿里还上线...……更多
更多关于财经的资讯:
洽洽食品等成立老魔坊魔芋生物科技公司
近日,云南洽洽老魔坊魔芋生物科技有限公司成立,注册资本6000万元,经营范围包含:生物基材料制造;初级农产品收购;农产品的生产、销售、加工、运输、贮藏及其他相关服务等。企查查股权
2025-12-03 13:48:00
双首单科创债成功发行 青岛银行科技金融赋能民企创新突破
11月27日,由青岛银行独立主承销的“25临工重机PPN001(科创债)”顺利完成发行,标志着山东省首单首次注册民营企业科创债
2025-12-02 14:25:00
万达电影成立意马当先影视传媒公司
近日,北京意马当先影视传媒有限公司成立,法定代表人为沈晨,经营范围包含:电视剧发行;广播电视节目制作经营;电影发行;电视剧制作;电影制片;电影摄制服务等。企查查股权穿透显示,该公
2025-12-02 14:48:00
中国资源循环集团等在江苏新设城市更新公司
近日,中资环新源城市更新(江苏)有限公司成立,法定代表人为李九辰,注册资本9000万人民币,经营范围包括建设工程施工、建设工程勘察
2025-12-02 14:48:00
万润科技等在湖南成立智慧能源新公司
近日,湖南万润湘设智慧能源有限公司成立,经营范围包含:热力生产和供应;供冷服务;合同能源管理。企查查股权穿透显示,该公司由万润科技(002654)全资子公司深圳万润新能源有限公司
2025-12-02 14:48:00
宇树科技双足机器人专利获授权,可用于教育娱乐等领域
近日,杭州宇树科技股份有限公司“双足机器人”专利获授权。企查查专利摘要显示,本外观设计产品用途用于巡检、安防、搬运、教育、娱乐、服务、工业作业或勘察等机器人,其设计要点在于形状。
2025-12-02 14:48:00
兴业银行发行50亿元绿色金融债券 首期票面利率为1.81%
12月1日,兴业银行发布公告称,经中国人民银行批准,兴业银行于2025年12月1日在全国银行间债券市场成功发行了该公司2025年第三期绿色金融债券
2025-12-02 14:49:00
农行200亿元第三期总损失吸收能力非资本债(债券通)落地
12月1日,中国农业银行股份有限公司(以下简称“农业银行”)公告称,其2025年总损失吸收能力非资本债券(第三期)(债券通)已发行完毕
2025-12-02 14:51:00
泽州浦发村镇银行获批解散 浦发银行承接其全部资产、负债等
12月2日,国家金融监督管理总局山西监管局发布关于泽州浦发村镇银行股份有限公司解散的批复,同意解散泽州浦发村镇银行股份有限公司,该行全部资产、负债、业务、网点、人员及其他权利义务
2025-12-02 14:52:00
周梦晨获批担任元亨泰富保险经纪江西分公司主要负责人
12月2日,江西金融监管局发布关于周梦晨元亨泰富保险经纪(宁波)有限公司江西分公司主要负责人任职资格的批复,核准周梦晨元亨泰富保险经纪(宁波)有限公司江西分公司主要负责人的任职资
2025-12-02 15:42:00
广州农商银行122.5亿元重大资产出售完成 剩余款项分9期收回
11月29日,广州农村商业银行股份有限公司(股份代号:1551,以下简称“广州农商银行”)正式完成一项非常重大资产出售事项
2025-12-02 15:50:00
山西银行:董事会同意聘任邢毅为行长
12月1日,山西银行官网发布行长变更公告,披露该行管理层人事调整事宜。根据公告,经山西银行第一届董事会2025年第二次临时会议审议通过
2025-12-02 16:04:00
技术解码宜美全光谱灯具:我们如何重新定义“好光线”?
当“长时间用眼”成为现代人的生活常态,灯光质量的重要性已不言而喻。我们或许都曾经历过在灯光下阅读不久便眼干涩、颜色失真的困扰
2025-12-02 16:27:00
中行德州分行成功落地资本项目收入境内人民币线上汇划业务
鲁网12月2日讯(记者 吴美琳 通讯员 王汉源)为贯彻落实《中国人民银行国家外汇管理局关于提升银行办理资本项目业务数字化服务水平的通知》相关要求
2025-12-02 16:51:00
第三届济南科技金融论坛:贯通资本市场枢纽,驱动科技产业循环
鲁网12月2日讯在国家将“科技金融”置于金融“五篇大文章”首位,并明确要求“构建同科技创新相适应的科技金融体制”的背景下
2025-12-02 16:51:00