• 我的订阅
  • 头条热搜
AI 通过图像验证的方法:假装自己视力不好
...理信息不仅更加智能,还支持了图片的识别功能。拥有“视力”的GPT-4,在各项考试中都进步明显 除了当天的发布会,官方还发布了一份长达98页的技术报告,详细分析了GPT-4的各项特性。值得注意的是,这份报告除了描述GPT-4...……更多
基于多尺度卷积神经网络的脑肿瘤分类与分割深度学习方法
研究背景医学图像的自动分割和分类在脑肿瘤的诊断、预测和治疗中起着重要作用。使用传统的手动程序对数据库中的脑肿瘤图像进行定位和分类需要耗费大量的精力和时间成本。深度学习技术的出现为这一问题提供了解决方...……更多
长上下文能力只是吹牛?最强GPT-4o正确率仅55.8%,开源模型不如瞎蒙
...上下文长度(干扰图片的数量),将现有的VQA基准和简单图像识别集 (MNIST) 扩展为测试长上下文「提取推理」的示例。结果在简单VQA任务上,VLM的性能呈现出惊人的指数衰减。——LLM:原形毕露了家人们。而与实际研究相对的,...……更多
产品角度分析GPT-4的更新及影响
...了什么这些更新将带来什么影响01 GPT-4更新了什么 1. 支持图像理解(☆☆☆☆☆)首先,澄清一个误区,大家印象中ChatGPT好像早就支持图像输入了例如GitHub上19.3K Stars的这个项目:Visual-ChatGPThttps://github.com/microsoft/v……更多
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...VCR 数据集简介为了开发 VCR 任务,研究人员构建了一个由图像 - 文字生成 VCR 合成图像的流程。在该流程中可以通过控制遮住文字的白色矩形大小来改变图像中文本的可见性,从而控制任务难度。借由该数据生成流程,研究人员...……更多
多模态模型免微调接入互联网,即插即用新框架,效果超闭源方案
...搜索引擎调用 分层过滤 在查询生成阶段,需要对问题和图像进行充分地理解,以转化为适用于搜索引擎的文本查询。对于问题而言,直接使用手工设计的prompt调用LLM得到问题查询词。对于图像而言,调用必应视觉搜索得到包含...……更多
ui自动化测试技术发展历程
...于控件的对象识别和操作,转换为基于AI自然语言处理的图像、文字识别与操作。通过AI技术的对象识别可以突破很多页面控件的难题,实现跨操作系统、跨浏览器的自动化测试,有效降低脚本的开发和维护成本。UI自动化测试技...……更多
白内障术后 3 个月很关键!做好日常护理!
...遍的眼病,是全球首位致盲性眼病。它如同一个无形的“视力窃贼”,悄然无声地影响着许多人的生活质量。白内障是指眼睛中的晶状体发生混浊,云雾一般遮盖了原本清晰的视野。晶状体位于虹膜后方,正常情况下应该是透明...……更多
吉林大学研发的卫星,达到国际先进水平
...—“苏州一号”(吉天星A-03星),双星在轨测试总结评审、图像质量分析报告评审暨数据产品发布活动在北京举行。活动中,评审专家认真听取《吉天双星在轨测试总结报告》和《吉天双星图像质量分析报告》的详细汇报,对有关...……更多
本文转自:中国医药报规范图像AI分析软件非临床评价资料填写——《病理图像人工智能分析软件性能评价审评要点》概述□ 韩昭昭病理图像人工智能分析软件是指基于数字病理图像,采用深度学习等人工智能技术实现对病理...……更多
《科学》杂志将使用AI检测欺诈性图像
...,《科学》杂志将使用人工智能(AI)来检测欺诈性科学图像,该刊主编宣布将换掉“人眼”进行的图像验证,在文章发表前由人工智能对图像进行过滤,以避免欺诈。检测科学文章中被处理过的图像已成为揭示欺诈性结果的主...……更多
ME视光,“眼绎睛彩,成就新视界”
...视光贵州炯瞳有限公司(贵阳总部),将一面写有“提升视力,效果显著”的锦旗送至ME视光贵阳总部的负责人龚艳老师手中,王女士表示:“感谢ME视光贵阳总部全体成员的精心调理,让我的女儿(化名小音)恢复健康视力,...……更多
微软AR/VR专利探索解决近视处方镜片对眼动追踪的折射干扰
...框架110支持透明显示器115和间隔于透明显示器115的处方或视力矫正透镜120。显示器115可以是用于MR或AR头戴式设备100的透视显示器,并允许用户的眼睛125通过处方透镜120和透视115进行观察。 眼动追踪摄像头130可以支撑在透明115的...……更多
...件下的不同距离处保持清晰的焦点。新镜片的工作原理与视力矫正渐进镜片非常相似,但没有这些镜片通常出现的扭曲现象。该成果可帮助推进隐形眼镜技术、白内障眼内植入物和微型成像系统的开发。研究论文发表在新一期《...……更多
对比学习滥用隐私数据!中科院等发布「多步误差最小化」方法 | ACM MM2024
...以保护个人数据不被多模态对比学习模型滥用。通过优化图像噪声和文本触发器,MEM方法有效地误导模型,降低其对隐私数据的学习能力,并在不同模型间展现出强大的可迁移性。多模态对比学习(如CLIP)通过从互联网上抓取...……更多
iPad可用AI绘画交互编辑神器火了,网友:颤抖吧PS
...汽车、蛋糕等,都可以快速修改!有多位网友评论说,AI图像编辑真的进步飞快,“能读懂用户心思”是非常具有未来感的用户体验。甚至还有网友说,颤抖吧,PS! MagicQuill目标是理解精细修改意图虽然目前AI图像编辑工具是百...……更多
我们常用的验证码也 AI 了
...选择正确的答案,背后的目的是让用户对程序难以识别的图像进行标注,提高AI的识别能力。在第一轮验证中,验证码系统已经知道正确答案了,如果你能做对,系统就知道你是真人。之后验证码系统会放出第二、第三组图片,...……更多
无需训练即可大幅提升SAM 2!SAM2Long来了,港中文 上海AI Lab出品
...性能。SAM2Long 方法简述1. SAM 2 的基础概述SAM 2 是一种用于图像和视频对象分割的基础模型。与 SAM 不同,SAM 2 引入了一个内存模块,该模块利用先前帧的信息和提示帧特征来帮助当前帧的分割。在视频对象分割任务中,SAM 2 会在...……更多
一文看尽Meta开源大礼包!全面覆盖图像分割、语音、文本、表征、材料发现、密码安全性等
...元报道80【新智元导读】Meta最近开源了多个AI项目,包括图像分割模型SAM 2.1、多模态语言模型Spirit LM、自学评估器和改进的跨语言句子编码器Mexma等,提升了AI在图像处理和语音识别领域的能力,进一步推动了AI研究的进展。开源...……更多
为什么人工智能不是免费的?
...测试,涵盖了一系列用例,从回答问题到识别物体和生成图像。在每种情况下,他们都运行了1000次任务,并估计了能量消耗。他们测试的大多数任务使用少量的能量,比如0.002千瓦时用于分类书面样本,0.047千瓦时用于生成文本...……更多
基于多光谱遥感数据的火灾与烧伤区域联合探测的监督机器学习方法
...训练。 本文提出并介绍了一种基于有监督ML模型和卫星图像的火灾和烧毁面积并发组合检测方法。总的来说,所有选定的七种多重层析方法都取得了令人满意的分类结果。总之,1D-CNN和ET是性能最好的模型,在测试子集中的 整...……更多
如何读懂眼底的“健康密码”?专家有话说
...病的范畴。早期发现和及时治疗对于预防病情恶化和恢复视力至关重要。那么,检查眼底能发现哪些常见的疾病?目前治疗眼底疾病的方式又有哪些?近日,北京同仁医院眼底病科主任医师卢宁和中华医学会眼科分会防盲学组委...……更多
2B多模态新SOTA!华科、华南理工发布Mini-Monkey,专治「切分增大分辨率」后遗症
...分策略(MSAC)和尺度压缩机制(SCM),有效缓解了传统图像切分策略带来的锯齿效应,提升了模型在高分辨率图像处理和文档理解任务的性能。它在多项基准测试中取得了领先的成绩,证明了其在多模态理解和文档智能领域的...……更多
苹果解锁visionpro虹膜身份验证系统
...仅使用密码进行身份验证。IT之家注意到,对于需要矫正视力的用户,OpticID可以与VisionPro的蔡司光学镜片和处方软性隐形眼镜配合使用。苹果表示,OpticID使用“先进的硬件和软件”进行虹膜识别。“设置OpticID时,空间时间调制...……更多
MMMU华人团队更新Pro版!多模态基准升至史诗级难度:过滤纯文本问题、引入纯视觉问答
...对答案的概率;3. 引入纯视觉输入设置,即问题直接写在图像中,既要求模型像人一样同时具有「看」和「读」的能力,也可以在现实场景中直接将模型用于屏幕截图或照片,无需分离问题与图片;实验结果显示,模型在MMMU-Pro...……更多
获中国首幅太阳过渡区图像 “创新X”系列首发星多项新成果发布
...1月11日电 (记者 孙自法 郑莹莹)获得中国首幅太阳过渡区图像、捕获国际迄今最亮伽马暴、实现国产量子磁力仪首次全球磁场勘测……中国科学院微小卫星创新研究院(中科院卫星创新院)11日对外发布由其抓总研制的“创新X”系...……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
...就联合提出了一种新的多模态基准,专门衡量模型对抽象图像的理解能力和视觉推理能力。论文地址:https://arxiv.org/pdf/2407.07053数据集共包含11,193个带有相关问题的抽象图像,涵盖了仪表板、路线图、图表、表格、流程图、关系...……更多
科技观察|十大科技进展新闻:中国宇宙探索进展神速 世界对“生命”认识深入
...人员通过提取猪胶原蛋白制成的人工角膜,成功使失明或视力受损的人恢复了视力,且手术两年后,患者没有严重并发症或副作用的报告。该研究结果有助于开发出一种符合人类植入物标准、可以大规模生产并储存长达两年的生...……更多
苹果大模型,不藏了
...上个月,苹果先是推出了名为Ferret的多模态大语言模型,图像处理技术堪称惊艳;而后又发布了一篇题为《闪存中的大型语言模型:在有限内存下高效的大型语言模型推理》的论文,直指大模型落地iPhone等“内存有限”设备的方...……更多
小米申请 AR 眼镜新专利,可识别二维码执行付款操作
...序产品。在本公开的一些实施例中,利用AR眼镜上设置的图像采集设备采集当前环境图像;从所述当前环境图像中提取收款方的二维码图像;响应对所述二维码图像的识别操作,生成身份验证指令;根据所述身份验证指令,获取...……更多
更多关于科技的资讯:
特斯拉沟通邮件曝光!无人驾驶车队计划“进军”得州首府
据媒体报道,特斯拉公司正在与奥斯汀市就其自动驾驶汽车技术进行早期讨论,希望最早于明年在这个城市的道路上推出其首个无人驾驶车队
2024-12-20 00:00:00
《潜行者2》再次更新
GSC发布了《潜行者2》1.1版补丁,号称修复了1800多个问题,主要改进之处集中于A-Life系统,平衡性调整,游戏崩溃与帧率优化
2024-12-20 00:00:00
嫦娥六号月壤样品揭示首个月球背面古磁场信息
本文转自:人民日报客户端12月20日,国际学术期刊《自然》发表了中国科学院研究团队的一项重大研究成果,科研团队利用嫦娥六号采回的月球背面样品获得人类首个月背古磁场信息
2024-12-20 00:25:00
全球首款电荷泵移动电源发布:定制刀片电池 15分钟充满
快科技12月19日消息,闪极电荷泵移动电源100W发布,首发价399元!现已在闪极小程序开启预订。其独特的电荷泵技术,使得充电效率高达98%
2024-12-20 00:30:00
小米巅峰机皇!小米15 Ultra搭载2亿像素长焦:支持100x AI融合变焦
快科技12月19日消息,综合多方消息来看,小米15 Ultra将会在明年2月发布,也就是春节之后。新机除了一英寸主摄之外
2024-12-20 00:30:00
科学家复活了3万年前的种子 开花后才发现大不同
全球大约有11%的表面被永久冻土覆盖,这些土地至少持续两年时间温度维持在0摄氏度以下,它们存在于南北极地地区,以及高山和部分极地海床
2024-12-20 00:30:00
oppofindn5年后发布,有着更轻薄的机身
近日有消息称,不少厂家已经推迟了旗下折叠屏手机的发布时间。不过这其中可能并不包括OPPO。有爆料称,OPPO折叠屏新机将会在不久后与人们见面
2024-12-20 01:09:00
上个月,OPPO在国内正式发布了全新的Reno13系列,包括Reno13和Reno13Pro两款机型。根据最新消息,这两款机型的全球发布预计将在明年进行
2024-12-20 01:13:00
问界m9OTA更新新增多项功能,对导航等细节重点优化
近日,鸿蒙智行官方宣布,问界新M7今年累计交付量已突破19万辆,连续12个月蝉联新势力累计销量榜首。而在M7之上,问界M9也成为了50万元以上的标杆车型
2024-12-20 01:28:00
据官方消息,OPPOA5Pro将于12月24日14:30正式发布。新机号称“耐用战神”,主打“超防水,超抗摔,超耐用”
2024-12-20 01:33:00
鸿蒙智行携手“四界”亮相央视新闻《中国经济引力场》
12月19日中午12点,央视新闻《中国经济引力场》将迎来一场特别的节目——鸿蒙智行携手“四界”联袂登场。届时,华为常务董事
2024-12-20 01:42:00
一加ace5系列定档12月26日发布,包括两款手机
12月19日,一加手机正式官宣,一加Ace5系列定档12月26日14:30发布。同时一加手机官宣@UziQAQ成为一加Ace首席电竞官
2024-12-20 01:46:00
哪里有用户需要,哪里就有华为服务
在科技快速发展的当下,越来越多用户关注有温度的服务。近日,梨视频发布了一支《风沙中的温暖驿站》的微纪录片,介绍了关于华为授权服务中心(吐鲁番高昌中路)与用户的温暖故事
2024-12-20 01:47:00
小米pocox7系列预计将于下月在印度市场发布
近日,有关小米POCOX7系列的消息在网络上持续发酵。据悉,该系列将包含两款机型:POCOX7和POCOX7Pro。多方爆料显示
2024-12-20 02:21:00
小米新旗舰耳机入网:支持5.1ghzwifi
根据博主@体验more的消息,小米的新旗舰耳机已经入网,型号为M2438E1。让人惊喜的是,它竟然支持5.1GHzWiFi
2024-12-20 02:22:00