• 我的订阅
  • 头条热搜
微软开源 OmniParser 纯视觉 GUI 智能体:让 GPT-4V秒懂屏幕截图
...息,科技媒体 marktechpost 于 10 月 24 日发布博文,报道称微软公司宣布开源 OmniParser,是一款解析和识别屏幕上可交互图标的 AI 工具。项目背景传统的自动化方法通常依赖于解析 HTML 或视图层次结构,从而限制了其在非网络环境...……更多
谷歌版贾维斯即将问世,最强Gemini 2.0加持!AI自主操控电脑时代来临
...称谷歌同类Project Jarvis预计年底亮相。AI操控电脑已成为微软、苹果等巨头,下一个发力的战场。AI接管人类电脑,就是下一个未来!几天前,Anthropic向所有人展示了,Claude 3.5自主看屏幕操作光标完成复杂任务,足以惊掉下巴。...……更多
人生搜索引擎免费用,哈利波特“冥想盆”登GitHub热榜,支持中文
...个项目大量借鉴了之前就很火的“记忆助手软件”Rewind和微软的Windows Recall功能。但是,这两个emmm……Rewind要收费(基础版12美元/月),微软的延期了。所以,既免费、又立即可用的Pensieve是真香了!这不,代码更新后迅速登上...……更多
微软正研发面部照明AI技术:视频时可自动调整屏幕亮度
快科技8月14日消息,据媒体报道,微软正致力于一项创新性的面部照明技术研发,旨在视频会议场景中自动优化屏幕亮度,为用户带来前所未有的视觉体验。这项技术的核心在于智能调节,确保每位参与者的面部在会议中都能...……更多
llava-1.6与gpt-4vmp面硬刚的性能,一起来看看
...4月的初级版本、2023年10月的LLaVA-1.5之后,2024年1月31日,微软研究院又联合威斯康星大学麦迪逊分校和哥伦比亚大学的研究者共同发布了多模态大模型LLaVa(Large Language and Vision Assistant)的1.6版本。与GPT-4V只提供API接口的闭……更多
AIPC,微软联想华为谁能扛大旗
...周路平沉寂多时的PC市场,迎来了久违的热闹。不久前,微软推出了号称“史上最强Windows PC”——Copilot+PC,给市场打了个样,并带动华硕、戴尔、联想、三星、惠普和宏碁等多家PC厂商,纷纷宣布推出符合Copilot+PC标准的新款AI PC...……更多
MMMU华人团队更新Pro版!多模态基准升至史诗级难度:过滤纯文本问题、引入纯视觉问答
...「读」的能力,也可以在现实场景中直接将模型用于屏幕截图或照片,无需分离问题与图片;实验结果显示,模型在MMMU-Pro上的性能明显低于 MMMU,下降 16.8% 到 26.9%,模型的排名通常与原始模型相似,但GPT-4o mini 模型的健壮性与G...……更多
谁会买三星5999元的AI手机?
...研发自己的大模型。ChatGPT的爆发使以软件为主要产品的微软以及国内各种“大厂云”吃到了第一波大模型的“红利”,现在各大手机厂商争相发布大模型端侧落地显然也是想把AI大模型的热潮引到手机硬件当中。 AI智能手机想...……更多
11月1日消息,据外媒报道,微软日前推出Windows11PC操作系统的下一个重大更新,新版本包含名为Copilot的聊天机器人。据悉,Copilot是一种依赖于底层大型语言模型的生成式人工智能,只需用户的简单指导即可创建文本和其他内容...……更多
微软推出全能型人工智能模型 Kosmos-1
...于ChatGPT的必应聊天已经让不少用户感受到了AI的强大,而微软于近日推出了更为强悍的全能型AI--Kosmos-1。ChatGPT是纯文本LLM,而它是更强大的多模式大型语言模型(MLLM)。Kosmos-1可以分析图像的内容、解决视觉难题、执行视觉文...……更多
微软正在添加一项新功能
...wsCopilot目前提供的功能很少,但这种情况很快就会改变。微软正在添加一项新功能,让你用户截取屏幕并要求人工智能进行解释。这项名为\"添加屏幕截图\"的新功能正在向公众推出,但不一定每个人都能使用。通过Copilot面板中...……更多
微软开始探索在截图功能中加入copilot
...wsLatest今天报道,Canary频道最新MicrosoftEdge浏览器版本中,微软开始探索在截图功能中加入Copilot。该媒体发现了名为“msEdgeWebCaptureAskCopilotMenu”的新实验特性,不过启用之后尚未生效,从名称判断应该是Edge截图之后可以调用Copi……更多
微软发布旗下最小语言模型phi-2
11月17日消息,微软Ignite2023大会已拉开帷幕,微软在本次活动中发布了旗下最小的语言模型Phi-2,共有27亿参数,相比较此前版本有明显提升。注:微软于今年6月发布Phi-1,只有13亿代码,适用于QA问答、聊天格式和代码等等场景...……更多
深交所紧急发函! ChatGPT成多公司翻身密码?谷歌、微软也出手了
...上层的搜索等应用。文心一言,位于模型层。按照谷歌和微软节奏,文心一言开放内测还有可能提前。当21世纪经济报道记者问及“百度是否会推出类似ChatGPT”的产品时,百度搜索杰出架构师辜斯缪透露百度内部已有类似可用的...……更多
Claude接管人类电脑编程,程序员沸腾!OpenAI反击,智能体大战一触即发
...线,而是 先授予与OpenAI密切合作的公司访问权限(比如微软),方便他们构建自己的产品和功能。不过,网友们的「美梦」还没做多久,Altman就站出来辟谣了:通通都是fake news!在软件开发上,OpenAI目前正在开发多个产品和功...……更多
以公共预览形式,微软开放AI计算机视觉模型Florence
微软于2021年启动了 ProjectFlorence,该AI计算机视觉模型结合Web图像-文本数据的通用视觉语言表征,可以轻松地适应分类、检索、目标检测、视觉问答(VQA)、图像描述、视频检索和动作识别等各种计算机视觉任务。微软于今天宣...……更多
notex3pro阅读器获推booxos3.5.2系统版本
...化,功能更易于查找。文石AI大模型上线新增3类AI大模型微软GPT通义千问文心一言支持3种调用方式App控制中心悬浮球拥有5档回答字数支持输出字数篇幅自定义适配3种输入方式键盘输入语音输入手写输入使用步骤“应用”→“AI...……更多
微软演示活动出现事实性错误
...天机器人演示活动现场翻车导致其股价当天暴跌逾7%,但微软的演示活动同样出现了事实性错误。上周的科技圈掀起了一个聊天机器人的小高潮,微软和谷歌都试图通过展示早起版本的AI搜索来先发制人。微软更是宣布,该公司...……更多
微软推出windows11build26217
微软正在向Canary频道的测试者推出Windows11Build26217,其中包含一些小的错误修复。不过,Build26217指向了\"设置\"中一个新的隐藏页面,用于管理\"AI组件更新\"。与Windows安全更新类似,你将能够管理AI组件的更新。微软观察者Phantomo...……更多
微软moment5更新:语音访问新增功能
3月1日消息,微软今日推出了Win112月非安全预览更新补丁KB5034848(可选更新),更新后系统版本号升至22621.3235和22631.3235(适用于22H2和23H2)。安装KB5034848后即可尝试获取“Moment5”配置更新(在设置中打开“在最新更新可用后立...……更多
智谱开源GLM-PC 基座模型CogAgent-9B,让 AI 智能体“看懂”屏幕
...专用于智能体(Agent)任务。IT之家注:该模型仅需屏幕截图作为输入(无需 HTML 等文本表征),便能根据用户指定的任意任务,结合历史操作,预测下一步的 GUI 操作。得益于屏幕截图和 GUI 操作的普适性,CogAgent 可广泛应用于...……更多
机器人装上OpenAI大模型:合作仅13天,能思考会识别,动作流畅
...伟达、亚马逊创始人杰夫·贝索斯(Jeff Bezos)、科技巨头微软以及其他几家大型科技公司的投资,在本轮融资中累计筹得约6.75亿美元,公司估值达到26亿美元。 ……更多
纪念科学家汤晓鸥:黑羊远去
...生,他开始频繁往返于香港和北京两地。两年后,他接受微软亚洲研究院的邀请,在新成立的视觉计算组担任组长。汤晓鸥对微软亚洲研究院一直有很深的情怀,2016年他在一篇自述中,形容微软洲研究院和IBM及Google在中国的研...……更多
【产业互联网周报】字节回应被曝秘密利用OpenAI;英特尔预告Gaudi 3将超越H100;阿里云M7蔡英华离职;马斯克回应Grok抄ChatGPT作业
...2001年创立了香港中文大学多媒体实验室;2005年至2007年在微软亚洲研究院工作,担任视觉计算组主任;2008年在深圳先进技术研究院多媒体集成技术研究室工作,担任主任和研究员。汤晓鸥主要从事计算机视觉相关领域的研究,...……更多
微软发布windows11build26040预览版更新
1月27日消息,微软今天面向Canary频道的WindowsInsider项目成员,发布了适用于Windows11的最新预览版Build26040,并同步放出了最新ISO安装镜像。IT之家附上Windows11Build26040预览版更新内容如下:跨平台截图现在用户在绑定了Windows系统的A……更多
Claude 3.5深夜觉醒,学会模仿人类用电脑!编程干翻o1,Agent一夜变天
...角落,Claude能帮我们完成吗?只见它开始截取小哥的屏幕截图,并且很快发现:蚂蚁设备公司并不在表格中。这时,它立刻切换到CRM系统中,去搜索这个公司。找到后,它开始滚动页面,查找填表所需的所有信息,然后提交了表...……更多
首批大模型终端设备开售,换汤不换药,更便宜的表现却更好?
...Humane公司还有数十名前苹果员工,融资则包括Sam Altman、微软、沃尔沃和LG等公司。外界也普遍认为,由前苹果员工来挑战苹果创造的智能手机王朝,合情合理。 2023年11月,Ai Pin正式发布,作为一款无屏幕设备,它完全依靠语音...……更多
微软一夜干翻苹果Mac!GPT-4o装进全家桶,微软把全世界PC都AI了
【新智元导读】微软昨夜首发Copilot+ PC,直接把钢铁侠的Jarvis带进现实!全新NPU架构,配上地表最强GPT-4o等40+模型,让Windows PC击败苹果Mac,成为有史以来最快、最智能的PC。显然,一个全新的AI时代正式开启。GPT-4o诞生刚过去一...……更多
OpenAI举办“AI春晚”;李开复大模型破纪录 | 图灵周报
...A股、美股的“超导概念股”都曾受影响,大幅波动。 03微软以安全问题为由限制员工访问ChatGPT图源:Pixabay在当地时间周四的一段时间内,微软员工被禁止使用OpenAI产品ChatGPT。微软在内部网站上的最新消息中表示,“出于安全...……更多
全球市值第一背后的AI算力焦虑
...。本月内,人工智能芯片公司英伟达市值先后超过苹果、微软,登顶全球市值第一的公司。而在这个“第一”背后,是众多大模型厂商的“算力焦虑”。英伟达股价截图当算力成为人工智能的关键当地时间6月18日美股收盘,英伟...……更多
更多关于科技的资讯:
买奥迪当嫁妆两个月无法提车 4S店:合格证在银行 所有车都卖不了
快科技2月12日消息,据报道,浙江绍兴周女士介绍,去年12月8日,家里人在绍兴宏奥4S店,花费22.6万多给她外甥女购买了一辆奥迪A4L
2025-02-12 19:19:00
2.7万条三文鱼“出逃” 海产品公司竟以每条325元悬赏抓捕
快科技2月12日消息,据媒体报道,近日,总部位于挪威的全球知名海产品公司美威正在重金悬赏抓捕“出逃”的2.7万条三文鱼
2025-02-12 19:19:00
美味的深海怪物!一鮟鱇鱼海面游泳被人类偶遇:着实罕见
快科技2月12日消息,在常年见不到阳光的海洋深处,其实也生活着不少的动物,其中大多数长相丑陋,毕竟也见不到什么人,就随便长长算了
2025-02-12 19:19:00
23岁小伙两个月减肥40斤致秃头:不吃任何碳水化合物
2月12日消息,据媒体报道,宁波一名小伙遇到了“脱发危机”。据小伙介绍,他体重200斤,决心依靠“管住嘴”来减重,几乎不碰油脂
2025-02-12 19:19:00
最高频率近3.3GHz!索泰RTX 5080 AMP EXTREME INFINITY评测:超频后与RTX 4090相去不远
一、前言:支持双BIOS的索泰RTX 5080次旗舰1月29日,RTX 5080正式解禁,在实际功耗比上代RTX 4080低了近10%的情况下
2025-02-12 19:49:00
山东登上《哪吒2》全国各省票房榜第一名 网友:山东人不语只是一味买票
2月12日消息,据媒体报道,截至2月12日11时,《哪吒2》全国各省份票房数据显示,山东登上全国第一位。对此,有网友表示
2025-02-12 19:49:00
ABC比基尼安睡裤卫生巾被抵制 官方回应:非新品 去年已停止生产
快科技2月12日消息,日前,ABC一款“比基尼安睡裤”卫生巾新品引发热议。有网友认为,该产品为“经期性感”牺牲舒适度,比基尼式还有偷工减料的嫌疑
2025-02-12 19:49:00
如何理解引力波效应?《张朝阳的物理课》推导测地偏离方程
上次物理课已讲完引力波的挤压模式和摇摆模式,本次物理课从测地线方程推导出弱场慢速近似下的形变方程。2月9日12时,《张朝阳的物理课》第二百三十三期开播
2025-02-12 19:56:00
江西定南:开足马力忙生产
本文转自:人民网-江西频道在生产车间内,智能“下片”机器人在抓取生产的光伏玻璃产品。近日,在位于定南县老城镇的赣悦新材料有限公司生产车间内
2025-02-12 20:04:00
雷军元宵节宴请SU7 Ultra车主 称不少宝马Mpower车主选择我们
快科技2月12日消息,雷军元宵节直播时宴请了几位小米SU7 Ultra车主。在得知该用户是宝马M5车主后雷军表示:“不少宝马Mpower车主选择我们”
2025-02-12 20:19:00
真的不要久坐了 这个位置会凹陷!2个方式改善
每次看到别人的蜜桃臀,都十分羡慕,毕竟不少人都是“趴趴臀”“方方臀”。而臀部不美观的一个关键因素,其实就是——臀部两侧的凹陷
2025-02-12 20:19:00
RTX 5090D最佳平替!AMD RX 9070 XT将有32GB海量显存
快科技2月12日消息,AMD RX 9070系列虽然是这一代的最高端,但其实是个主流芯片,定位相当于上代的RX 7800系列
2025-02-12 20:19:00
雷军谈为什么要做大规模驾驶培训:上过几次墙 才会对速度敬畏
快科技2月12日消息,在今晚的元宵节直播中,小米创始人、董事长雷军探讨了为何要大规模开展驾驶培训。雷军强调:一定要敬畏速度
2025-02-12 20:49:00
RTX 5070被曝推迟至3月初!跟AMD玩猫抓老鼠
快科技2月12日消息,NVIDIA、AMD的新一代显卡不是你追我赶,而是你躲我藏,似乎都想让对手先出招,然后伺机而动,尤其是在对位产品上
2025-02-12 20:50:00
暴雪前CEO考迪克后悔制作《魔兽世界》电影:最差烂片之一
2016 年是许多《魔兽世界》老玩家十分开心的一年,他们奔赴电影院,穿着联盟或是部落的衣服(甚至是化妆),来一场“线下真实”
2025-02-12 20:50:00