• 我的订阅
  • 头条热搜
微软开源 OmniParser 纯视觉 GUI 智能体:让 GPT-4V秒懂屏幕截图
...息,科技媒体 marktechpost 于 10 月 24 日发布博文,报道称微软公司宣布开源 OmniParser,是一款解析和识别屏幕上可交互图标的 AI 工具。项目背景传统的自动化方法通常依赖于解析 HTML 或视图层次结构,从而限制了其在非网络环境...……更多
谷歌版贾维斯即将问世,最强Gemini 2.0加持!AI自主操控电脑时代来临
...称谷歌同类Project Jarvis预计年底亮相。AI操控电脑已成为微软、苹果等巨头,下一个发力的战场。AI接管人类电脑,就是下一个未来!几天前,Anthropic向所有人展示了,Claude 3.5自主看屏幕操作光标完成复杂任务,足以惊掉下巴。...……更多
人生搜索引擎免费用,哈利波特“冥想盆”登GitHub热榜,支持中文
...个项目大量借鉴了之前就很火的“记忆助手软件”Rewind和微软的Windows Recall功能。但是,这两个emmm……Rewind要收费(基础版12美元/月),微软的延期了。所以,既免费、又立即可用的Pensieve是真香了!这不,代码更新后迅速登上...……更多
微软正研发面部照明AI技术:视频时可自动调整屏幕亮度
快科技8月14日消息,据媒体报道,微软正致力于一项创新性的面部照明技术研发,旨在视频会议场景中自动优化屏幕亮度,为用户带来前所未有的视觉体验。这项技术的核心在于智能调节,确保每位参与者的面部在会议中都能...……更多
llava-1.6与gpt-4vmp面硬刚的性能,一起来看看
...4月的初级版本、2023年10月的LLaVA-1.5之后,2024年1月31日,微软研究院又联合威斯康星大学麦迪逊分校和哥伦比亚大学的研究者共同发布了多模态大模型LLaVa(Large Language and Vision Assistant)的1.6版本。与GPT-4V只提供API接口的闭……更多
AIPC,微软联想华为谁能扛大旗
...周路平沉寂多时的PC市场,迎来了久违的热闹。不久前,微软推出了号称“史上最强Windows PC”——Copilot+PC,给市场打了个样,并带动华硕、戴尔、联想、三星、惠普和宏碁等多家PC厂商,纷纷宣布推出符合Copilot+PC标准的新款AI PC...……更多
MMMU华人团队更新Pro版!多模态基准升至史诗级难度:过滤纯文本问题、引入纯视觉问答
...「读」的能力,也可以在现实场景中直接将模型用于屏幕截图或照片,无需分离问题与图片;实验结果显示,模型在MMMU-Pro上的性能明显低于 MMMU,下降 16.8% 到 26.9%,模型的排名通常与原始模型相似,但GPT-4o mini 模型的健壮性与G...……更多
谁会买三星5999元的AI手机?
...研发自己的大模型。ChatGPT的爆发使以软件为主要产品的微软以及国内各种“大厂云”吃到了第一波大模型的“红利”,现在各大手机厂商争相发布大模型端侧落地显然也是想把AI大模型的热潮引到手机硬件当中。 AI智能手机想...……更多
11月1日消息,据外媒报道,微软日前推出Windows11PC操作系统的下一个重大更新,新版本包含名为Copilot的聊天机器人。据悉,Copilot是一种依赖于底层大型语言模型的生成式人工智能,只需用户的简单指导即可创建文本和其他内容...……更多
微软推出全能型人工智能模型 Kosmos-1
...于ChatGPT的必应聊天已经让不少用户感受到了AI的强大,而微软于近日推出了更为强悍的全能型AI--Kosmos-1。ChatGPT是纯文本LLM,而它是更强大的多模式大型语言模型(MLLM)。Kosmos-1可以分析图像的内容、解决视觉难题、执行视觉文...……更多
微软正在添加一项新功能
...wsCopilot目前提供的功能很少,但这种情况很快就会改变。微软正在添加一项新功能,让你用户截取屏幕并要求人工智能进行解释。这项名为\"添加屏幕截图\"的新功能正在向公众推出,但不一定每个人都能使用。通过Copilot面板中...……更多
微软开始探索在截图功能中加入copilot
...wsLatest今天报道,Canary频道最新MicrosoftEdge浏览器版本中,微软开始探索在截图功能中加入Copilot。该媒体发现了名为“msEdgeWebCaptureAskCopilotMenu”的新实验特性,不过启用之后尚未生效,从名称判断应该是Edge截图之后可以调用Copi……更多
微软发布旗下最小语言模型phi-2
11月17日消息,微软Ignite2023大会已拉开帷幕,微软在本次活动中发布了旗下最小的语言模型Phi-2,共有27亿参数,相比较此前版本有明显提升。注:微软于今年6月发布Phi-1,只有13亿代码,适用于QA问答、聊天格式和代码等等场景...……更多
深交所紧急发函! ChatGPT成多公司翻身密码?谷歌、微软也出手了
...上层的搜索等应用。文心一言,位于模型层。按照谷歌和微软节奏,文心一言开放内测还有可能提前。当21世纪经济报道记者问及“百度是否会推出类似ChatGPT”的产品时,百度搜索杰出架构师辜斯缪透露百度内部已有类似可用的...……更多
Claude接管人类电脑编程,程序员沸腾!OpenAI反击,智能体大战一触即发
...线,而是 先授予与OpenAI密切合作的公司访问权限(比如微软),方便他们构建自己的产品和功能。不过,网友们的「美梦」还没做多久,Altman就站出来辟谣了:通通都是fake news!在软件开发上,OpenAI目前正在开发多个产品和功...……更多
以公共预览形式,微软开放AI计算机视觉模型Florence
微软于2021年启动了 ProjectFlorence,该AI计算机视觉模型结合Web图像-文本数据的通用视觉语言表征,可以轻松地适应分类、检索、目标检测、视觉问答(VQA)、图像描述、视频检索和动作识别等各种计算机视觉任务。微软于今天宣...……更多
notex3pro阅读器获推booxos3.5.2系统版本
...化,功能更易于查找。文石AI大模型上线新增3类AI大模型微软GPT通义千问文心一言支持3种调用方式App控制中心悬浮球拥有5档回答字数支持输出字数篇幅自定义适配3种输入方式键盘输入语音输入手写输入使用步骤“应用”→“AI...……更多
微软演示活动出现事实性错误
...天机器人演示活动现场翻车导致其股价当天暴跌逾7%,但微软的演示活动同样出现了事实性错误。上周的科技圈掀起了一个聊天机器人的小高潮,微软和谷歌都试图通过展示早起版本的AI搜索来先发制人。微软更是宣布,该公司...……更多
微软推出windows11build26217
微软正在向Canary频道的测试者推出Windows11Build26217,其中包含一些小的错误修复。不过,Build26217指向了\"设置\"中一个新的隐藏页面,用于管理\"AI组件更新\"。与Windows安全更新类似,你将能够管理AI组件的更新。微软观察者Phantomo...……更多
微软moment5更新:语音访问新增功能
3月1日消息,微软今日推出了Win112月非安全预览更新补丁KB5034848(可选更新),更新后系统版本号升至22621.3235和22631.3235(适用于22H2和23H2)。安装KB5034848后即可尝试获取“Moment5”配置更新(在设置中打开“在最新更新可用后立...……更多
机器人装上OpenAI大模型:合作仅13天,能思考会识别,动作流畅
...伟达、亚马逊创始人杰夫·贝索斯(Jeff Bezos)、科技巨头微软以及其他几家大型科技公司的投资,在本轮融资中累计筹得约6.75亿美元,公司估值达到26亿美元。 ……更多
纪念科学家汤晓鸥:黑羊远去
...生,他开始频繁往返于香港和北京两地。两年后,他接受微软亚洲研究院的邀请,在新成立的视觉计算组担任组长。汤晓鸥对微软亚洲研究院一直有很深的情怀,2016年他在一篇自述中,形容微软洲研究院和IBM及Google在中国的研...……更多
【产业互联网周报】字节回应被曝秘密利用OpenAI;英特尔预告Gaudi 3将超越H100;阿里云M7蔡英华离职;马斯克回应Grok抄ChatGPT作业
...2001年创立了香港中文大学多媒体实验室;2005年至2007年在微软亚洲研究院工作,担任视觉计算组主任;2008年在深圳先进技术研究院多媒体集成技术研究室工作,担任主任和研究员。汤晓鸥主要从事计算机视觉相关领域的研究,...……更多
微软发布windows11build26040预览版更新
1月27日消息,微软今天面向Canary频道的WindowsInsider项目成员,发布了适用于Windows11的最新预览版Build26040,并同步放出了最新ISO安装镜像。IT之家附上Windows11Build26040预览版更新内容如下:跨平台截图现在用户在绑定了Windows系统的A……更多
Claude 3.5深夜觉醒,学会模仿人类用电脑!编程干翻o1,Agent一夜变天
...角落,Claude能帮我们完成吗?只见它开始截取小哥的屏幕截图,并且很快发现:蚂蚁设备公司并不在表格中。这时,它立刻切换到CRM系统中,去搜索这个公司。找到后,它开始滚动页面,查找填表所需的所有信息,然后提交了表...……更多
首批大模型终端设备开售,换汤不换药,更便宜的表现却更好?
...Humane公司还有数十名前苹果员工,融资则包括Sam Altman、微软、沃尔沃和LG等公司。外界也普遍认为,由前苹果员工来挑战苹果创造的智能手机王朝,合情合理。 2023年11月,Ai Pin正式发布,作为一款无屏幕设备,它完全依靠语音...……更多
OpenAI举办“AI春晚”;李开复大模型破纪录 | 图灵周报
...A股、美股的“超导概念股”都曾受影响,大幅波动。 03微软以安全问题为由限制员工访问ChatGPT图源:Pixabay在当地时间周四的一段时间内,微软员工被禁止使用OpenAI产品ChatGPT。微软在内部网站上的最新消息中表示,“出于安全...……更多
全球市值第一背后的AI算力焦虑
...。本月内,人工智能芯片公司英伟达市值先后超过苹果、微软,登顶全球市值第一的公司。而在这个“第一”背后,是众多大模型厂商的“算力焦虑”。英伟达股价截图当算力成为人工智能的关键当地时间6月18日美股收盘,英伟...……更多
微软一夜干翻苹果Mac!GPT-4o装进全家桶,微软把全世界PC都AI了
【新智元导读】微软昨夜首发Copilot+ PC,直接把钢铁侠的Jarvis带进现实!全新NPU架构,配上地表最强GPT-4o等40+模型,让Windows PC击败苹果Mac,成为有史以来最快、最智能的PC。显然,一个全新的AI时代正式开启。GPT-4o诞生刚过去一...……更多
“三巨头”杀疯了!开盘15分钟,微软、苹果、英伟达轮番角逐市值“一哥”!
...纳指涨0.05%,标普500指数跌0.10%。当天,美股“三巨头”微软、苹果、英伟达开盘后,在15分钟内上演了“市值第一名争夺战”。开盘不久,英伟达和微软股价冲高,其间,英伟达市值甚至一度超越苹果,并距离“股王”微软仅差...……更多
更多关于科技的资讯:
LG UltraGear OLED 45GX950A 显示器曝光:5120 x 2160 分辨率
IT之家 11 月 27 日消息,科技媒体 notebookcheck 昨日(11 月 26 日)发布博文,报道称在韩国国家无线电研究机构
2024-11-28 09:43:00
realme 真我 Neo7 手机 0 元预约活动赠 4 年电池保
IT之家 11 月 27 日消息,真我官方今日发文预热 Neo7 手机,新机号称“新一代旗舰射门员”:性能>200 万跑分
2024-11-28 09:44:00
AMD RDNA 4 显卡即将登场,RX 8000 系列有望明年 1 月发布
IT之家 11 月 27 日消息,消息源 Moore’s Law Is Dead 在最新一期 YouTube 视频中,透露 AMD 将于 2025 年 1 月召开的 CES 大展上
2024-11-28 09:44:00
联想拯救者 Y700 2025 平板灰度推送 OTA1:优化游戏场景触控体验
IT之家 11 月 27 日消息,联想 ZUI 官方今日宣布,拯救者 Y700 2025 平板(第三代,搭载骁龙 8 Gen3 处理器) OTA1(版本号 16
2024-11-28 09:44:00
TCL 海外推出首款便携投影 Projector A1:1080p、360 流明
IT之家 11 月 27 日消息,TCL 当地时间本月 25 日在海外市场推出了其首款便携投影仪设备 Projector A1
2024-11-28 09:44:00
华为鸿蒙智家全新亮相:这是智慧与人居关系的一次大升阶
11 月 26 日,华为 Mate 品牌盛典正式举行。本次品牌盛典除了各种备受关注的旗舰新品,还有一个重要看点,就是“华为全屋智能”重磅升级为全新品牌“华为鸿蒙智家”
2024-11-28 09:45:00
星耀上海!汉德车桥强势亮相2024宝马展!
11月26日,全球工程机械行业的目光聚焦于上海,2024上海宝马工程机械展(baumaCHINA2024)在上海新国际博览中心盛大启幕
2024-11-28 09:45:00
华为一口气带来了两款旗舰机型
在刚刚结束的华为Mate品牌盛典上,华为一口气带来了两款旗舰机型——HUAWEIMate70系列以及HUAWEIMateX6
2024-11-28 09:45:00
iQOO Neo10 系列手机全系标配蓝厂旗舰同款无网通信
IT之家 11 月 27 日消息,iQOO 今日再次发文预热旗下 Neo10 系列新机:新机全系标配蓝厂旗舰同款无网通信
2024-11-28 09:46:00
ProGrade Digital 在日推出 USB4 pSSD,最高顺序读写 2500MB/s
IT之家 11 月 27 日消息,专业摄影存储厂商 ProGrade Digital 铂格瑞当地时间昨日在日本推出了 PG10 Pro 系列大容量 USB4 移动固态硬盘
2024-11-28 09:46:00
Hugging Face发布SmolVLM开源 AI 模型:20 亿参数,用于端侧推理
IT之家 11 月 27 日消息,Hugging Face 平台昨日(11 月 26 日)发布博文,宣布推出 SmolVLM AI 视觉语言模型(VLM)
2024-11-28 09:47:00
消息称荣耀 300 Ultra 手机配备巨犀玻璃,支持卫星通信功能
IT之家 11 月 27 日消息,博主 @数码闲聊站 今日发文透露了荣耀 300 Ultra 手机配置信息,新机搭载高通骁龙 8 Gen3 处理器
2024-11-28 09:47:00
创意无限:谷歌推出 GenChess,可 AI 定制国际象棋棋子
IT之家 11 月 27 日消息,谷歌 DeepMind 团队于 11 月 25 日发布博文,为迎接 2024 年国际象棋世界冠军赛(11 月 25 日至 12 月 13 日)
2024-11-28 09:50:00
高效办公:微软网页版 Word 增强“行号”功能,扩展定制选项
IT之家 11 月 27 日消息,微软公司今天(11 月 27 日)发布博文,邀请 Microsoft 365 Insider 项目成员
2024-11-28 09:51:00
Uber“零工经济”扩展至数据标注,已对 Niantic 等客户提供服务
IT之家 11 月 27 日消息,Uber 优步官网显示其已面向外部开放原仅供内部使用的 Scaled Solotions(IT之家注
2024-11-28 09:51:00