• 我的订阅
  • 头条热搜
北大等发布多模态版o1!首个慢思考VLM将开源,视觉推理超闭源
北大等出品,首个多模态版o1开源模型来了——代号LLaVA-o1,基于Llama-3.2-Vision模型打造,超越传统思维链提示,实现自主“慢思考”推理。在多模态推理基准测试中,LLaVA-o1超越其基础模型8.9%,并在性能上超越了一众开闭源模型...……更多
当我们谈论“边缘计算”时,我们在谈论些什么?
...间广阔。边缘计算终端实现的主要限制仍是算力,目前有模型压缩和存算一体两大技术路径,其中存算一体解决思路或更为有效,我国科研团队已实现相关突破。科创100ETF(588190)跟踪的科创100指数布局科创板中小市值个股,第...……更多
2023安博会 | “技”高一筹 大华股份用数智开启百业新篇
...能行业创新发展会场上,大华股份发布的大华“星汉”大模型备受关注。大华“星汉”大模型是以视觉解析为核心的多模态融合行业大模型,能够带来AI算法准确性和泛化性跃升,在正常、强光、污渍及雨水等各类复杂场景下算...……更多
...向元宇宙沉浸多感交互的5G-A网络基于物体特征点的三维模型快速匹配系统高逼真数字人快速构建与多模态交互系统虚拟空间创作平台3D沉浸式实时通信系统3D实景地图平台基于文本描述的3D场景生成系统元宇宙数字身份标识技术...……更多
人工智能热度攀升市场广阔
...开放人工智能研究中心OpenAI正式发布了旗下首款文生视频模型Sora,引起了各界对人工智能领域的关注。近期,被誉为字节版Sora的Dreamina,再次引起了广泛关注。今年以来,文生视频、文生音乐等应用引领的人工智能热潮持续扩...……更多
本文转自:新华网12月1日,阿里云通义千问720亿参数模型Qwen-72B宣布开源。该模型基于3T tokens高质量数据训练,在10个权威基准测评中夺得开源模型优异成绩。基于Qwen-72B,大中型企业可开发商业应用,高校、科研院所可开展AI fo...……更多
全球首篇!调研近400篇文献,鹏城实验室&中大深度解析具身智能
...间和物理世界的交互来完成复杂任务。近年来,多模态大模型和机器人技术得到了长足发展,具身智能成为全球科技和产业竞争的新焦点。然而,目前缺少一篇能够全面解析具身智能发展现状的综述。因此,鹏城实验室多智能体...……更多
科学家为脉冲神经网络引入新架构,为超大模型奠定基础
...计算可以利用脉冲信号来传递信息。前者,让脉冲神经元模型的表达能力在理论上高于基于传统人工神经网络(Artificial Neural Network,ANN)的人工神经元模型;后者,让脉冲神经元具有脉冲驱动的计算特征。当脉冲神经网络运行...……更多
奥看科技:CV大模型赋能城市多场景事件感知,打开视觉新境界
...、业务和市场层面优势互补,并基于盘古打造城市治理大模型,孵化出Talk2Video解决方案,盘活视觉数据,让设备“开口说话”。基于视图数据的深度理解,可有效降低人工巡查成本,提高出警效率。目前,方案已在交通安全、...……更多
支付宝发布多模态医疗大模型:支持千亿级视觉识别
...消息,在2024世界人工智能大会上,支付宝多模态医疗大模型正式亮相,成为国内首批多模态医疗大模型之一。据悉,该医疗大模型的基石,源自蚂蚁集团自主研发的蚂蚁百灵大模型,这一先进平台不仅拥有“视听言画”全方位...……更多
大模型的未来,快手在自己身上找答案
...检票口久违的出现了许多黄牛,这一切都意味着国内对大模型的关注从 2023 年小圈子里的迅速升温,到现在的白热。所有人都在想尽办法靠近大模型,所有公司都在寻找一种对大模型来说合适的描述方式,但从目前来看,大多都...……更多
OpenAI发布文生视频模型Sora,奥尔特曼选取网友提示词
...凌晨,OpenAI再次扔出一枚深水炸弹,发布了首个文生视频模型Sora。据介绍,Sora可以直接输出长达60秒的视频,并且包含高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色。目前官网上已经更新了48个视频demo,在这...……更多
下载次数破39万!CMU、Meta联合发布VQAScore文生图优化方案:Imagen3已采用
【新智元导读】VQAScore是一个利用视觉问答模型来评估由文本提示生成的图像质量的新方法;GenAI-Bench是一个包含复杂文本提示的基准测试集,用于挑战和提升现有的图像生成模型。两个工具可以帮助研究人员自动评估AI模型的...……更多
超市、工厂装上“智慧之眼”  人工智能赋能实体经济
...等等,实现对大范围连锁门店的自动化管理。这是视觉大模型在超市场景的落地。 5月17日,2024年世界电信和信息社会日大会在浙江省宁波市召开,本次大会主题是“数字创新赋能新型工业化”。视觉大模型是中国移动浙江分公...……更多
阿里国际发布最新开源多模态模型Ovis,多模态能力再升级
...力再次升级!今天,阿里国际AI团队发布了一款多模态大模型Ovis,在图像理解任务上不断突破极限,多种具体的子类任务中均达到了SOTA(最新技术)水平。多模态大模型能够处理和理解多种不同类型的数据输入,例如文本、图...……更多
阿维塔07 Ultra版将在10月下旬开始生产
...竞争关系。近日,苹果公司推出了300亿参数的多模态AI大模型MM1.5,该版本是在前代MM1的架构基础上发展而来的。该模型继续遵循数据驱动的训练原则,着重探究在不同训练周期中混合各类数据对模型性能产生的影响,相关模型...……更多
Meta 公司发布 Imagine Yourself AI 模型
...可扩展性,为此 Meta 公司创新提出了“Imagine Yourself” AI 模型。传统个性化图像生成方法挑战目前的个性化图像生成方法通常依赖于为每个用户调整模型,这种方法效率低下,而且缺乏通用性。虽然较新的方法试图在不进行调整...……更多
美图焕新:一家“上个时代的公司”在AI中复苏
...赚到钱的公司。”2023年上半年,当大多数企业还在卷大模型时,美图已经在全公司范围内卷起了AI应用。目前,美图旗下有多款AI应用,其中包括年营收超过1亿元人民币、月活跃用户数1700万的新产品“美图设计室”。一款应用...……更多
谢赛宁新作:表征学习有多重要?一个操作刷新SOTA,DiT训练速度暴涨18倍
...分认识并认可了表征学习的重要性,那么视觉领域的生成模型呢?最近,谢赛宁团队发表的一篇研究就拿出了非常有力的证据:Representation matters!扩散模型如何突破瓶颈? 成本高又难训练的DiT/SiT模型如何提升效率?对于这个问...……更多
国网浙江电力:世界首个电力联邦学习国际标准获批立项
...力电力行业智能化转型。联邦学习是一种分布式人工智能模型训练技术。《基于联邦学习的电力视觉检测系统要求和框架》国际标准将联邦学习技术与电力视觉检测业务相结合,构建了一套分布式模型训练方法,能够有效解决数...……更多
AI PC是噱头还是更快的马车?
...以生成一个多步骤的、跨软件的操作。这也体现了大语言模型的优势:可以接受较长的输入并理解、分拆。譬如,我们完全可以对AIPC说:帮我将电脑静音,然后打开上次阅读的文档,并把它发送给某某邮箱。需要强调的是,以...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...为刘家铭博士,研究方向为面向开放世界的多模态具身大模型与持续性学习技术。本工作第二作者为刘梦真,研究方向为视觉基础模型与机器人操纵。指导老师为仉尚航,北京大学计算机学院研究员、博士生导师、博雅青年学者...……更多
Anthropic再反击!发布Claude 3.5吊打GPT-4o,视觉、逻辑推理等方面表现更强
...吗?” 从官方介绍来看,Claude 3.5全家桶仍会有3款系列模型,分别是“大杯”Claude 3.5 Opus、“中杯”Claude 3.5 Sonnet、及“小杯”Claude 3.5 Haiku。先问世的“中杯”就这么强,后面的系列模型确实值得期待。官方表示,Claude 3.5 O……更多
AI时代下,最佳硬件载体是什么?CES请回答
...智能涌现,AI的风吹了一年,全行业都已经到了思考AI大模型落地到千行百业的节点期。大模型的落地,硬件载体的支撑是无法绕开的一环。尽管什么才是AI时代最终极的杀器,目前还没有形成普遍的共识,但在2024年的CES上,各...……更多
多模态竞技场对标90B Llama 3.2!Pixtral 12B技术报告全公开
...杀入江湖的Mistral AI,在9月份甩出了自家的首款多模态大模型Pixtral 12B,如今,报告之期已至,技术细节全公开。作为欧洲的OpenAI,Mistral最近压力不小。端侧小模型端不出来,对比评测的结果又遭到质疑。上个月震撼登场的自家...……更多
击败Gemini-1.5-Pro、GPT-4V,从容大模型多模态能力跻身全球前三
机器之心报道机器之心编辑部近日,云从科技从容大模型在综合评测权威平台 OpenCompass 的多模态评测领域中取得重大进展。最新评测结果显示,云从科技的从容大模型在该体系中的平均得分为 65.5,这一成绩使得从容大模型跻...……更多
手机上能跑的「GPT-4V」来啦!多图、视频理解首次上端!面壁小钢炮开源史上最强端侧多模态
...再次刷新端侧多模态天花板,面壁「小钢炮」 MiniCPM-V 2.6 模型重磅上新!仅8B参数,取得 20B 以下单图、多图、视频理解 3 SOTA 成绩,一举将端侧AI多模态能力拉升至全面对标超越 GPT-4V 水平。更有多项功能首次上「端」:小钢炮...……更多
“这图一眼就是AI!”那你能展开讲讲么?
...就要涉及我们要说的目前 AI 面临的最基本的问题:世界模型。关于智慧的“模型”发明出“人工智能”的同时,人类科学家们需要回答一个同等重要的问题:什么是“智能”?而随着人工智能 / 认知科学的进步和发展,我们现...……更多
微软开源 OmniParser 纯视觉 GUI 智能体:让 GPT-4V秒懂屏幕截图
...络环境中的适用性。而包括 GPT-4V 在内的现有的视觉语言模型(VLMs),并不擅长解读复杂 GUI 元素,导致动作定位不准确。项目简介微软为了克服这些障碍,推出了 OmniParser,是一种纯视觉基础的工具,旨在填补当前屏幕解析技...……更多
脉脉创始人兼CEO林凡:大模型时代产品一定是语音问答
...品的基础原则之一便是满足目标用户的关键需求,但在大模型时代,产品和用户的交互界面将会以对话和语音为基础,以往的“交互界面就完全被颠覆了”。林凡强调,大模型时代产品一定是语音问答,甚至是带上视觉形象的问...……更多
更多关于科技的资讯:
环比增10000%+!微信“蓝包”赠书成风潮
随着蛇年春节假期画上句号,此前备受关注的微信“蓝包”即“送礼物”功能也交出了最新成绩单。从品类看, 休闲零食、糖果/巧克力等客单价低但节日氛围浓厚的商品类目订单量旺盛
2025-02-08 23:46:00
儿子砸车窗取AED救下心梗父亲 车主:不需要对方赔偿
2月8日消息,据媒体报道,近日,叶先生发现自己车的车窗被砸,车内的AED不见了,对方给叶先生发了信息,称自己父亲心梗,急需AED急救
2025-02-08 23:46:00
52天婴儿喝奶奶喂的蜂蜜水中毒进ICU 医生:蜂蜜不适合婴儿
2月9日消息,据媒体报道,一名仅52天的宝宝出现严重腹胀,然后又出现呼吸困难、瞳孔对光反射消失,情况危急。经过医生诊断
2025-02-09 00:46:00
实干争春看贵州|贵安新区芯片企业提升工艺迎接新订单
2月8日19时40分,在位于贵安综合保税区围网内的贵州安芯电子有限公司生产车间里,技术工人杨成还在数控设备前忙碌着。与安芯电子一同成长的他
2025-02-09 01:14:00
大V 29.9万买小米SU7开快1年28.8万卖掉直呼奇迹:网友吵翻电车有毛保值率
快科技2月9日消息,电动汽车是不是保值,这引起了网友的热议。近日,有汽车大V分享消息称,“自己29.9万买的SU7 Max开了快1年
2025-02-09 06:46:00
全球最薄折叠旗舰!OPPO Find N5正式接入DeepSeek-R1:系统直接调用
快科技2月9日消息,OPPO Find N5将在本月正式发布,该机将刷新折叠屏厚度极限,折叠态厚度不到9.2mm,成为全球最薄折叠屏手机
2025-02-09 07:16:00
会员到期男子用自制天线免费看20多个台引围观:别付费当冤大头了
快科技2月9日消息,近日有网友分享了自己的经验,用自制天线看20多个台。近日山东济南一名男子自制“天线”,用铜线插在电视上
2025-02-09 06:46:00
女生光腿穿校服!日本学校寒潮天仍禁止学生穿裤袜引抗议:取消黑校规
2月9日消息,据国外媒体报道称,近日日本遭遇了今冬以来最强寒潮,多地降雪达到了灾害级别。然而,在这种极端天气下,许多学校仍然要求学生按照规定穿着校服
2025-02-09 07:16:00
打破好莱坞垄断!《哪吒2》进全球票房榜前50、全球动画片票房榜前10
快科技2月9日消息,据灯塔专业版数据,截止今天6:10,电影《哪吒之魔童闹海》累计票房(含预售)破75.35亿,进入全球影史票房榜第48名
2025-02-09 06:46:00
华为手表上热搜 WATCH D2属医疗器械能用医保付款
快科技2月9日消息,今日,词条#华为手表属于医疗器械可以医保付款#登上微博热搜第二,引起网友热议。据媒体报道,日前,上海
2025-02-09 07:16:00
Mac比Windows PC更安全吗 未必
一直以来,相比Windows平台的PC用户,苹果macOS似乎有一种先天的“安全优势”,很多用户认为Mac比Windows更安全可靠
2025-02-08 22:46:00
“胖一点”好!攒点肉真的能扛病
快科技2月8日消息,微博话题“攒点肉真的能扛病”引发关注。医生就这一话题作出解释,生病时,尤其是禁食期间,体内的脂肪组织可分解代谢产生能量
2025-02-08 22:46:00
雷军驾驶小米YU7参与冬测:表现不错 测试任务圆满完成
快科技2月8日消息,今日晚间,小米创办人雷军发文表示,他驾驶小米YU7参与了冬季高速长途的测试,主要测智能驾驶和续航等项目
2025-02-08 22:46:00
英特尔AMD高通芯片科普:一文带你认清三大厂商笔记本处理器
在今年的CES 2025上,英特尔、AMD以及高通都发布了全新的处理器,持续布局自家的产品线。目前各家在移动端处理器这款都提供了非常丰富的型号尤其是英特尔和AMD
2025-02-08 23:16:00
2024平板电脑市场变天了:小米大增73%
市场调研机构Canalys公布了2024年全球平板电脑市场统计数据。最新数据显示,2024年第四季度全球平板电脑出货量达到3990万台
2025-02-08 17:15:00