• 我的订阅
  • 头条热搜
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
...进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准,并设计了一种新颖的数据合成方法。无论是语言模型还是视觉模型,似乎都很难完成更抽象层次上的理解和推理任务。语言模型已经可以写诗写小说...……更多
联汇科技荣获2024人工智能隐形冠军企业标杆Top10
... 2024“人工智能+”标杆示范征集活动。联汇科技凭借在多模态大模型与智能体行业的突破性技术创新,以及在细分市场中的卓越表现,荣获2024人工智能隐形冠军企业标杆Top10。联汇科技拥有卓越的技术能力,其核心技术包括向量...……更多
“AI全家福”集中亮相数贸会 50多个大模型同场竞技
...相。围绕机器深度学习、自然语言处理、认知大模型、多模态大模型技术等一系列AIGC技术进行展示,体现智能化浪潮正如何改变我们的工作和生活。在阿里巴巴展区,“通义家族”AI大模型应用一字排开。基于阿里自研的“通义...……更多
小米开启“小爱同学多模态功能内测”
3月15日消息,小米现已开启“小爱同学多模态功能内测”,拥有以下机型的用户可以在3月23日之前申请报名,将从3月18日到4月15日推送内测:XiaomiMIXFold3XiaomiMIXFold2XiaomiMIX4Xiaomi14系列(含14/14Pro/14Ultra)Xiaomi13系列(含……更多
智慧芯同频共创,大模型智引未来,星宸科技开发者大会暨产品发布会圆满落幕
...势,向与会者着重介绍感知智能典型应用(语音识别、多模态交互)、认知智能典型应用(认知大模型)的技术现状、面临挑战以及发展趋势,“目前科大讯飞能提供70种语音识别、60种合成能力,未来希望与星宸科技一起为广...……更多
谷歌发博文介绍vloggerai模型可让人物“动起来”
...表情地朗读音频内容。VLOGGERAI是一种适用于虚拟肖像的多模态Diffusion模型,使用MENTOR数据库进行训练,该数据库中包含超过80万名人物肖像,以及累计超过2200小时的影片,从而让VLOGGER生成不同种族、不同年龄、不同穿着、不同...……更多
华为云与乐聚机器人合作,基于鸿蒙开源加入盘古大模型
...7月推出的AI大模型,具备强大的语义理解、动态规划、多模态信号理解等能力,依靠背后强大的大模型数据,实现逻辑的思考。而更智慧的AI大模型加入到人形机器人中,相当于给人形机器人加入了“思考的大脑”,实现智能化...……更多
...化。纵向看,大模型正在变得越来越聪明。横向看,不同模态之间的转化、交互和生成也更成熟,横纵交融,让大模型具备更多技能。“过去22个月,AI的发展速度超过历史上的任何时期。”阿里巴巴集团CEO、阿里云智能集团董...……更多
机器人成了我的遛弯搭子!室外复杂地形难不住,还能上“健身房”
...。除此外,天工的另一大升级是搭载了大模型,具备了多模态操作能力。现在能开口说话和人类交互,支持中英文。还能听从人类指令抓取物品:【此处无法插入视频,遗憾……可到量子位公众号查看~】而这些只是其中的一部...……更多
乐聚夸父人形机器人亮相hdc2024华为开发者大会
...场景理解、自然语言指令识别、任务规划的具身规划,到双臂协同、自主执行、可泛化操作的具身执行的全流程任务。▲搭载盘古大模型的夸父在厨房炒菜 ……更多
谷歌王者归来?最新推出的大模型到底有多强,能否挑战GPT-4
...Demis Hassabis)在发布会上表示,谷歌运行了32个完善的多模态基准测试来比较Gemini和OpenAI的GPT-4,Gemini“在32项基准测试的30项中大幅领先”。据谷歌介绍,在训练后期,Gemini在各类任务上都表现优异。例如,MMLU(大规模多任务语...……更多
手机上能跑的「GPT-4V」来啦!多图、视频理解首次上端!面壁小钢炮开源史上最强端侧多模态
...导读】面壁小钢炮MiniCPM-V 2.6重磅出击,再次刷新端侧多模态天花板!凭借8B参数,已经取得单图、多图、视频理解三项SOTA ,性能全面对标GPT-4V。再次刷新端侧多模态天花板,面壁「小钢炮」 MiniCPM-V 2.6 模型重磅上新!仅8B参数...……更多
2024全球开发者先锋大会在上海盛大开幕,聚焦AI与前沿技术
...模型,包括Step-1千亿参数语言大模型、Step-1V千亿参数多模态大模型以及Step-2万亿参数MoE语言大模型预览版;财跃星辰发布国内首个千亿参数多模态金融大模型;元始智能超越Transformer,RWKV第6代架构最最新模型开源;幂方科技发...……更多
OpenAI机器人亮相,大模型有了“肉身”,英伟达微软都有投资
...麦克风捕捉的语音,转录为文本输入到由OpenAI预训练的多模态大模型中,模型能够理解图像和文本。模型会处理整个对话的历史记录,包括以往的图像,以生成语言响应,再通过文本到语音的方式向人类回话。△Figure 01训练方法...……更多
突发!谷歌发布史上最强大模型Gemini,打爆GPT-4
...萨比斯在谷歌官网联名发文,宣布推出这一万众瞩目的多模态大模型。标题明晃晃写着“最大”、“最强”,主打的就是一个干爆GPT-4。具体来说,此次谷歌一共带来了Gemini的三个版本:Gemini Ultra:谷歌最大、最强模型,适用于...……更多
一大批人形机器人正被装上“最强大脑”,准备送进车厂打工!
...聚机器人与华为盘古大模型进行了打通,利用大模型的多模态能力做具身智能的任务规划;达闼机器人基于原有算法技术做针对性的模型微调和优化,自主研发了多模态大模型RobotGPT;星动纪元机器人则搭载了不止一个大模型,...……更多
语音能力再突破!讯飞星火语音大模型即将发布
...代码纠错、代码解释、单元测试生成5个维度升级,其多模态能力的升级具体体现在图像描述、图像问答、识图创作等多个维度。去年10月24日,在第六届世界声博会暨2023科大讯飞全球1024开发者节的主论坛上,星火认知大模型V3.0...……更多
微软开发者大会简报:编程进入自然语言时代、“AI员工”闪亮登场
...在高通官网上填写一个面向开发者的表格。小模型也要多模态在今年4月更新“小模型”Phi-3后,微软也在周二拿出了Phi-3-vision模型。顾名思义,这个模型可以阅读文本和查看图片,同时这个42亿参数量的模型足够紧凑,能够在移...……更多
人工智能应用场景不断拓展
...业大模型占比七成。大模型已具备文本、语言、视觉的多模态能力,成为推动产业发展与社会进步的重要变量。在阶跃星辰创始人兼首席执行官姜大昕看来,通用人工智能的实现路径可以划分为模拟世界、探索世界和归纳世界3...……更多
...新数据自动化标注、清洗、使用等方法,扩充高质量的多模态数据。科学布局人形机器人算力,加速大模型训练迭代和产品应用。开发控制人形机器人运动的“小脑”,搭建运动控制算法库,建立网络控制系统架构。面向特定应...……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...数据泄露,从而反映模型的真实性能。研究团队测试了多模态大模型(LMMs)和纯文本大模型(LLMs)。对于LLMs的测试,输入时不提供任何与图像相关的信息给模型,仅提供文本。所有评估均采用零样本(zero-shot)思维链(Chain of ...……更多
文档处理效能飙升!浩鲸科技“文档大模型”核心技术揭秘!
...的整体性方案,不仅包含了文档大模型能力,还提供了多模态文档工具链 DocChain 和开箱即用的软硬件一体机,基于垂直模型能力和软硬件相互配合,可帮助企业实现文档的知识抽取、知识融合,直至知识推理和问答的全流程覆...……更多
推动数智+大健康产业深度融合 又一研发总部落子长沙天心经开区
...会现场。单位供图活动现场发布了最新的深思考Dongni.ai多模态搜索引擎、智能终端(AI PC Suite、AI 摄像头、AI 显微镜)、重大疾病早期筛查等重磅产品,并宣布深思考人工智能机器人科技有限公司研发总部正式落户天心经开区。...……更多
讯飞星火V4.0整体超越GPT-4 Turbo,8个国际权威测试集测评第一
...但具备了多语种多方言的“自由交互”,还具备多情感多模态的超拟人交互,让人车交互更有温度。当前,讯飞语音交互产品国内市占率稳居第一,同时广泛出口到世界各地。星火大模型为一汽、奇瑞、广汽、江淮、长城等车企...……更多
具身智能机器人隐藏冠军上新:领狗进家门,多模态AI那种
...Alpha A2拥有Super Chat功能。简而言之,这个功能就是利用多模态AI大模型能力,提供多模态交互及音视频通话功能。即便不在身边,家长也可以操控狗子,给孩子比个心说爱你。当然了,语音or视频通话自然不在话下。也是因为多...……更多
回顾GPT大模型2023这一年,5大顶级公司预测2024年AI产品
...到新高度 ;Andrej:从 Tesla 回归的创始成员和 CV 大牛,多模态的加速器 ;Mira:新晋 CTO,AI 人机交互领域最重要的 PM 之一;Lilian Weng:前沿技术和应用研究的桥梁;Jakub Pachocki:GPT-4预训练的核心 Lead;等等几乎是硅谷甚至是全球.……更多
赋予人工智能更多温度
...据驱动的服务对象精准认知与最优决策技术,以及基于多模态的机器人主动服务与精准交互技术这三大核心技术,链接了物联网、精准服务分析、深度学习计算三大云端平台,实现了‘云、边、端’技术一体化和行业应用的深度...……更多
清华大学孙富春:大模型+机器人可能会导致失业,未来80%的人工劳动会被取代
...通用的方向发展。“大模型能提高机器人的交互能力、多模态融合感知与任务规划能力,能让机器人实现多任务,进而实现通用化。”孙富春表示。不过,这还需要做很多研究。比如大模型与知识图谱结合,提高机器人的推理能...……更多
AI“明星”选手巅峰对决!记者实测最新谷歌Gemini与GPT-4o
...模型能够实现无缝的文本、视频和音频输入,并生成相应模态的输出,真正意义上实现了多模态交互。紧随其后一天,年度Google I/O开发者大会如期而至,谷歌CEO Sundar Pichai宣布了一系列围绕其最新生成式AI模型Gemini的重大更新,...……更多
只用 13 天,OpenAI 做出了能听、能说、能自主决策的机器人大模型
...的文本转录到由 OpenAI 训练的,可以理解图像和文本的多模态模型(VLM)中,由该模型处理对话的整个历史记录,得出语言响应,然后通过文本到语音的方式将其回复给人类。 同样的模型,也负责决定在机器人上运行哪些学习...……更多
更多关于科技的资讯:
黄子韬送出30辆车:每辆售价超12万
1月10日消息,据媒体报道,黄子韬在直播间送出30台车,车型为宝骏云海纯电500km续航款,官方售价123800元,抽中的用户享有汽车的使用权
2025-01-10 23:51:00
卓易科技荣获第十四届公益节2024科技企业社会责任奖
2025年1月9日至10日,由数央网、数央公益联合众媒体共同举办的第十四届公益节暨2024ESG影响力年会在北京举行。大会活动主题为“共筑可持续发展未来”
2025-01-10 21:19:00
可持续发展获《时代周刊》认可,药明康德做对了什么?
近日,知名媒体《时代周刊》(TIME)联合全球顶尖商业数据平台Statista重磅发布了2025年全球最佳公司榜单(World’s Best Companies in Sustainable Growth 2025)
2025-01-10 21:30:00
用户错选地点支付3600元天价车费 哈啰顺风车:司机已将车费提现
快科技1月10日消息,据报道,深圳的刘女士向媒体反映,去年12月25日,她弟弟因急事回家,从广东深圳市打了一辆哈啰顺风车
2025-01-10 21:51:00
女子花4.5万买羽绒服:穿4天就起毛 门店称“顾客穿着不当”
1月10日消息,据媒体报道,台州一名女士称,她花4万多买了一件LV羽绒服,才穿了四天,就出现多处起毛的情况。门店回应称是顾客穿着不当
2025-01-10 22:51:00
比亚迪全新性能怪兽汉L登场:马力超千匹 单颗电机功率580kW
快科技1月10日消息,今日晚间,工信部公布了新一批新车申报目录,比亚迪全新旗舰轿车汉L现身其中。动力系统是汉L的最大亮点
2025-01-10 22:51:00
桐梓:以旧换新引领消费市场“焕新”
多彩贵州网讯 促销费,惠民生。2024年以来,随着以旧换新工作的不断推进,桐梓县消费市场活力持续释放,不仅有力推动了居民绿色消费
2025-01-10 23:04:00
极氪应战特斯拉!极氪7X对比焕新版Model Y:赢面很多
快科技1月10日消息,今日上午,特斯拉焕新Model Y正式上线中国官网,官方对新Model Y相当自信,称“尽管对比”
2025-01-10 19:21:00
狂飙10000MB/s!铠侠EXCERIA PLUS G4 1TB SSD图赏
快科技1月10日消息,日前铠侠推出全新消费级固态硬盘“EXCERIA PLUS G4系列”。该系列固态硬盘内置先进的BiCS FLASH 3D闪存技术
2025-01-10 19:21:00
快科技1月10日消息,据媒体报道,近日,长沙某小区给垃圾桶装了个“开盖神器”在网络走红。据了解,这个开盖神器,是由手环
2025-01-10 19:21:00
重大突破!我国鄂尔多斯盆地发现特大型铀矿
快科技1月10日消息,据报道,我国在鄂尔多斯盆地泾川地区取得了铀矿勘探的重大成就,成功探明一座特大型铀矿床。这一发现不仅预示着我国铀资源储量的显著提升
2025-01-10 19:21:00
华硕旗下AAEON杀进显卡市场!首款产品竟是Intel Arc A750E
快科技1月10日消息,华硕旗下的AAEON公司进军显卡市场,推出了其首款高级显卡——GAR-A750E。这款显卡基于Intel Arc A750E GPU
2025-01-10 19:21:00
乘客腹痛难忍恳请司机闯红灯 的哥一路鸣笛送医
快科技1月10日消息,近日,据央视报道,山东潍坊一位乘客在出租车上腹痛难忍,出租车司机一路鸣笛,连闯多个红灯,将乘客紧急送医
2025-01-10 19:21:00
479元起!玄派玄熊猫PD100M机械键盘上市:全铝机身、标配旋钮屏幕
快科技1月10日消息,玄派玄熊猫PD100M三模全铝机械键盘现已开启预售,将于1月13日上午10:00正式开售。键盘采用100键98配列设计
2025-01-10 19:21:00
Redmi Note 14走向全球:新增4G版本
快科技1月10日消息,小米今日将Redmi Note 14推向全球市场,一个月前该手机已在印度发布。此次国际版与印度版基本相同
2025-01-10 19:51:00