• 我的订阅
  • 头条热搜
百灵大模型多模态能力全面提升
...IT之家从蚂蚁集团获悉,蚂蚁集团自研的百灵大模型的多模态能力全面提升。多模态能力让大模型能“看”会“听”,能“说”会“画”,可支持音、视、图、文等多模态理解与生成,可以让大模型更像人一样感知和互动,未来...……更多
2024WAIC热议大模型助力产业新趋势,可信应用成焦点
...变小,成为具身智能的「大脑」。解法:垂域大模型、多模态技术与 AI 智能体论坛中,关于可信大模型如何在应用具体落地,呈现出了多种解法,大家不约而同地开展了对垂域大模型、多模态技术与 AI 智能体的探索。在专业领...……更多
支付宝多模态医疗大模型正式亮相
...2024世界人工智能大会“可信大模型论坛”上,支付宝多模态医疗大模型正式亮相,成为国内首批多模态医疗大模型之一。据CNMO了解,支付宝医疗大模型的基座模型为蚂蚁百灵大模型。据蚂蚁集团大模型应用部总经理顾进杰介绍...……更多
支付宝发布多模态医疗大模型:支持千亿级视觉识别
...快科技7月5日消息,在2024世界人工智能大会上,支付宝多模态医疗大模型正式亮相,成为国内首批多模态医疗大模型之一。据悉,该医疗大模型的基石,源自蚂蚁集团自主研发的蚂蚁百灵大模型,这一先进平台不仅拥有“视听言...……更多
AI“明星”选手巅峰对决!记者实测最新谷歌Gemini与GPT-4o
...模型能够实现无缝的文本、视频和音频输入,并生成相应模态的输出,真正意义上实现了多模态交互。紧随其后一天,年度Google I/O开发者大会如期而至,谷歌CEO Sundar Pichai宣布了一系列围绕其最新生成式AI模型Gemini的重大更新,...……更多
又一生成式AI助手将“登机”!谷歌发布多模态Bard助理,交互式AI时代近了?
...文本、语音或图像与Bard助理互动——换言之,其具备多模态功能。例如,当用户询问“本周我错过了哪些重要邮件”时,Bard助理会列出各项要点及具体内容,并附上具体对应邮件的链接,还可以帮助用户提取活动地址并在谷歌...……更多
科学家打造多模态模型,7B和1.3B小模型均开源,可部署手机等终端
在最近一项研究中,DeepSeek-AI 团队针对多模态大模型展开了深入探索。选择这一研究方向,背后有着多重考量。最初,该团队围绕是否聚焦于多模态生成、多模态理解、或是两者的统一框架进行了广泛讨论。基于对通用人工智...……更多
科学家开发多模态音乐理解和生成大模型,兼具理解和创作音乐能力
...音乐理解和生成结合在一起的想法比较新颖,论文也是多模态大模型领域的先期工作之一。并且,除了大模型本身,我们提出的针对模型训练的数据集制作流程和整理的数据集,对学术界也具有较大价值。”腾讯 ARC Lab 刘山松研...……更多
...次通过备案的百灵语言大模型,蚂蚁集团也在研发百灵多模态大模型,并已内测。(蓝鲸记者 黄心怡) ……更多
群核科技(酷家乐)陈卓:用多模态AI助理赋能设计产业,用合成数据服务反哺AI | 新质生产力·AI Partner大会
...3D空间领域生成式AI引擎,包括底层的超级算力中心、多模态的海量产业数据,以及自研空间AIGC大模型。在这个引擎之上,已经开始生长出丰富的,服务于不同场景和需求的AI应用,它们正在解决每个应用场景中的个性化问题。...……更多
出门问问入选「中国AI大模型平台排行榜TOP10」
...技术为核心业务的AI企业,拥有全栈式语音交互能力及多模态大模型自研能力,能够通过各种软硬件解决方案为全球内容创作者、企业级客户及消费者提供AICoPilot服务。作为业内稀缺的产模结合公司,出门问问在自研多模态、可...……更多
给机器人装上大模型大脑,「若愚科技」获超5000万天使轮融资|36氪首发
文|武静静编辑|邓咏仪36氪获悉,多模态大模型公司「若愚科技」完成超5000万天使轮融资,本轮融资由东方精工领投,昆仲跟投,源合资本担任独家融资顾问。公司称,资金将主要用于产品研发,业务拓展以及团队搭建等方...……更多
GPT-4V暴露致命缺陷?JHU等发布首个多模态ToM 测试集
...来自 JHU, NYU, MIT, Harvard 等机构的研究团队开创了第一个多模态的 ToM 测试基准,发现现有的多模态模型和 LLM 都表现存在系统性缺陷,同时他们提出了一种有效的新方法。在刚结束的 ACL 2024 会议中,这篇论文获得杰出论文奖。论...……更多
AI的金融应用前景有多大?7家银行科技负责人聊了聊
...发银行信息科技部副总经理万化表示,浦发正在尝试将多模态人机交互、知识图谱、AI模型等技术应用于理财业务场景,推出AI“理财专家”,为消费者智能化地推荐理财产品。AI Bank则是平安银行在2018年就提出的发展目标。通过...……更多
...径。为什么这样认为。对此,王鹤在具身智能大会具身多模态大模型论坛上给出了解释,科技行者就这一演讲关键内容进行了不改变原意的整理:机器人从动嘴到动手有多难最近,具身多模态大模型非常火,我们看到了OpenAI和Fig...……更多
刚刚,我们感受了一波最「像人」的国产AI,模型还是开源的
...择了两条路线分别开拓:一条是 GPT-4o 所代表的端到端多模态大模型的探索,一条是 o1 所代表的关于推理 Scaling Law 的探索。具体到 GPT-4o 上,OpenAI 跨文本、视觉和音频端到端地训练了一个新模型,所有输入和输出都由同一神经...……更多
阿里CEO吴泳铭:生成式AI让世界有了一个统一的语言——Token
...为了AI发展的最大障碍。当前的数字化世界,信息以多种模态存在——自然语言、程序代码、图像、视频、音频、3D模型、数学符号……这些信息形式各自独立,彼此之间的“对话”几乎不存在。AI虽然能够在单一模态下表现出色...……更多
大模型“遍地”都是,谁能真正解放生产力?
...,其苦于人工标注久矣,不想再人工打标视频、图片等多模态信息。但市场现实情况是,供不应求:除了大厂以外,少有大模型团队具备多模态大模型开放能力。深耕于产业多年的考拉悠然,听到了太多客户关于大模型难以落地...……更多
...让AI像扫码支付一样便利每个人的生活。记者注意到,多模态大模型技术在蚂蚁内部有诸多创新应用,如AI智绘、AI智乐、AIGC数字人等,用户输入一句话、一张图、一段语音,就能生成一张设计图、一段音乐作品、一段动态人像...……更多
紫东.太初再进化,揭秘全模态大模型的想象力
...在演讲中介绍了基于昇腾AI与昇思MindSpore AI框架打造的全模态大模型紫东.太初2.0,并首次提出全模态多任务统一生成式学习框架。借用Hugging Face联合创始人Thomas Wolf的说法:“在过去的几年里,好的多模态模型一直是许多大型技...……更多
空间智能版ImageNet来了!李飞飞吴佳俊团队出品
...来自斯坦福李飞飞吴佳俊团队!HourVideo,一个用于评估多模态模型对长达一小时视频理解能力的基准数据集,包含多种任务。通过与现有模型对比,揭示当前模型在长视频理解上与人类水平的差距。2009年,李飞飞团队在CVPR上首...……更多
算力消耗高、幻觉问题棘手、多模态原生统一难……大模型轰轰烈烈发展至今,仍然面临技术上的诸多挑战。瞄准这些“痛点”,智源研究院放了个大招。在北京智源大会上,涵盖大语言模型、多模态大模型、具身智能大模型...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
... OpenAI o1 技术的深入分析累计点击量已超过 15 万。如何全模态大模型与人类的意图相对齐,已成为一个极具前瞻性且至关重要的挑战。在当前 AI 领域的快速发展中,「有效加速」和「超级对齐」已经成为两个主要的发展动向,...……更多
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5”
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5” 3月14日,商汤科技发布多模态多任务通用大模型“书生(INTERN)2.5”,在多模态多任务处理能力方面实现多项全新突破,其卓越的图文跨模态开放任务处理能力可...……更多
支付宝推出AI毛发自测工具 上传照片可测脱发程度
...州市一医院脱发专科门诊医生共同研发,利用蚂蚁百灵多模态大模型识别技术、人工智能与医学图像处理技术。用户只需上传几张头皮照片,AI即可在半分钟内识别出脱发类型和级别,并提供相应的健康建议,用户可以通过支付...……更多
阿里国际发布最新开源多模态模型Ovis,多模态能力再升级
...手写英文准确翻译成中文、还能精准分析财报数据……多模态能力再次升级!今天,阿里国际AI团队发布了一款多模态大模型Ovis,在图像理解任务上不断突破极限,多种具体的子类任务中均达到了SOTA(最新技术)水平。多模态...……更多
蚂蚁井贤栋:通过专业智能体的深度连接,AI会像互联网一样带来服务的代际升级
...具备专家知识水平。垂直领域、高质量的数据往往以多种模态存在,体系庞杂,比较分散,对隐私保护和资产价值保护的要求高,很难直接“喂给”通用大模型。井贤栋介绍,蚂蚁依托知识图谱、密态计算等技术,构建了大规模...……更多
击败Gemini-1.5-Pro、GPT-4V,从容大模型多模态能力跻身全球前三
...云从科技从容大模型在综合评测权威平台 OpenCompass 的多模态评测领域中取得重大进展。最新评测结果显示,云从科技的从容大模型在该体系中的平均得分为 65.5,这一成绩使得从容大模型跻身全球前三,超越了谷歌的 Gemini-1.5-Pro...……更多
Gemini引领多模态AI热潮,产业发展有望加速
12月11日,多模态AI概念股继续活跃,苏州科达(603660.SH)三连板。截至当日中午收盘,因赛集团(300781.SZ)涨13.32%,苏州科达涨9.96%,宣亚国际(300612.SZ)涨9.7%。消息面上,GoogleAI大模型Gemini近日发布,Gemini是Google到目前为止规……更多
商汤又“夺金”!SuperCLUE-V多模态大模型基准发布10月榜单
...这个金秋,“日日新·商量”又拿了金牌!今日,中文多模态大模型测评基准SuperCLUE-V发布10月榜单:商汤日日新·商量多模态大模型(SenseChat-Vision5.5)凭借多个任务上的出色表现,总得分位列国内大模型第一梯队,智夺金牌。商...……更多
更多关于科技的资讯:
“学而思长公主”宣布离职:曾在直播间被连升4级成高管
快科技1月16日消息,据媒体报道,近日,“学而思长公主”橙橙宣布离职,她表示由于个人原因选择离开学而思优品主播的职位。在视频中
2025-01-16 17:56:00
小车没拉开距离就强行见缝插针变道:大货车被逼翻横躺高速
科技1月16日消息,学过交规,考过驾照的都应该知道,超车变道时一定要留出足够的安全距离,不能强挤硬挤,然而开车上路后,总有人行车不规范
2025-01-16 17:56:00
长江存储致态TiPro9000 2TB SSD评测:长江首款PCIe 5.0 SSD 登场即是最强
一、前言:长江存储致态首款PCIe 5.0 SSD终于发布不少品牌的PCIe 5.0 SSD上市已经有一段时间,但一直没有普及开来
2025-01-16 17:56:00
学历出处都是浮云!马斯克在线Boss直聘:直接甩代码给我就行
快科技1月16日消息,马斯克在社交平台发布了一则招聘启事,招聘资深软件工程师。马斯克表示招聘标准非常简单直接,不关心应聘者的学历背景
2025-01-16 17:56:00
全球最薄折叠机!OPPO Find N5渲染图出炉:对称式潜望三摄设计
快科技1月16日消息,今日数码博主定焦数码曝光了OPPO Find N5的设计假想图。根据该博主放出的图片来看,OPPO Find N5的摄像头模组采用了对称式设计
2025-01-16 17:56:00
中央经济工作会议提出,要加强监管,促进平台经济健康发展。平台与商家之间共生共赢的互惠关系,一直以来都是推动行业蓬勃发展的不竭动力
2025-01-16 18:14:00
快科技1月16日消息,近日,一段有关极越07的视频在网络上引起了关注,视频中一位极越的供应商展示了这样一幕:有人分享了一份高中物理期末试卷
2025-01-16 18:26:00
灵感源自中国农历龙年!劳斯莱斯幻影“祥龙贺瑞”定制版官宣:现款986万元
快科技1月16日消息,劳斯莱斯发布了幻影“祥龙贺瑞”定制版车型的官方图片。这是一款由中国客户委托定制的车型,由劳斯莱斯上海专属定制中心主导设计
2025-01-16 18:26:00
育碧被曝大多数老员工已离开!留下的只知道推动“觉醒”
快科技1月16日消息,据YouTuber AccolonnTV爆料,育碧内部动荡持续,许多资深开发者已离开公司,转而寻找更好的发展机会
2025-01-16 18:26:00
联发科天玑9400荣膺快科技王者性能大奖!天玑9300+也有斩获
近日,快科技重磅推出2024年年终评奖,分为PC电脑、手机数码、汽车三大品牌类,其中联发科在手机SoC列别中表现突出,天机9400
2025-01-16 18:26:00
解读鸿蒙智行2024智驾报告:华为迈入智驾时代
2024年无疑是智能驾驶领域具有里程碑意义的一年,在过去一年,智能驾驶不仅在技术实现了持续升级迭代,还在市场中实现了快速渗透
2025-01-16 18:26:00
外卖小哥接到奇怪订单 地址是桥下!结果顾客开着大船来取餐
快科技1月16日消息,近日,江苏南通,一位外卖小哥站在桥上精准向大船投送外卖的视频火了。视频中,一位外卖小哥拿着外卖站在桥上等人
2025-01-16 18:26:00
很多人不知道肾脏很怕6种食物:高盐第一个上榜
快科技1月16日消息,肾脏是我们身体里非常重要的“过滤器”,是排出身体废物的重要器官之一,要想保护肾脏,就得尽量远离对肾脏不友好的食物
2025-01-16 18:26:00
本文转自:人民网人民网北京1月16日电 (记者许维娜)30年前,中国开启了互联网新时代。如今,无论是网络购物的便捷,还是移动支付的普及
2025-01-16 18:46:00
青年计算机图像处理专家全宇晖逝世 年仅39岁 曾参与多项国家科研项目
快科技1月16日消息,今日,据澎湃新闻报道,青年计算机图像处理专家、华南理工大学计算机学院副教授全宇晖,于2025年1月14日在广州因病逝世
2025-01-16 18:56:00