• 我的订阅
  • 头条热搜
百灵大模型多模态能力全面提升
...IT之家从蚂蚁集团获悉,蚂蚁集团自研的百灵大模型的多模态能力全面提升。多模态能力让大模型能“看”会“听”,能“说”会“画”,可支持音、视、图、文等多模态理解与生成,可以让大模型更像人一样感知和互动,未来...……更多
2024WAIC热议大模型助力产业新趋势,可信应用成焦点
...变小,成为具身智能的「大脑」。解法:垂域大模型、多模态技术与 AI 智能体论坛中,关于可信大模型如何在应用具体落地,呈现出了多种解法,大家不约而同地开展了对垂域大模型、多模态技术与 AI 智能体的探索。在专业领...……更多
支付宝多模态医疗大模型正式亮相
...2024世界人工智能大会“可信大模型论坛”上,支付宝多模态医疗大模型正式亮相,成为国内首批多模态医疗大模型之一。据CNMO了解,支付宝医疗大模型的基座模型为蚂蚁百灵大模型。据蚂蚁集团大模型应用部总经理顾进杰介绍...……更多
支付宝发布多模态医疗大模型:支持千亿级视觉识别
...快科技7月5日消息,在2024世界人工智能大会上,支付宝多模态医疗大模型正式亮相,成为国内首批多模态医疗大模型之一。据悉,该医疗大模型的基石,源自蚂蚁集团自主研发的蚂蚁百灵大模型,这一先进平台不仅拥有“视听言...……更多
AI“明星”选手巅峰对决!记者实测最新谷歌Gemini与GPT-4o
...模型能够实现无缝的文本、视频和音频输入,并生成相应模态的输出,真正意义上实现了多模态交互。紧随其后一天,年度Google I/O开发者大会如期而至,谷歌CEO Sundar Pichai宣布了一系列围绕其最新生成式AI模型Gemini的重大更新,...……更多
又一生成式AI助手将“登机”!谷歌发布多模态Bard助理,交互式AI时代近了?
...文本、语音或图像与Bard助理互动——换言之,其具备多模态功能。例如,当用户询问“本周我错过了哪些重要邮件”时,Bard助理会列出各项要点及具体内容,并附上具体对应邮件的链接,还可以帮助用户提取活动地址并在谷歌...……更多
科学家打造多模态模型,7B和1.3B小模型均开源,可部署手机等终端
在最近一项研究中,DeepSeek-AI 团队针对多模态大模型展开了深入探索。选择这一研究方向,背后有着多重考量。最初,该团队围绕是否聚焦于多模态生成、多模态理解、或是两者的统一框架进行了广泛讨论。基于对通用人工智...……更多
科学家开发多模态音乐理解和生成大模型,兼具理解和创作音乐能力
...音乐理解和生成结合在一起的想法比较新颖,论文也是多模态大模型领域的先期工作之一。并且,除了大模型本身,我们提出的针对模型训练的数据集制作流程和整理的数据集,对学术界也具有较大价值。”腾讯 ARC Lab 刘山松研...……更多
...次通过备案的百灵语言大模型,蚂蚁集团也在研发百灵多模态大模型,并已内测。(蓝鲸记者 黄心怡) ……更多
群核科技(酷家乐)陈卓:用多模态AI助理赋能设计产业,用合成数据服务反哺AI | 新质生产力·AI Partner大会
...3D空间领域生成式AI引擎,包括底层的超级算力中心、多模态的海量产业数据,以及自研空间AIGC大模型。在这个引擎之上,已经开始生长出丰富的,服务于不同场景和需求的AI应用,它们正在解决每个应用场景中的个性化问题。...……更多
出门问问入选「中国AI大模型平台排行榜TOP10」
...技术为核心业务的AI企业,拥有全栈式语音交互能力及多模态大模型自研能力,能够通过各种软硬件解决方案为全球内容创作者、企业级客户及消费者提供AICoPilot服务。作为业内稀缺的产模结合公司,出门问问在自研多模态、可...……更多
给机器人装上大模型大脑,「若愚科技」获超5000万天使轮融资|36氪首发
文|武静静编辑|邓咏仪36氪获悉,多模态大模型公司「若愚科技」完成超5000万天使轮融资,本轮融资由东方精工领投,昆仲跟投,源合资本担任独家融资顾问。公司称,资金将主要用于产品研发,业务拓展以及团队搭建等方...……更多
GPT-4V暴露致命缺陷?JHU等发布首个多模态ToM 测试集
...来自 JHU, NYU, MIT, Harvard 等机构的研究团队开创了第一个多模态的 ToM 测试基准,发现现有的多模态模型和 LLM 都表现存在系统性缺陷,同时他们提出了一种有效的新方法。在刚结束的 ACL 2024 会议中,这篇论文获得杰出论文奖。论...……更多
AI的金融应用前景有多大?7家银行科技负责人聊了聊
...发银行信息科技部副总经理万化表示,浦发正在尝试将多模态人机交互、知识图谱、AI模型等技术应用于理财业务场景,推出AI“理财专家”,为消费者智能化地推荐理财产品。AI Bank则是平安银行在2018年就提出的发展目标。通过...……更多
...径。为什么这样认为。对此,王鹤在具身智能大会具身多模态大模型论坛上给出了解释,科技行者就这一演讲关键内容进行了不改变原意的整理:机器人从动嘴到动手有多难最近,具身多模态大模型非常火,我们看到了OpenAI和Fig...……更多
刚刚,我们感受了一波最「像人」的国产AI,模型还是开源的
...择了两条路线分别开拓:一条是 GPT-4o 所代表的端到端多模态大模型的探索,一条是 o1 所代表的关于推理 Scaling Law 的探索。具体到 GPT-4o 上,OpenAI 跨文本、视觉和音频端到端地训练了一个新模型,所有输入和输出都由同一神经...……更多
阿里CEO吴泳铭:生成式AI让世界有了一个统一的语言——Token
...为了AI发展的最大障碍。当前的数字化世界,信息以多种模态存在——自然语言、程序代码、图像、视频、音频、3D模型、数学符号……这些信息形式各自独立,彼此之间的“对话”几乎不存在。AI虽然能够在单一模态下表现出色...……更多
大模型“遍地”都是,谁能真正解放生产力?
...,其苦于人工标注久矣,不想再人工打标视频、图片等多模态信息。但市场现实情况是,供不应求:除了大厂以外,少有大模型团队具备多模态大模型开放能力。深耕于产业多年的考拉悠然,听到了太多客户关于大模型难以落地...……更多
紫东.太初再进化,揭秘全模态大模型的想象力
...在演讲中介绍了基于昇腾AI与昇思MindSpore AI框架打造的全模态大模型紫东.太初2.0,并首次提出全模态多任务统一生成式学习框架。借用Hugging Face联合创始人Thomas Wolf的说法:“在过去的几年里,好的多模态模型一直是许多大型技...……更多
...让AI像扫码支付一样便利每个人的生活。记者注意到,多模态大模型技术在蚂蚁内部有诸多创新应用,如AI智绘、AI智乐、AIGC数字人等,用户输入一句话、一张图、一段语音,就能生成一张设计图、一段音乐作品、一段动态人像...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
... OpenAI o1 技术的深入分析累计点击量已超过 15 万。如何全模态大模型与人类的意图相对齐,已成为一个极具前瞻性且至关重要的挑战。在当前 AI 领域的快速发展中,「有效加速」和「超级对齐」已经成为两个主要的发展动向,...……更多
算力消耗高、幻觉问题棘手、多模态原生统一难……大模型轰轰烈烈发展至今,仍然面临技术上的诸多挑战。瞄准这些“痛点”,智源研究院放了个大招。在北京智源大会上,涵盖大语言模型、多模态大模型、具身智能大模型...……更多
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5”
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5” 3月14日,商汤科技发布多模态多任务通用大模型“书生(INTERN)2.5”,在多模态多任务处理能力方面实现多项全新突破,其卓越的图文跨模态开放任务处理能力可...……更多
阿里国际发布最新开源多模态模型Ovis,多模态能力再升级
...手写英文准确翻译成中文、还能精准分析财报数据……多模态能力再次升级!今天,阿里国际AI团队发布了一款多模态大模型Ovis,在图像理解任务上不断突破极限,多种具体的子类任务中均达到了SOTA(最新技术)水平。多模态...……更多
支付宝推出AI毛发自测工具 上传照片可测脱发程度
...州市一医院脱发专科门诊医生共同研发,利用蚂蚁百灵多模态大模型识别技术、人工智能与医学图像处理技术。用户只需上传几张头皮照片,AI即可在半分钟内识别出脱发类型和级别,并提供相应的健康建议,用户可以通过支付...……更多
击败Gemini-1.5-Pro、GPT-4V,从容大模型多模态能力跻身全球前三
...云从科技从容大模型在综合评测权威平台 OpenCompass 的多模态评测领域中取得重大进展。最新评测结果显示,云从科技的从容大模型在该体系中的平均得分为 65.5,这一成绩使得从容大模型跻身全球前三,超越了谷歌的 Gemini-1.5-Pro...……更多
Gemini引领多模态AI热潮,产业发展有望加速
12月11日,多模态AI概念股继续活跃,苏州科达(603660.SH)三连板。截至当日中午收盘,因赛集团(300781.SZ)涨13.32%,苏州科达涨9.96%,宣亚国际(300612.SZ)涨9.7%。消息面上,GoogleAI大模型Gemini近日发布,Gemini是Google到目前为止规……更多
蚂蚁井贤栋:通过专业智能体的深度连接,AI会像互联网一样带来服务的代际升级
...具备专家知识水平。垂直领域、高质量的数据往往以多种模态存在,体系庞杂,比较分散,对隐私保护和资产价值保护的要求高,很难直接“喂给”通用大模型。井贤栋介绍,蚂蚁依托知识图谱、密态计算等技术,构建了大规模...……更多
商汤又“夺金”!SuperCLUE-V多模态大模型基准发布10月榜单
...这个金秋,“日日新·商量”又拿了金牌!今日,中文多模态大模型测评基准SuperCLUE-V发布10月榜单:商汤日日新·商量多模态大模型(SenseChat-Vision5.5)凭借多个任务上的出色表现,总得分位列国内大模型第一梯队,智夺金牌。商...……更多
手机上能跑的「GPT-4V」来啦!多图、视频理解首次上端!面壁小钢炮开源史上最强端侧多模态
...导读】面壁小钢炮MiniCPM-V 2.6重磅出击,再次刷新端侧多模态天花板!凭借8B参数,已经取得单图、多图、视频理解三项SOTA ,性能全面对标GPT-4V。再次刷新端侧多模态天花板,面壁「小钢炮」 MiniCPM-V 2.6 模型重磅上新!仅8B参数...……更多
更多关于科技的资讯:
本文转自:人民网-陕西频道人民网西安11月3日电(记者李志强)11月3日,国家重大科技基础设施“先进阿秒激光设施(西安部分)”建设正式启动
2024-11-03 18:45:00
一种会让牙齿掉光的病!很多人年轻时都不重视
关于牙齿健康,世界卫生组织曾提出过一个“8020”概念,指 80 岁的老年人至少应该存留有 20 颗健康可以使用的天然牙
2024-11-03 19:07:00
给大象争取\
Happy,是“服务于”美国纽约布朗克斯动物园的一头亚洲象,五十多岁了,它在这个动物园居住了几十年。可以说,它从小就是在人类的饲养环境中
2024-11-03 19:07:00
新一代便宜主板来了!B860、B850、B840傻傻分不清
快科技11月3日消息,Intel、AMD的新一代平台都已到来,但是都只有旗舰级主板,无论是Z890还是X870E/X870都很昂贵(当然AMD更好一些还能选择上代主板)
2024-11-03 19:37:00
中国研制原子钟6000万年误差小于1秒:可支撑6G、7G通信发展
快科技11月3日消息,据报道,在中国科学院国家授时中心,安放着中国自主研制的原子钟,这是世界上目前在应用的最先进计时设备
2024-11-03 19:37:00
为什么蝙蝠可以吊着睡觉 其他动物就不行
蝙蝠可以挂着睡,最重要的原因是它们的体重足够轻。其它动物如果体重也足够轻,同时能像蝙蝠那样不费力地支撑自己倒挂,那么它们也可以倒挂着睡
2024-11-03 20:07:00
一周了 酷睿Ultra 200S在德国一颗都没卖出去!
大家都知道,德国玩家非常偏好AMD,以致于到了非常离谱的地步。德国最大的零售商MindFactory公布了最新一周的CPU处理器销量数据
2024-11-03 20:07:00
雷军今晚举行“迟到的直播”,讲述小米征战纽北的故事。雷军在直播中表示,小米15 打破了售价3999元的束缚,“3999元对我们是个心魔
2024-11-03 20:23:00
苹果2024款Macmini于10月29日发布,搭载M4/M4Pro芯片,内存16GB起步。配备M4的Macmini起售价为 4
2024-11-03 20:24:00
彭博社记者马克・古尔曼昨晚发表了最新一期的《PowerOn》时事通讯,提到苹果正在逐渐放弃“年更”式的产品发布策略。“苹果公司正在逐步放弃每年一次的产品升级周期
2024-11-03 20:29:00
realme今日宣布,真我GT7Pro首发搭载realmeUI6.0,支持4年系统更新维护。升级内容如下:流体云2.0
2024-11-03 20:30:00
据媒体报道,在ICPC(国际大学生程序设计竞赛)上,华为CEO任正非与ICPC主席、教练及获奖选手举办座谈会。任正非在会上被问到
2024-11-03 20:31:00
美商海盗船发布K70 PRO TKL磁轴机械键盘:快速触发设计
快科技11月3日消息,美商海盗船宣布,将其MGX Hyperdrive霍尔效应磁轴带入到K70 PRO TKL机械键盘
2024-11-03 20:37:00
红魔10pro预热首发,1.5k无孔全面屏
红魔官方今天为新机红魔10Pro预热,号称是全面屏史上最高分辨率。目前红魔10Pro系列已经获得入网许可,其型号是NX789J
2024-11-03 20:42:00
今晚,小米CEO雷军再次开启了直播。在谈到近期小米洗衣机的火爆时,雷军表示:“我特别惊讶的是小米洗衣机冲上热搜第四。我们的手机和汽车冲到排行榜第四都很困难
2024-11-03 20:46:00