• 我的订阅
  • 头条热搜
百灵大模型多模态能力全面提升
...IT之家从蚂蚁集团获悉,蚂蚁集团自研的百灵大模型的多模态能力全面提升。多模态能力让大模型能“看”会“听”,能“说”会“画”,可支持音、视、图、文等多模态理解与生成,可以让大模型更像人一样感知和互动,未来...……更多
2024WAIC热议大模型助力产业新趋势,可信应用成焦点
...变小,成为具身智能的「大脑」。解法:垂域大模型、多模态技术与 AI 智能体论坛中,关于可信大模型如何在应用具体落地,呈现出了多种解法,大家不约而同地开展了对垂域大模型、多模态技术与 AI 智能体的探索。在专业领...……更多
支付宝多模态医疗大模型正式亮相
...2024世界人工智能大会“可信大模型论坛”上,支付宝多模态医疗大模型正式亮相,成为国内首批多模态医疗大模型之一。据CNMO了解,支付宝医疗大模型的基座模型为蚂蚁百灵大模型。据蚂蚁集团大模型应用部总经理顾进杰介绍...……更多
支付宝发布多模态医疗大模型:支持千亿级视觉识别
...快科技7月5日消息,在2024世界人工智能大会上,支付宝多模态医疗大模型正式亮相,成为国内首批多模态医疗大模型之一。据悉,该医疗大模型的基石,源自蚂蚁集团自主研发的蚂蚁百灵大模型,这一先进平台不仅拥有“视听言...……更多
AI“明星”选手巅峰对决!记者实测最新谷歌Gemini与GPT-4o
...模型能够实现无缝的文本、视频和音频输入,并生成相应模态的输出,真正意义上实现了多模态交互。紧随其后一天,年度Google I/O开发者大会如期而至,谷歌CEO Sundar Pichai宣布了一系列围绕其最新生成式AI模型Gemini的重大更新,...……更多
又一生成式AI助手将“登机”!谷歌发布多模态Bard助理,交互式AI时代近了?
...文本、语音或图像与Bard助理互动——换言之,其具备多模态功能。例如,当用户询问“本周我错过了哪些重要邮件”时,Bard助理会列出各项要点及具体内容,并附上具体对应邮件的链接,还可以帮助用户提取活动地址并在谷歌...……更多
科学家打造多模态模型,7B和1.3B小模型均开源,可部署手机等终端
在最近一项研究中,DeepSeek-AI 团队针对多模态大模型展开了深入探索。选择这一研究方向,背后有着多重考量。最初,该团队围绕是否聚焦于多模态生成、多模态理解、或是两者的统一框架进行了广泛讨论。基于对通用人工智...……更多
科学家开发多模态音乐理解和生成大模型,兼具理解和创作音乐能力
...音乐理解和生成结合在一起的想法比较新颖,论文也是多模态大模型领域的先期工作之一。并且,除了大模型本身,我们提出的针对模型训练的数据集制作流程和整理的数据集,对学术界也具有较大价值。”腾讯 ARC Lab 刘山松研...……更多
...次通过备案的百灵语言大模型,蚂蚁集团也在研发百灵多模态大模型,并已内测。(蓝鲸记者 黄心怡) ……更多
群核科技(酷家乐)陈卓:用多模态AI助理赋能设计产业,用合成数据服务反哺AI | 新质生产力·AI Partner大会
...3D空间领域生成式AI引擎,包括底层的超级算力中心、多模态的海量产业数据,以及自研空间AIGC大模型。在这个引擎之上,已经开始生长出丰富的,服务于不同场景和需求的AI应用,它们正在解决每个应用场景中的个性化问题。...……更多
出门问问入选「中国AI大模型平台排行榜TOP10」
...技术为核心业务的AI企业,拥有全栈式语音交互能力及多模态大模型自研能力,能够通过各种软硬件解决方案为全球内容创作者、企业级客户及消费者提供AICoPilot服务。作为业内稀缺的产模结合公司,出门问问在自研多模态、可...……更多
给机器人装上大模型大脑,「若愚科技」获超5000万天使轮融资|36氪首发
文|武静静编辑|邓咏仪36氪获悉,多模态大模型公司「若愚科技」完成超5000万天使轮融资,本轮融资由东方精工领投,昆仲跟投,源合资本担任独家融资顾问。公司称,资金将主要用于产品研发,业务拓展以及团队搭建等方...……更多
GPT-4V暴露致命缺陷?JHU等发布首个多模态ToM 测试集
...来自 JHU, NYU, MIT, Harvard 等机构的研究团队开创了第一个多模态的 ToM 测试基准,发现现有的多模态模型和 LLM 都表现存在系统性缺陷,同时他们提出了一种有效的新方法。在刚结束的 ACL 2024 会议中,这篇论文获得杰出论文奖。论...……更多
...径。为什么这样认为。对此,王鹤在具身智能大会具身多模态大模型论坛上给出了解释,科技行者就这一演讲关键内容进行了不改变原意的整理:机器人从动嘴到动手有多难最近,具身多模态大模型非常火,我们看到了OpenAI和Fig...……更多
刚刚,我们感受了一波最「像人」的国产AI,模型还是开源的
...择了两条路线分别开拓:一条是 GPT-4o 所代表的端到端多模态大模型的探索,一条是 o1 所代表的关于推理 Scaling Law 的探索。具体到 GPT-4o 上,OpenAI 跨文本、视觉和音频端到端地训练了一个新模型,所有输入和输出都由同一神经...……更多
阿里CEO吴泳铭:生成式AI让世界有了一个统一的语言——Token
...为了AI发展的最大障碍。当前的数字化世界,信息以多种模态存在——自然语言、程序代码、图像、视频、音频、3D模型、数学符号……这些信息形式各自独立,彼此之间的“对话”几乎不存在。AI虽然能够在单一模态下表现出色...……更多
大模型“遍地”都是,谁能真正解放生产力?
...,其苦于人工标注久矣,不想再人工打标视频、图片等多模态信息。但市场现实情况是,供不应求:除了大厂以外,少有大模型团队具备多模态大模型开放能力。深耕于产业多年的考拉悠然,听到了太多客户关于大模型难以落地...……更多
...让AI像扫码支付一样便利每个人的生活。记者注意到,多模态大模型技术在蚂蚁内部有诸多创新应用,如AI智绘、AI智乐、AIGC数字人等,用户输入一句话、一张图、一段语音,就能生成一张设计图、一段音乐作品、一段动态人像...……更多
空间智能版ImageNet来了!李飞飞吴佳俊团队出品
...来自斯坦福李飞飞吴佳俊团队!HourVideo,一个用于评估多模态模型对长达一小时视频理解能力的基准数据集,包含多种任务。通过与现有模型对比,揭示当前模型在长视频理解上与人类水平的差距。2009年,李飞飞团队在CVPR上首...……更多
算力消耗高、幻觉问题棘手、多模态原生统一难……大模型轰轰烈烈发展至今,仍然面临技术上的诸多挑战。瞄准这些“痛点”,智源研究院放了个大招。在北京智源大会上,涵盖大语言模型、多模态大模型、具身智能大模型...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
... OpenAI o1 技术的深入分析累计点击量已超过 15 万。如何全模态大模型与人类的意图相对齐,已成为一个极具前瞻性且至关重要的挑战。在当前 AI 领域的快速发展中,「有效加速」和「超级对齐」已经成为两个主要的发展动向,...……更多
支付宝推出AI毛发自测工具 上传照片可测脱发程度
...州市一医院脱发专科门诊医生共同研发,利用蚂蚁百灵多模态大模型识别技术、人工智能与医学图像处理技术。用户只需上传几张头皮照片,AI即可在半分钟内识别出脱发类型和级别,并提供相应的健康建议,用户可以通过支付...……更多
阿里国际发布最新开源多模态模型Ovis,多模态能力再升级
...手写英文准确翻译成中文、还能精准分析财报数据……多模态能力再次升级!今天,阿里国际AI团队发布了一款多模态大模型Ovis,在图像理解任务上不断突破极限,多种具体的子类任务中均达到了SOTA(最新技术)水平。多模态...……更多
击败Gemini-1.5-Pro、GPT-4V,从容大模型多模态能力跻身全球前三
...云从科技从容大模型在综合评测权威平台 OpenCompass 的多模态评测领域中取得重大进展。最新评测结果显示,云从科技的从容大模型在该体系中的平均得分为 65.5,这一成绩使得从容大模型跻身全球前三,超越了谷歌的 Gemini-1.5-Pro...……更多
蚂蚁井贤栋:通过专业智能体的深度连接,AI会像互联网一样带来服务的代际升级
...具备专家知识水平。垂直领域、高质量的数据往往以多种模态存在,体系庞杂,比较分散,对隐私保护和资产价值保护的要求高,很难直接“喂给”通用大模型。井贤栋介绍,蚂蚁依托知识图谱、密态计算等技术,构建了大规模...……更多
Gemini引领多模态AI热潮,产业发展有望加速
12月11日,多模态AI概念股继续活跃,苏州科达(603660.SH)三连板。截至当日中午收盘,因赛集团(300781.SZ)涨13.32%,苏州科达涨9.96%,宣亚国际(300612.SZ)涨9.7%。消息面上,GoogleAI大模型Gemini近日发布,Gemini是Google到目前为止规……更多
商汤又“夺金”!SuperCLUE-V多模态大模型基准发布10月榜单
...这个金秋,“日日新·商量”又拿了金牌!今日,中文多模态大模型测评基准SuperCLUE-V发布10月榜单:商汤日日新·商量多模态大模型(SenseChat-Vision5.5)凭借多个任务上的出色表现,总得分位列国内大模型第一梯队,智夺金牌。商...……更多
首个多模态连续学习综述,港中文、清华、UIC联合发布
...址:https://github.com/LucyDYu/Awesome-Multimodal-Continual-Learning多模态连续学习的最新进展连续学习(CL)旨在增强机器学习模型的能力,使其能够不断从新数据中学习,而无需进行所有旧数据的重新训练。连续学习的主要挑战是灾难性遗...……更多
手机上能跑的「GPT-4V」来啦!多图、视频理解首次上端!面壁小钢炮开源史上最强端侧多模态
...导读】面壁小钢炮MiniCPM-V 2.6重磅出击,再次刷新端侧多模态天花板!凭借8B参数,已经取得单图、多图、视频理解三项SOTA ,性能全面对标GPT-4V。再次刷新端侧多模态天花板,面壁「小钢炮」 MiniCPM-V 2.6 模型重磅上新!仅8B参数...……更多
全新的coloros15正式登场,新系统带来全面提升
...而OPPO的一键问屏功能却可以做到边看边说,实现同步多模态的交互。这就意味着用户在浏览内容时,可以立即询问或发出指令,AI能够实时响应,用户不再需要在不同模态之间来回切换操作。OPPO的目标是让AI助理像真人助理一样...……更多
更多关于科技的资讯:
高通:骁龙PC退货率并不高!符合行业标准
快科技12月15日消息,日前,Intel声称高通的骁龙PC退货率偏高,因为消费者对软件兼容性不佳并不满意,对此高通予以明确驳斥
2024-12-15 18:48:00
重大消息:AIX Wallet正式接入ChatGPT接口
亲爱的AIXWallet用户们,我们非常激动地宣布,AIXWallet现已成功接入ChatGPT接口,为您带来前所未有的智能服务体验
2024-12-15 19:13:00
破铺轨施工最快纪录!渝厦高铁重庆东至黔江段全线轨道贯通
快科技12月15日消息,据报道,在重庆市武隆区白马山隧道出口施工现场,随着建设者将最后一对500米长钢轨顺利铺设到接轨点
2024-12-15 19:18:00
又有新折叠!传音2款折叠在印度开售,最低人民币约3003元起
近期,传音在日本发布了2款新折叠手机,——PhantomVFold2和PhantomVFlip2,在亚马逊官网上最低售价仅为3003元人民币起
2024-12-15 19:28:00
魅族20系列手机迎来Flyme 11.2.0.0A稳定版更新
魅族20系列手机12月12日推送Flyme11.2.0.0A稳定版更新,这次更新覆盖了魅族20、魅族20Pro、魅族20INFINITY无界版等机型
2024-12-15 19:28:00
马斯克能否造一款“特斯拉手机”?特斯拉手机渲染图曝光
近日,有一个马斯克的恶搞账号在社交平台上发布了“特斯拉手机”的渲染图,并询问大家是否接受其作为圣诞节礼物。目前并没有确切的消息表明特斯拉会正式推出自己的智能手机
2024-12-15 19:29:00
石头科技助你放心躺平,洗地机A30支持躺平自带零感清洁
这年头家里要是没备上几样家务神器,那可以说是压根就不会主动提做家务。工作已经这么忙,留给自己的时间本就雪上加霜。要是有个在家里溜达一圈
2024-12-15 19:33:00
对标华为的“荣耀”!荣耀线上性能机GT官宣,赵明不惜成本打造
曾经的荣耀,就是华为性能手机的代表,用来与小米等品牌在线上抢夺手机市场!而随着荣耀的独立,开始自立门户,优先以线下市场为发力点
2024-12-15 19:33:00
谷歌Gemini 2.0发布,我看到了Web的未来
OpenAI的超长发布会还没结束,谷歌便火速推出Gemini2.0系列的第一个版本——Gemini2.0Flash测试版
2024-12-15 19:36:00
全力研发AI服务器:苹果搁浅M4 Extreme开发
苹果已经发布了M4系列处理器,在性能上比之前相比提升十分地明显,此外在AI性能上同样如此,不过目前的M4处理器并不能算是完全体
2024-12-15 19:36:00
海光新款16核心CPU首曝:多核性能还不如6核心Zen3
快科技12月15日消息,国产CPU处理器中,海光和兆芯都兼容x86指令集,其中海光基于第一代Zen架构,兆芯则是基于威盛IP
2024-12-15 19:48:00
塔克拉玛干沙漠惊现周长9米的巨型胡杨!为何如此强悍
据报道,12月11日,越野达人董长凯在穿越穿越塔克拉玛干沙漠时,在克里雅古道之中发现了一棵巨型胡杨树!经过测量,这颗树的胸围达到了9米
2024-12-15 19:48:00
规模世界第一!我国在运和核准在建核电机组装机约1.13亿千瓦
快科技12月15日消息,据报道,截至2024年,我国在运和核准在建核电机组装机约1.13亿千瓦,规模升至世界第一。2025年
2024-12-15 20:48:00
AOC新款34寸带鱼屏上市:180Hz VA面板首发1499元
快科技12月15日消息,AOC新款34寸带鱼屏——CU34G10XP目前已经上市,首发1499元。据悉,新款显示器配备34寸VA面板
2024-12-15 21:18:00
5.1GHz也没用!AMD史上最快四核心只能勉强喂饱RTX 4060
快科技12月15日消息,如今,四核心处理器已经基本离我们远去,不过AMD今年中面向中小企业发布的EPYC 4004系列
2024-12-15 21:48:00