• 我的订阅
  • 头条热搜
百灵大模型多模态能力全面提升
...IT之家从蚂蚁集团获悉,蚂蚁集团自研的百灵大模型的多模态能力全面提升。多模态能力让大模型能“看”会“听”,能“说”会“画”,可支持音、视、图、文等多模态理解与生成,可以让大模型更像人一样感知和互动,未来...……更多
2024WAIC热议大模型助力产业新趋势,可信应用成焦点
...变小,成为具身智能的「大脑」。解法:垂域大模型、多模态技术与 AI 智能体论坛中,关于可信大模型如何在应用具体落地,呈现出了多种解法,大家不约而同地开展了对垂域大模型、多模态技术与 AI 智能体的探索。在专业领...……更多
支付宝多模态医疗大模型正式亮相
...2024世界人工智能大会“可信大模型论坛”上,支付宝多模态医疗大模型正式亮相,成为国内首批多模态医疗大模型之一。据CNMO了解,支付宝医疗大模型的基座模型为蚂蚁百灵大模型。据蚂蚁集团大模型应用部总经理顾进杰介绍...……更多
支付宝发布多模态医疗大模型:支持千亿级视觉识别
...快科技7月5日消息,在2024世界人工智能大会上,支付宝多模态医疗大模型正式亮相,成为国内首批多模态医疗大模型之一。据悉,该医疗大模型的基石,源自蚂蚁集团自主研发的蚂蚁百灵大模型,这一先进平台不仅拥有“视听言...……更多
AI“明星”选手巅峰对决!记者实测最新谷歌Gemini与GPT-4o
...模型能够实现无缝的文本、视频和音频输入,并生成相应模态的输出,真正意义上实现了多模态交互。紧随其后一天,年度Google I/O开发者大会如期而至,谷歌CEO Sundar Pichai宣布了一系列围绕其最新生成式AI模型Gemini的重大更新,...……更多
又一生成式AI助手将“登机”!谷歌发布多模态Bard助理,交互式AI时代近了?
...文本、语音或图像与Bard助理互动——换言之,其具备多模态功能。例如,当用户询问“本周我错过了哪些重要邮件”时,Bard助理会列出各项要点及具体内容,并附上具体对应邮件的链接,还可以帮助用户提取活动地址并在谷歌...……更多
科学家打造多模态模型,7B和1.3B小模型均开源,可部署手机等终端
在最近一项研究中,DeepSeek-AI 团队针对多模态大模型展开了深入探索。选择这一研究方向,背后有着多重考量。最初,该团队围绕是否聚焦于多模态生成、多模态理解、或是两者的统一框架进行了广泛讨论。基于对通用人工智...……更多
科学家开发多模态音乐理解和生成大模型,兼具理解和创作音乐能力
...音乐理解和生成结合在一起的想法比较新颖,论文也是多模态大模型领域的先期工作之一。并且,除了大模型本身,我们提出的针对模型训练的数据集制作流程和整理的数据集,对学术界也具有较大价值。”腾讯 ARC Lab 刘山松研...……更多
...次通过备案的百灵语言大模型,蚂蚁集团也在研发百灵多模态大模型,并已内测。(蓝鲸记者 黄心怡) ……更多
群核科技(酷家乐)陈卓:用多模态AI助理赋能设计产业,用合成数据服务反哺AI | 新质生产力·AI Partner大会
...3D空间领域生成式AI引擎,包括底层的超级算力中心、多模态的海量产业数据,以及自研空间AIGC大模型。在这个引擎之上,已经开始生长出丰富的,服务于不同场景和需求的AI应用,它们正在解决每个应用场景中的个性化问题。...……更多
出门问问入选「中国AI大模型平台排行榜TOP10」
...技术为核心业务的AI企业,拥有全栈式语音交互能力及多模态大模型自研能力,能够通过各种软硬件解决方案为全球内容创作者、企业级客户及消费者提供AICoPilot服务。作为业内稀缺的产模结合公司,出门问问在自研多模态、可...……更多
给机器人装上大模型大脑,「若愚科技」获超5000万天使轮融资|36氪首发
文|武静静编辑|邓咏仪36氪获悉,多模态大模型公司「若愚科技」完成超5000万天使轮融资,本轮融资由东方精工领投,昆仲跟投,源合资本担任独家融资顾问。公司称,资金将主要用于产品研发,业务拓展以及团队搭建等方...……更多
GPT-4V暴露致命缺陷?JHU等发布首个多模态ToM 测试集
...来自 JHU, NYU, MIT, Harvard 等机构的研究团队开创了第一个多模态的 ToM 测试基准,发现现有的多模态模型和 LLM 都表现存在系统性缺陷,同时他们提出了一种有效的新方法。在刚结束的 ACL 2024 会议中,这篇论文获得杰出论文奖。论...……更多
AI的金融应用前景有多大?7家银行科技负责人聊了聊
...发银行信息科技部副总经理万化表示,浦发正在尝试将多模态人机交互、知识图谱、AI模型等技术应用于理财业务场景,推出AI“理财专家”,为消费者智能化地推荐理财产品。AI Bank则是平安银行在2018年就提出的发展目标。通过...……更多
...径。为什么这样认为。对此,王鹤在具身智能大会具身多模态大模型论坛上给出了解释,科技行者就这一演讲关键内容进行了不改变原意的整理:机器人从动嘴到动手有多难最近,具身多模态大模型非常火,我们看到了OpenAI和Fig...……更多
刚刚,我们感受了一波最「像人」的国产AI,模型还是开源的
...择了两条路线分别开拓:一条是 GPT-4o 所代表的端到端多模态大模型的探索,一条是 o1 所代表的关于推理 Scaling Law 的探索。具体到 GPT-4o 上,OpenAI 跨文本、视觉和音频端到端地训练了一个新模型,所有输入和输出都由同一神经...……更多
阿里CEO吴泳铭:生成式AI让世界有了一个统一的语言——Token
...为了AI发展的最大障碍。当前的数字化世界,信息以多种模态存在——自然语言、程序代码、图像、视频、音频、3D模型、数学符号……这些信息形式各自独立,彼此之间的“对话”几乎不存在。AI虽然能够在单一模态下表现出色...……更多
大模型“遍地”都是,谁能真正解放生产力?
...,其苦于人工标注久矣,不想再人工打标视频、图片等多模态信息。但市场现实情况是,供不应求:除了大厂以外,少有大模型团队具备多模态大模型开放能力。深耕于产业多年的考拉悠然,听到了太多客户关于大模型难以落地...……更多
紫东.太初再进化,揭秘全模态大模型的想象力
...在演讲中介绍了基于昇腾AI与昇思MindSpore AI框架打造的全模态大模型紫东.太初2.0,并首次提出全模态多任务统一生成式学习框架。借用Hugging Face联合创始人Thomas Wolf的说法:“在过去的几年里,好的多模态模型一直是许多大型技...……更多
...让AI像扫码支付一样便利每个人的生活。记者注意到,多模态大模型技术在蚂蚁内部有诸多创新应用,如AI智绘、AI智乐、AIGC数字人等,用户输入一句话、一张图、一段语音,就能生成一张设计图、一段音乐作品、一段动态人像...……更多
空间智能版ImageNet来了!李飞飞吴佳俊团队出品
...来自斯坦福李飞飞吴佳俊团队!HourVideo,一个用于评估多模态模型对长达一小时视频理解能力的基准数据集,包含多种任务。通过与现有模型对比,揭示当前模型在长视频理解上与人类水平的差距。2009年,李飞飞团队在CVPR上首...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
... OpenAI o1 技术的深入分析累计点击量已超过 15 万。如何全模态大模型与人类的意图相对齐,已成为一个极具前瞻性且至关重要的挑战。在当前 AI 领域的快速发展中,「有效加速」和「超级对齐」已经成为两个主要的发展动向,...……更多
算力消耗高、幻觉问题棘手、多模态原生统一难……大模型轰轰烈烈发展至今,仍然面临技术上的诸多挑战。瞄准这些“痛点”,智源研究院放了个大招。在北京智源大会上,涵盖大语言模型、多模态大模型、具身智能大模型...……更多
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5”
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5” 3月14日,商汤科技发布多模态多任务通用大模型“书生(INTERN)2.5”,在多模态多任务处理能力方面实现多项全新突破,其卓越的图文跨模态开放任务处理能力可...……更多
阿里国际发布最新开源多模态模型Ovis,多模态能力再升级
...手写英文准确翻译成中文、还能精准分析财报数据……多模态能力再次升级!今天,阿里国际AI团队发布了一款多模态大模型Ovis,在图像理解任务上不断突破极限,多种具体的子类任务中均达到了SOTA(最新技术)水平。多模态...……更多
支付宝推出AI毛发自测工具 上传照片可测脱发程度
...州市一医院脱发专科门诊医生共同研发,利用蚂蚁百灵多模态大模型识别技术、人工智能与医学图像处理技术。用户只需上传几张头皮照片,AI即可在半分钟内识别出脱发类型和级别,并提供相应的健康建议,用户可以通过支付...……更多
击败Gemini-1.5-Pro、GPT-4V,从容大模型多模态能力跻身全球前三
...云从科技从容大模型在综合评测权威平台 OpenCompass 的多模态评测领域中取得重大进展。最新评测结果显示,云从科技的从容大模型在该体系中的平均得分为 65.5,这一成绩使得从容大模型跻身全球前三,超越了谷歌的 Gemini-1.5-Pro...……更多
Gemini引领多模态AI热潮,产业发展有望加速
12月11日,多模态AI概念股继续活跃,苏州科达(603660.SH)三连板。截至当日中午收盘,因赛集团(300781.SZ)涨13.32%,苏州科达涨9.96%,宣亚国际(300612.SZ)涨9.7%。消息面上,GoogleAI大模型Gemini近日发布,Gemini是Google到目前为止规……更多
蚂蚁井贤栋:通过专业智能体的深度连接,AI会像互联网一样带来服务的代际升级
...具备专家知识水平。垂直领域、高质量的数据往往以多种模态存在,体系庞杂,比较分散,对隐私保护和资产价值保护的要求高,很难直接“喂给”通用大模型。井贤栋介绍,蚂蚁依托知识图谱、密态计算等技术,构建了大规模...……更多
商汤又“夺金”!SuperCLUE-V多模态大模型基准发布10月榜单
...这个金秋,“日日新·商量”又拿了金牌!今日,中文多模态大模型测评基准SuperCLUE-V发布10月榜单:商汤日日新·商量多模态大模型(SenseChat-Vision5.5)凭借多个任务上的出色表现,总得分位列国内大模型第一梯队,智夺金牌。商...……更多
更多关于科技的资讯:
荣耀“降价王”:突降2747元,1/1.12英寸大底+5450mAh+IP68
在如今琳琅满目的手机市场里,要找到一款既靠谱又不“作”的手机,真的好比在海底捞针。你以为买了一款性价比之王,但用不了几天屏幕开始抖动
2024-11-15 14:05:00
5分钟打破销量纪录,16GB+512GB+8T旗舰屏,如今高配版才卖2199元
喜欢用手机玩游戏的人,应该都知道黑鲨、红魔这类游戏手机品牌,它们旗下机型主打特点就是出色的游戏体验,早期凭借这一特性,这类机型还挺受欢迎的
2024-11-15 14:06:00
旗舰手机采用国产屏成新趋势,手机高端面板市场开始洗牌
自今年10月份以来的“发机潮”,随着国产手机纷纷发布新款旗舰手机,国产手机所采用屏幕也受到了关注。以往,很多国产手机品牌更倾向于选择三星屏
2024-11-15 14:07:00
一加13外观以及屏幕解析:依旧是西装暴徒
用户对于手机外观设计与屏幕显示效果的要求也越来越高。而一加13正是这样一款集美观与实用于一身的手机,它不仅在外观设计上独具匠心
2024-11-15 14:07:00
腾讯推出AI智能工作台ima:AI问答/生图,打通微信公众号文章生态
IT之家 11 月 15 日消息,腾讯官方公众号今日发文宣布,旗下 AI 智能工作台 ima 现已正式上线,其除了能完成其余大模型 AI 问答产品的功能(IT之家注
2024-11-15 14:10:00
大众彻底不装了!大7座MPV威然直降超10万:限时19.99万起
快科技11月15日消息,在今日开幕的2024广州车展上,上汽大众带来了新款威然。这款大7座MPV曾经的售价高达30万元
2024-11-15 10:50:00
都冬天了!为什么最近还这么多蚊子
最近,不知道北方其他地区的朋友们有没有同样的困扰——图片来源:某社交平台谁能想到,都 11 月了,都入冬了,蚊子还天天“魔音贯耳”
2024-11-15 10:50:00
SDG集团明纬携手伙伴进驻第七届进博会 五年之约 筑梦未来
黄浦江畔,宾朋云集。在国家会展中心(上海),一场年度盛会如约而至。2024年11月5日至10日,以“新时代,共享未来”为主题的第七届中国国际进口博览会(下称“进博会”)在此举行
2024-11-15 11:00:00
□ 本报记者 卢 岳“在四川青城山旅游的过程中,结交了很多与自己志同道合的银龄朋友,整个旅途中还有专业的老师提供八段锦教学
2024-11-15 11:06:00
2024年11月15日调研机构GlobalInfoResearch出版了《全球非接触电容传感器行业总体规模、主要厂商及IPO上市调研报告
2024-11-15 11:08:00
品牌出海:科大讯飞&SHOPLINE强强联合展现“中国智造”
近日,国内出海AI赛道内最具代表性的科技品牌——科大讯飞在阿联酋迪拜通讯及消费电子展览会(GITEXGLOBAL2024)上精彩亮相
2024-11-15 11:16:00
飞贼徒手爬楼连偷22部手机:曾做过大楼外墙清洁
快科技11月15日消息,据报道,武汉一家传媒公司的员工上班时发现,放在桌上的22部工作手机全部不翼而飞。经过警方的深入调查
2024-11-15 11:20:00
全球第一款!《半条命2》20周年主题RTX 4080 SUPER显卡亮相
快科技11月15日消息,全球第一款以纪念《半条命2》20周年主题的RTX 4080 SUPER显卡正式亮相,也可能是全球唯一一款
2024-11-15 11:20:00
4K百帧旗舰!瀚铠RX 7900 XTX显卡图赏
快科技11月15日消息,瀚铠新推出RX 7900 XTX 24G D6超合金旗舰版OC显卡,目前京东售价为7159元。现在这款新品已经来到我们评测室
2024-11-15 11:20:00
意向金2万元 比亚迪百万豪华轿车仰望U7开卖:纯电+混动
快科技11月15日消息,刚刚,比亚迪仰望旗下百万级豪华轿车仰望U7正式开启预售,意向金2万元,不过遗憾的是目前官方并未公布正式售价
2024-11-15 11:20:00