• 我的订阅
  • 头条热搜
微软新专利:构建多模态3d面部模型
...单,微软公司获得了一项新的专利,通过深度学习构建多模态3D面部模型,可以创建非常逼真的虚拟肖像。这项专利全称为《多模态三维面部建模和跟踪,生成富有表现力的虚拟肖像》,该系统涉及处理器和存储系统,处理器负...……更多
云知声推出山海多模态大模型:实时生成文本、音频和图像
IT之家 8 月 26 日消息,云知声于 23 日宣布推出山海多模态大模型。通过整合跨模态信息,山海多模态大模型能够接收文本、音频、图像等多种形式作为输入,并实时生成文本、音频和图像的任意组合输出。▲云知声山海助手微...……更多
吉利翼真 L380 MPV 亮相 WAIC
...息,在7月5日举行的2024世界人工智能大会(WAIC)期间,商汤科技发布“日日新SenseNova5.5”大模型体系。吉利翼真L380MPV作为首个搭载该大模型的汽车产品,也亮相WAIC。据介绍,搭载商汤“日日新”AI大模型的L380,可以实现文生图...……更多
给机器人装上大模型大脑,「若愚科技」获超5000万天使轮融资|36氪首发
文|武静静编辑|邓咏仪36氪获悉,多模态大模型公司「若愚科技」完成超5000万天使轮融资,本轮融资由东方精工领投,昆仲跟投,源合资本担任独家融资顾问。公司称,资金将主要用于产品研发,业务拓展以及团队搭建等方...……更多
2B多模态新SOTA!华科、华南理工发布Mini-Monkey,专治「切分增大分辨率」后遗症
【新智元导读】Mini-Monkey 是一个轻量级的多模态大型语言模型,通过采用多尺度自适应切分策略(MSAC)和尺度压缩机制(SCM),有效缓解了传统图像切分策略带来的锯齿效应,提升了模型在高分辨率图像处理和文档理解任务的...……更多
...据交易所(以下简称“深数所”)发布了500个垂直行业多模态算料集,按照大模型应用的不同阶段(训练、推理、调优),有的放矢地提供数据源,让国产大模型厂商“寻数有路”。此次深数所发布的首批500个人工智能大模型高...……更多
...板苏州科达:公司的KD-GPT大模型相对于谷歌Gemini的通用多模态大模型在服务对象上存在明显区别 【五连板苏州科达:公司的KD-GPT大模型相对于谷歌Gemini的通用多模态大模型在服务对象上存在明显区别】财联社12月13日电,苏州科...……更多
北大等发布多模态版o1!首个慢思考VLM将开源,视觉推理超闭源
北大等出品,首个多模态版o1开源模型来了——代号LLaVA-o1,基于Llama-3.2-Vision模型打造,超越传统思维链提示,实现自主“慢思考”推理。在多模态推理基准测试中,LLaVA-o1超越其基础模型8.9%,并在性能上超越了一众开闭源模型...……更多
科学家开发多模态音乐理解和生成大模型,兼具理解和创作音乐能力
...音乐理解和生成结合在一起的想法比较新颖,论文也是多模态大模型领域的先期工作之一。并且,除了大模型本身,我们提出的针对模型训练的数据集制作流程和整理的数据集,对学术界也具有较大价值。”腾讯 ARC Lab 刘山松研...……更多
国际首个,我国团队开发糖尿病诊疗多模态大模型 DeepDR-LLM
...构建了全球首个面向糖尿病诊疗的视觉-大语言模型的多模态集成智能系统 DeepDR-LLM,成果于 2024 年 7 月 19 日在 Nature Medicine 发表(题为 Integrated image-based deep learning and language models for primary diabetes care)……更多
arxiv研究人员:多模态ai模型存在安全隐患
...论文指出,包括GPT-4V、GPT-4o和Gemini1.5在内的大部分主流多模态AI模型,处理用户的多模态输入(例如一起输入图片和文本内容)之后,输出结果并不安全。这项研究标题为《跨模态安全调整》(Cross-ModalitySafetyAlignment),提出了...……更多
零成本突破多模态大模型瓶颈!多所美国顶尖高校华人团队,联合推出自增强技术CSR
新智元报道编辑:LRST【新智元导读】现有多模态大模型在对齐不同模态时面临幻觉和细粒度感知不足等问题,传统偏好学习方法依赖可能不适配的外源数据,存在成本和质量问题。Calibrated Self-Rewarding(CSR)框架通过自我增强学...……更多
多模态模型评测框架lmms-eval发布!全面覆盖,低成本,零污染
...qizhixin.com随着大模型研究的深入,如何将其推广到更多的模态上已经成为了学术界和产业界的热点。最近发布的闭源大模型如 GPT-4o、Claude 3.5 等都已经具备了超强的图像理解能力,LLaVA-NeXT、MiniCPM、InternVL 等开源领域模型也展现...……更多
...内瓦1月18日电 (记者 曾焱) 世界卫生组织18日发布的多模态大模型治理相关新指南说,人工智能在医疗卫生领域应用前景广阔,但同时也要防范其中可能出现的诸如“自动化偏见”导致的过度依赖等风险。作为一项快速发展的...……更多
MMMU华人团队更新Pro版!多模态基准升至史诗级难度:过滤纯文本问题、引入纯视觉问答
...候选选项、引入纯视觉输入设置)更严格地评估模型的多模态理解能力;模型在新基准上的性能下降明显,表明MMMU-Pro能有效避免模型依赖捷径和猜测策略的情况。多模态大型语言模型(MLLMs)在各个排行榜上展现的性能不断提...……更多
新网银行“多模态深度神经网络风控模型体系”入选10项首批代表性创新产品榜单
...暨第一批人工智能应用场景发布大会上,新网银行的“多模态深度神经网络风控模型体系”入选“10项首批代表性创新产品”,彰显了新网银行在推动人工智能与金融深度融合方面的成果和贡献。活动现场。新网银行供图本次论...……更多
支付宝发布多模态医疗大模型:支持千亿级视觉识别
...快科技7月5日消息,在2024世界人工智能大会上,支付宝多模态医疗大模型正式亮相,成为国内首批多模态医疗大模型之一。据悉,该医疗大模型的基石,源自蚂蚁集团自主研发的蚂蚁百灵大模型,这一先进平台不仅拥有“视听言...……更多
蔚来 NOMI GPT 端云多模态大模型正式上线,并同步对搭载Banyan·榕智能系统的车型陆续开启推送。据悉,NOMI GPT是为NOMI打造的端云多模态大模型,基于自研的端云融合架构,拥有图像、音频、车身传感器等多模感知能力的NOMI可以...……更多
蔚来nomigpt端云多模态大模型上线,回答各种奇妙问题
...12日消息,今日,蔚来宣布为NOMI量身打造的NOMIGPT端云多模态大模型正式上线,新版本将陆续推送给搭载Banyan・榕智能系统的车型。得益于大模型支持,用户可以实现一句话设定AI场景,回答各种奇妙问题,与用户进行有情感的趣...……更多
马斯克 xAI 展示首个多模态模型 Grok-1.5V
...下旬推出 Grok-1.5 大语言模型之后,近日再次推出首个多模态模型 Grok-1.5 Vision。xAI 表示将于近期邀请早期测试者和现有的 Grok 用户测试 Grok-1.5 Vision(Grok-1.5V),不仅能理解文本,还能处理文档、图表、截图和照片中的内容。xAI ...……更多
GPT-4V暴露致命缺陷?JHU等发布首个多模态ToM 测试集
...来自 JHU, NYU, MIT, Harvard 等机构的研究团队开创了第一个多模态的 ToM 测试基准,发现现有的多模态模型和 LLM 都表现存在系统性缺陷,同时他们提出了一种有效的新方法。在刚结束的 ACL 2024 会议中,这篇论文获得杰出论文奖。论...……更多
腾讯混元上线文生视频并开源,120秒内成片!还有提示词建议
...文、文生图、3D生成之后的最新技术进展。据腾讯混元多模态生成技术负责人凯撒现场介绍,此次更新中,HunYuan-Video模型经历了四项核心改进:1、引入超大规模数据处理系统,提升视频画质;2、采用多模态大语言模型(MLLM),...……更多
苹果公司公布“mm1”多模态大模型
...omMultimodalLLMPre-training》的论文,其中介绍了一款“MM1”多模态大模型,该模型提供30亿、70亿、300亿三种参数规模,拥有图像识别和自然语言推理能力。IT之家注意到,苹果研究团队相关论文主要是利用MM1模型做实验,通过控制各...……更多
首个可保留情感的音频LLM!Meta重磅开源7B-Spirit LM,一网打尽「音频+文本」多模态任务
【新智元导读】Meta最近开源了一个7B尺寸的Spirit LM的多模态语言模型,能够理解和生成语音及文本,可以非常自然地在两种模式间转换,不仅能处理基本的语音转文本和文本转语音任务,还能捕捉和再现语音中的情感和风格。...……更多
百模大战又添新势力!李未可科技将发布自研AI大模型
近期,36kr研究院发布了《2024年AIGC行业研究:多模态大模型与商业应用》,文中基于AIGC产业生态现状和技术发展路径,深入分析AIGC商业化应用的方向与产业发展趋势。其中在36kr研究院梳理的产业图谱中,发现杭州李未可科技...……更多
大模型像“文科生”?业内人士在沪“论战”
...能力,另一方面大模型还需要一些复杂的系统化方案。”商汤科技Copilot应用技术负责人张涛则认为,大模型在做辅助工作,并且有“幻觉”(看似合理但实际错误的现象)等缺点。但他认为,人无完人,知识非常渊博的人也会有盲...……更多
多模态模型概念股集体高开 苏州科达、网达软件双双竞价涨停 【多模态模型概念股集体高开 苏州科达、网达软件双双竞价涨停】财联社12月8日电,苏州科达、网达软件双双竞价涨停,当虹科技涨超10%,博汇科技、声迅股份涨...……更多
vivo蓝心大模型升级为“自研ai多模态大模型”
...432%。同时黄韬宣布,vivo的蓝心大模型升级为“自研AI多模态大模型”,这项技术通过视觉、声音、空间等多维度感知和理解世界,使大模型变得更加全面、智能和强大。蓝心大模型的使命是确保科技革命的成果能够平等地惠及...……更多
...学院香港创新院AI中心”),日前在香港发布医疗领域AI多模态大模型CARES Copilot1.0。据介绍,CARES Copilot系统由中国科学院香港创新院AI中心研发,是一款专为医疗领域设计的大型模型系统。该系统实现了图像、文本、语音、视频等...……更多
多模态模型、短剧游戏盘中逆市走强,文娱传媒ETF涨0.11%
2月20日,三大股指低开,多模态模型、短剧游戏盘中逆市走强,截至10:23,文娱传媒ETF(516190)翻红涨0.11%,持仓股中文在线、国脉文化、新华网纷纷涨停。消息面上,春节假期期间,OpenAI发布首个AI视频模型Sora,可生成长达60...……更多
更多关于科技的资讯:
终端升级路,零售新景象
为进一步提升终端建设质量,安阳市烟草公司城区分公司通过实地摸底调查,充分利用线上线下资源,深挖终端建设优秀案例,以点带面
2025-02-07 14:04:00
海信日立以“7+2”战略开新局,赋能暖通产业新增长
2月6日,备受瞩目的暖通开年盛会——2025海信日立合作伙伴大会于上海国际会议中心举办。本次大会以“聚力破局新生”为主题
2025-02-07 14:21:00
如何防止PayPal账户冻结
PayPal作为全球领先的在线支付平台,为用户提供了便捷的支付和收款服务。近期有不少用户反映PayPal账号收到了风险提示
2025-02-07 14:23:00
造谣东方甄选收七位数宣传费!一抖音用户被判赔36000元
快科技2月7日消息,今日,东方甄选官微发文称,北京互联网法院已就抖音用户崔某网络侵权案作出判决,认定被告发布言论不实,侵害了东方甄选名誉权
2025-02-07 14:44:00
保时捷:调整电动化目标将导致亏损超过60亿元
快科技2月7日消息,据外媒报道,保时捷股份公司近日宣布,由于产品线重组(包括增加内燃机和插电式混合动力车型)所产生的费用
2025-02-07 14:44:00
节假日服务区保留节目上演!两电动车争抢充电桩 一人怒砸车
快科技2月7日消息,高速服务区内的电动车充电桩,平日里使用率并不高,但在节假日出行高峰期间就变成稀缺资源。春运期间,电动车主争抢充电桩也算是高速服务区内的保留节目了
2025-02-07 14:44:00
与本田合作告吹后:日产将目光投向富士康
快科技2月7日消息,据媒体报道,在与本田汽车的合并谈判破裂后,日产汽车对与新的合作伙伴合作持开放态度,其中富士康成为潜在合作伙伴之一
2025-02-07 14:44:00
REDMI Turbo 4 Pro配置曝光:骁龙8s至尊版+7410mAh超大电池
快科技2月7日消息,博主数码闲聊站爆料,高通将在今年Q2推出骁龙8s至尊版移动平台,这颗芯片将由小米Civi 5 Pro
2025-02-07 14:44:00
油车、电车别二选一了!李书福透露吉利新车:可醇、可电、可油 自由切换
快科技2月7日消息,近日李书福透露,吉利即将推出全球首创的“超醇电混”技术,甲醇与汽油可灵活配比,一箱双燃。按照李书福透露的说法
2025-02-07 14:44:00
何小鹏:大学刚毕业的时无数人骗我、因为我长得老实
快科技2月7日消息,今日下午,媒体“晚点LatePost”发布了专访小鹏汽车董事长何小鹏的采访《晚点对话何小鹏:为了做一个真正的 CEO
2025-02-07 14:44:00
《哪吒2》再掀“国潮热” 中国制造赋能经典IP 讲好中国文化“新故事”
消费日报网讯(记者 卢岳□王琦琛)截至2月6日,电影《哪吒之魔童闹海2》(以下简称《哪吒2》)票房突破60亿元,成为2025年春节档票房冠军
2025-02-07 15:10:00
一对父子救火遇难4名亲属住进ICU 网友一天捐50万
快科技2月7日消息,据媒体综合报道,近日,在广东省湛江市徐闻县某镇发生了一起令人痛心的火灾事故。据报道,这场大火不仅摧毁了一间临街商铺
2025-02-07 15:14:00
一加13 mini渲染图出炉:引入环形呼吸灯 辨识度拉满
快科技2月7日消息,近日一加13 mini的最新渲染图近日在网络上曝光,手机的设计亮点在于其独特的相机布局和新引入的环形呼吸灯
2025-02-07 15:14:00
销量暴涨!号称接入DeepSeek键盘鼠标1天卖近100万元
快科技2月7日消息,据报道,国内领先的AI企业深度求索所研发的大模型DeepSeek已在全球范围内赢得了广泛赞誉,并且首批利用DeepSeek实现盈利的用户已经崭露头角
2025-02-07 15:14:00
成本不到150元!26分钟训出个推理模型 媲美o1和R1
成本不到150元,训练出一个媲美DeepSeek-R1和OpenAI o1的推理模型?!这不是洋葱新闻,而是AI教母李飞飞
2025-02-07 15:14:00