• 我的订阅
  • 头条热搜
微软新专利:构建多模态3d面部模型
...单,微软公司获得了一项新的专利,通过深度学习构建多模态3D面部模型,可以创建非常逼真的虚拟肖像。这项专利全称为《多模态三维面部建模和跟踪,生成富有表现力的虚拟肖像》,该系统涉及处理器和存储系统,处理器负...……更多
云知声推出山海多模态大模型:实时生成文本、音频和图像
IT之家 8 月 26 日消息,云知声于 23 日宣布推出山海多模态大模型。通过整合跨模态信息,山海多模态大模型能够接收文本、音频、图像等多种形式作为输入,并实时生成文本、音频和图像的任意组合输出。▲云知声山海助手微...……更多
给机器人装上大模型大脑,「若愚科技」获超5000万天使轮融资|36氪首发
文|武静静编辑|邓咏仪36氪获悉,多模态大模型公司「若愚科技」完成超5000万天使轮融资,本轮融资由东方精工领投,昆仲跟投,源合资本担任独家融资顾问。公司称,资金将主要用于产品研发,业务拓展以及团队搭建等方...……更多
2B多模态新SOTA!华科、华南理工发布Mini-Monkey,专治「切分增大分辨率」后遗症
【新智元导读】Mini-Monkey 是一个轻量级的多模态大型语言模型,通过采用多尺度自适应切分策略(MSAC)和尺度压缩机制(SCM),有效缓解了传统图像切分策略带来的锯齿效应,提升了模型在高分辨率图像处理和文档理解任务的...……更多
...能沉浸式体验3D生成、音视频生成、智能编码等十余项多模态模型如何一步步化作生产力。“值得一提的是,由生数科技团队打造的首个国产纯自研视频大模型Vidu将进行公开展示。”刘湘雯介绍,大会也邀请到十余家多模态模型...……更多
...据交易所(以下简称“深数所”)发布了500个垂直行业多模态算料集,按照大模型应用的不同阶段(训练、推理、调优),有的放矢地提供数据源,让国产大模型厂商“寻数有路”。此次深数所发布的首批500个人工智能大模型高...……更多
最前线|让用户跟虚拟人交朋友,Soul上线AI应用“异世界回响”
...用户可自行创建、融合出属于该角色的专属声音,实现多模态互动。以及,用户也可以在这款新应用上创建自己的数字分身,即虚拟的自己。通过用户的授权,该应用可以获取用户在平台产生的所有公域内容,包括用户发布的内...……更多
...板苏州科达:公司的KD-GPT大模型相对于谷歌Gemini的通用多模态大模型在服务对象上存在明显区别 【五连板苏州科达:公司的KD-GPT大模型相对于谷歌Gemini的通用多模态大模型在服务对象上存在明显区别】财联社12月13日电,苏州科...……更多
北大等发布多模态版o1!首个慢思考VLM将开源,视觉推理超闭源
北大等出品,首个多模态版o1开源模型来了——代号LLaVA-o1,基于Llama-3.2-Vision模型打造,超越传统思维链提示,实现自主“慢思考”推理。在多模态推理基准测试中,LLaVA-o1超越其基础模型8.9%,并在性能上超越了一众开闭源模型...……更多
科学家开发多模态音乐理解和生成大模型,兼具理解和创作音乐能力
...音乐理解和生成结合在一起的想法比较新颖,论文也是多模态大模型领域的先期工作之一。并且,除了大模型本身,我们提出的针对模型训练的数据集制作流程和整理的数据集,对学术界也具有较大价值。”腾讯 ARC Lab 刘山松研...……更多
以假乱真,天工音乐大模型带来颠覆式AI体验
...、拓宽「天工SkyMusic」的能力边界,让模型具备更强的多模态情感理解与表达能力,为用户带来更优质的AI音乐体验。最后,我们将很快给出「天工SkyMusic」音乐创作Prompt指南,并提供更多的AI音乐Demo与使用技巧,与用户一同探索...……更多
国际首个,我国团队开发糖尿病诊疗多模态大模型 DeepDR-LLM
...构建了全球首个面向糖尿病诊疗的视觉-大语言模型的多模态集成智能系统 DeepDR-LLM,成果于 2024 年 7 月 19 日在 Nature Medicine 发表(题为 Integrated image-based deep learning and language models for primary diabetes care)……更多
arxiv研究人员:多模态ai模型存在安全隐患
...论文指出,包括GPT-4V、GPT-4o和Gemini1.5在内的大部分主流多模态AI模型,处理用户的多模态输入(例如一起输入图片和文本内容)之后,输出结果并不安全。这项研究标题为《跨模态安全调整》(Cross-ModalitySafetyAlignment),提出了...……更多
零成本突破多模态大模型瓶颈!多所美国顶尖高校华人团队,联合推出自增强技术CSR
新智元报道编辑:LRST【新智元导读】现有多模态大模型在对齐不同模态时面临幻觉和细粒度感知不足等问题,传统偏好学习方法依赖可能不适配的外源数据,存在成本和质量问题。Calibrated Self-Rewarding(CSR)框架通过自我增强学...……更多
多模态模型评测框架lmms-eval发布!全面覆盖,低成本,零污染
...qizhixin.com随着大模型研究的深入,如何将其推广到更多的模态上已经成为了学术界和产业界的热点。最近发布的闭源大模型如 GPT-4o、Claude 3.5 等都已经具备了超强的图像理解能力,LLaVA-NeXT、MiniCPM、InternVL 等开源领域模型也展现...……更多
...内瓦1月18日电 (记者 曾焱) 世界卫生组织18日发布的多模态大模型治理相关新指南说,人工智能在医疗卫生领域应用前景广阔,但同时也要防范其中可能出现的诸如“自动化偏见”导致的过度依赖等风险。作为一项快速发展的...……更多
MMMU华人团队更新Pro版!多模态基准升至史诗级难度:过滤纯文本问题、引入纯视觉问答
...候选选项、引入纯视觉输入设置)更严格地评估模型的多模态理解能力;模型在新基准上的性能下降明显,表明MMMU-Pro能有效避免模型依赖捷径和猜测策略的情况。多模态大型语言模型(MLLMs)在各个排行榜上展现的性能不断提...……更多
喜马拉雅音频大模型亮相,AI赋能内容创作者
...展示AI时代云上创新的潮流科技。喜马拉雅珠峰AI音频多模态大模型亮相云栖大会,在“人工智能+”主题馆吸引众多市民驻足围观体验。AI(人工智能)已经在深刻影响着我们的生活,也影响和改变着内容创作行业。作为在线音...……更多
新网银行“多模态深度神经网络风控模型体系”入选10项首批代表性创新产品榜单
...暨第一批人工智能应用场景发布大会上,新网银行的“多模态深度神经网络风控模型体系”入选“10项首批代表性创新产品”,彰显了新网银行在推动人工智能与金融深度融合方面的成果和贡献。活动现场。新网银行供图本次论...……更多
支付宝发布多模态医疗大模型:支持千亿级视觉识别
...快科技7月5日消息,在2024世界人工智能大会上,支付宝多模态医疗大模型正式亮相,成为国内首批多模态医疗大模型之一。据悉,该医疗大模型的基石,源自蚂蚁集团自主研发的蚂蚁百灵大模型,这一先进平台不仅拥有“视听言...……更多
蔚来 NOMI GPT 端云多模态大模型正式上线,并同步对搭载Banyan·榕智能系统的车型陆续开启推送。据悉,NOMI GPT是为NOMI打造的端云多模态大模型,基于自研的端云融合架构,拥有图像、音频、车身传感器等多模感知能力的NOMI可以...……更多
马斯克 xAI 展示首个多模态模型 Grok-1.5V
...下旬推出 Grok-1.5 大语言模型之后,近日再次推出首个多模态模型 Grok-1.5 Vision。xAI 表示将于近期邀请早期测试者和现有的 Grok 用户测试 Grok-1.5 Vision(Grok-1.5V),不仅能理解文本,还能处理文档、图表、截图和照片中的内容。xAI ...……更多
GPT-4V暴露致命缺陷?JHU等发布首个多模态ToM 测试集
...来自 JHU, NYU, MIT, Harvard 等机构的研究团队开创了第一个多模态的 ToM 测试基准,发现现有的多模态模型和 LLM 都表现存在系统性缺陷,同时他们提出了一种有效的新方法。在刚结束的 ACL 2024 会议中,这篇论文获得杰出论文奖。论...……更多
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
...实现AGI(通用人工智能)的重要里程碑。券商建议关注多模态技术Sora视频一出,立刻震惊业界。360集团创始人、董事长周鸿祎2月16日在微博发文表示,这意味着AGI实现将从10年缩短到1年。其实,Sora出现之前,也有其他类似的AI...……更多
终于拿到内测!豆包-PixelDance真是字节视频生成大杀器
...个面向不同细分领域(视频生成、音乐和同声传译)的多模态大模型,同时给之前已有的通用语言模型、文生图模型、语音模型来了一波大升级。这些模型共同构建起了火山引擎的「豆包全模态大模型家族」。家族新秀:豆包视...……更多
苹果公司公布“mm1”多模态大模型
...omMultimodalLLMPre-training》的论文,其中介绍了一款“MM1”多模态大模型,该模型提供30亿、70亿、300亿三种参数规模,拥有图像识别和自然语言推理能力。IT之家注意到,苹果研究团队相关论文主要是利用MM1模型做实验,通过控制各...……更多
AWS搭载“最强大模型”!40亿美元投向OpenAI竞对
...Anthropic合作的最新进展,并现场演示了Claude 3大模型的多模态、长文本、语境理解等能力。AWS近日宣布向Anthropic追加投资27.5亿美元,截至目前已经向这家OpenAI强力竞对累计注资40亿美元。此外,双方的合作关系也再次加深,Amazon ...……更多
毫末智行与火山引擎联手,建设自动驾驶智算中心MANA OASIS|最前线
...中,视觉自监督大模型,可以实现4D Clip的自动标注;多模态互监督大模型,则可以完成通用障碍物的识别;3D重建大模型助力毫末做数据生成,用更低成本解决数据分布问题,提升感知效果;动态环境大模型则进一步使用重感知...……更多
多模态模型概念股集体高开 苏州科达、网达软件双双竞价涨停 【多模态模型概念股集体高开 苏州科达、网达软件双双竞价涨停】财联社12月8日电,苏州科达、网达软件双双竞价涨停,当虹科技涨超10%,博汇科技、声迅股份涨...……更多
vivo蓝心大模型升级为“自研ai多模态大模型”
...432%。同时黄韬宣布,vivo的蓝心大模型升级为“自研AI多模态大模型”,这项技术通过视觉、声音、空间等多维度感知和理解世界,使大模型变得更加全面、智能和强大。蓝心大模型的使命是确保科技革命的成果能够平等地惠及...……更多
更多关于科技的资讯:
本文转自:人民网据高通公司最新消息,在2025世界移动通信大会(MWC)期间,该公司发布多项突破性技术创新成果,涵盖5G连接
2025-03-05 18:59:00
38节必备!德芙玫瑰恋语巧克力礼盒24 粒19.9元(送礼袋)
38节快到了,天猫【玛氏食品官方旗舰店】德芙玫瑰恋语巧克力礼盒 24 粒日常售价29.9元,淘宝百亿补贴价19.9 元
2025-03-05 19:12:00
铭凡NAB9 PLUS迷你机上市:i9-12900HK芯片 配USB4接口
快科技3月5日消息,铭凡NAB9 PLUS迷你机目前已经上市,首发2299元。NAB9 Plus作为NAB9的升级款,属于铭凡的Elite Mini系列
2025-03-05 19:12:00
韩国迎来双胞胎时代:多胎儿生育率高于世界平均水平
3月5日消息,据媒体报道,统计数据显示,韩国双胞胎变多了,1990年双胞胎等多胎比率仅为1%左右;2023年的23万名新生儿中
2025-03-05 19:12:00
詹姆斯达成NBA五万分职业纪录 赛后打趣:确实不少
在今日举行的NBA湖人主场迎战鹈鹕的赛事中,知名球星勒布朗·詹姆斯在第一节剩余8分35秒左右侧翼接球打进三分。而通过这粒进球
2025-03-05 19:12:00
小米晒手机智能工厂:单线产能600台/小时 是代工厂两倍
快科技3月5日消息,小米15 Ultra刚刚发布,这台小米15系列的最高端旗舰产自于小米手机智能工厂。这座工厂内配备了小米自主研发的“小米澎湃智能制造平台”
2025-03-05 19:12:00
高德地图红绿灯AI领航功能再增6城 有你那么
快科技3月5日消息,高德地图宣布,继红绿灯AI领航13城上线后,近期又新增6座城市。它们分别是:南京、无锡、合肥、长春
2025-03-05 19:12:00
大差价!温碧泉烟酰胺洁面乳2支29.9元发车(好价必入)
温碧泉烟酰胺洁面乳 100g*2 支标价 200.9 元,立减 30 元 + 领取 141 元券,到手价 29.9 元 2 支
2025-03-05 19:12:00
45岁汤唯再传喜讯:获卓越亚洲电影人大奖!
快科技3月5日消息,今天,45岁的汤唯又获得了一国际殊荣,她获得了第18届亚洲电影大奖卓越亚洲电影人大奖。汤唯曾在六年内五度入围最佳女主角
2025-03-05 19:12:00
吉利正式“反击”比亚迪
当“智驾平权”成为车企军备竞赛的必选项,吉利选择用集团作战的方式应战。3 月 3 日,吉利宣布将全品牌线智驾方案统一为“千里浩瀚”系统
2025-03-05 19:12:00
封锁拦不住!韩国屏蔽DeepSeek:每天还有数百人下载
快科技3月5日消息,据韩国数据服务提供商“IGAWorks Mobile Index”发布的数据显示,尽管韩国境内用户无法通过谷歌应用商店等官方渠道下载DeepSeek
2025-03-05 19:12:00
4499元原价真有!AMD RX 9070系列限时福利:单卡返100元、整机返200元
快科技3月5日消息,AMD RX 9070系列显卡今晚性能解禁,明天正式开卖,各家品牌的新卡、新整机已经陆续上架预售,还提供限时福利
2025-03-05 19:12:00
等深四曲屏成了最短命的旗舰设计:厂商将集体转向直屏
快科技3月5日消息,博主数码闲聊站表示,等深四曲屏应该是最短命的旗舰设计了,行业风向已经迅速转向直屏,等深方案正在加速下放中低端机
2025-03-05 19:42:00
咖啡馆靠“咖啡里有真蛇”出圈 有网友实测:真有蛇 谁敢喝
快科技3月5日消息,近日,杭州某咖啡馆靠其“蛇咖”创意,走红了网络。有网友反映,这家咖啡馆之所以能走红,主要是推出了“白素贞”和“竹叶青”产品
2025-03-05 19:42:00
La Marzocco线下咖啡体验会闪现京东 自营旗舰店开业在即
早起一杯咖啡唤醒沉睡的灵魂,开启元气满满的一天,已成为许多人的生活方式。在家制作咖啡不仅是一种新潮流,更是人们对于品质生活的向往与追求
2025-03-05 19:46:00