• 我的订阅
  • 头条热搜
北大等发布多模态版o1!首个慢思考VLM将开源,视觉推理超闭源
北大等出品,首个多模态版o1开源模型来了——代号LLaVA-o1,基于Llama-3.2-Vision模型打造,超越传统思维链提示,实现自主“慢思考”推理。在多模态推理基准测试中,LLaVA-o1超越其基础模型8.9%,并在性能上超越了一众开闭源模型...……更多
最前线|让用户跟虚拟人交朋友,Soul上线AI应用“异世界回响”
...用户可自行创建、融合出属于该角色的专属声音,实现多模态互动。以及,用户也可以在这款新应用上创建自己的数字分身,即虚拟的自己。通过用户的授权,该应用可以获取用户在平台产生的所有公域内容,包括用户发布的内...……更多
科学家开发多模态音乐理解和生成大模型,兼具理解和创作音乐能力
...音乐理解和生成结合在一起的想法比较新颖,论文也是多模态大模型领域的先期工作之一。并且,除了大模型本身,我们提出的针对模型训练的数据集制作流程和整理的数据集,对学术界也具有较大价值。”腾讯 ARC Lab 刘山松研...……更多
以假乱真,天工音乐大模型带来颠覆式AI体验
...、拓宽「天工SkyMusic」的能力边界,让模型具备更强的多模态情感理解与表达能力,为用户带来更优质的AI音乐体验。最后,我们将很快给出「天工SkyMusic」音乐创作Prompt指南,并提供更多的AI音乐Demo与使用技巧,与用户一同探索...……更多
国际首个,我国团队开发糖尿病诊疗多模态大模型 DeepDR-LLM
...构建了全球首个面向糖尿病诊疗的视觉-大语言模型的多模态集成智能系统 DeepDR-LLM,成果于 2024 年 7 月 19 日在 Nature Medicine 发表(题为 Integrated image-based deep learning and language models for primary diabetes care)……更多
arxiv研究人员:多模态ai模型存在安全隐患
...论文指出,包括GPT-4V、GPT-4o和Gemini1.5在内的大部分主流多模态AI模型,处理用户的多模态输入(例如一起输入图片和文本内容)之后,输出结果并不安全。这项研究标题为《跨模态安全调整》(Cross-ModalitySafetyAlignment),提出了...……更多
零成本突破多模态大模型瓶颈!多所美国顶尖高校华人团队,联合推出自增强技术CSR
新智元报道编辑:LRST【新智元导读】现有多模态大模型在对齐不同模态时面临幻觉和细粒度感知不足等问题,传统偏好学习方法依赖可能不适配的外源数据,存在成本和质量问题。Calibrated Self-Rewarding(CSR)框架通过自我增强学...……更多
多模态模型评测框架lmms-eval发布!全面覆盖,低成本,零污染
...qizhixin.com随着大模型研究的深入,如何将其推广到更多的模态上已经成为了学术界和产业界的热点。最近发布的闭源大模型如 GPT-4o、Claude 3.5 等都已经具备了超强的图像理解能力,LLaVA-NeXT、MiniCPM、InternVL 等开源领域模型也展现...……更多
...内瓦1月18日电 (记者 曾焱) 世界卫生组织18日发布的多模态大模型治理相关新指南说,人工智能在医疗卫生领域应用前景广阔,但同时也要防范其中可能出现的诸如“自动化偏见”导致的过度依赖等风险。作为一项快速发展的...……更多
MMMU华人团队更新Pro版!多模态基准升至史诗级难度:过滤纯文本问题、引入纯视觉问答
...候选选项、引入纯视觉输入设置)更严格地评估模型的多模态理解能力;模型在新基准上的性能下降明显,表明MMMU-Pro能有效避免模型依赖捷径和猜测策略的情况。多模态大型语言模型(MLLMs)在各个排行榜上展现的性能不断提...……更多
喜马拉雅音频大模型亮相,AI赋能内容创作者
...展示AI时代云上创新的潮流科技。喜马拉雅珠峰AI音频多模态大模型亮相云栖大会,在“人工智能+”主题馆吸引众多市民驻足围观体验。AI(人工智能)已经在深刻影响着我们的生活,也影响和改变着内容创作行业。作为在线音...……更多
新网银行“多模态深度神经网络风控模型体系”入选10项首批代表性创新产品榜单
...暨第一批人工智能应用场景发布大会上,新网银行的“多模态深度神经网络风控模型体系”入选“10项首批代表性创新产品”,彰显了新网银行在推动人工智能与金融深度融合方面的成果和贡献。活动现场。新网银行供图本次论...……更多
支付宝发布多模态医疗大模型:支持千亿级视觉识别
...快科技7月5日消息,在2024世界人工智能大会上,支付宝多模态医疗大模型正式亮相,成为国内首批多模态医疗大模型之一。据悉,该医疗大模型的基石,源自蚂蚁集团自主研发的蚂蚁百灵大模型,这一先进平台不仅拥有“视听言...……更多
蔚来 NOMI GPT 端云多模态大模型正式上线,并同步对搭载Banyan·榕智能系统的车型陆续开启推送。据悉,NOMI GPT是为NOMI打造的端云多模态大模型,基于自研的端云融合架构,拥有图像、音频、车身传感器等多模感知能力的NOMI可以...……更多
马斯克 xAI 展示首个多模态模型 Grok-1.5V
...下旬推出 Grok-1.5 大语言模型之后,近日再次推出首个多模态模型 Grok-1.5 Vision。xAI 表示将于近期邀请早期测试者和现有的 Grok 用户测试 Grok-1.5 Vision(Grok-1.5V),不仅能理解文本,还能处理文档、图表、截图和照片中的内容。xAI ...……更多
GPT-4V暴露致命缺陷?JHU等发布首个多模态ToM 测试集
...来自 JHU, NYU, MIT, Harvard 等机构的研究团队开创了第一个多模态的 ToM 测试基准,发现现有的多模态模型和 LLM 都表现存在系统性缺陷,同时他们提出了一种有效的新方法。在刚结束的 ACL 2024 会议中,这篇论文获得杰出论文奖。论...……更多
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
...实现AGI(通用人工智能)的重要里程碑。券商建议关注多模态技术Sora视频一出,立刻震惊业界。360集团创始人、董事长周鸿祎2月16日在微博发文表示,这意味着AGI实现将从10年缩短到1年。其实,Sora出现之前,也有其他类似的AI...……更多
终于拿到内测!豆包-PixelDance真是字节视频生成大杀器
...个面向不同细分领域(视频生成、音乐和同声传译)的多模态大模型,同时给之前已有的通用语言模型、文生图模型、语音模型来了一波大升级。这些模型共同构建起了火山引擎的「豆包全模态大模型家族」。家族新秀:豆包视...……更多
苹果公司公布“mm1”多模态大模型
...omMultimodalLLMPre-training》的论文,其中介绍了一款“MM1”多模态大模型,该模型提供30亿、70亿、300亿三种参数规模,拥有图像识别和自然语言推理能力。IT之家注意到,苹果研究团队相关论文主要是利用MM1模型做实验,通过控制各...……更多
AWS搭载“最强大模型”!40亿美元投向OpenAI竞对
...Anthropic合作的最新进展,并现场演示了Claude 3大模型的多模态、长文本、语境理解等能力。AWS近日宣布向Anthropic追加投资27.5亿美元,截至目前已经向这家OpenAI强力竞对累计注资40亿美元。此外,双方的合作关系也再次加深,Amazon ...……更多
多模态模型概念股集体高开 苏州科达、网达软件双双竞价涨停 【多模态模型概念股集体高开 苏州科达、网达软件双双竞价涨停】财联社12月8日电,苏州科达、网达软件双双竞价涨停,当虹科技涨超10%,博汇科技、声迅股份涨...……更多
毫末智行与火山引擎联手,建设自动驾驶智算中心MANA OASIS|最前线
...中,视觉自监督大模型,可以实现4D Clip的自动标注;多模态互监督大模型,则可以完成通用障碍物的识别;3D重建大模型助力毫末做数据生成,用更低成本解决数据分布问题,提升感知效果;动态环境大模型则进一步使用重感知...……更多
vivo蓝心大模型升级为“自研ai多模态大模型”
...432%。同时黄韬宣布,vivo的蓝心大模型升级为“自研AI多模态大模型”,这项技术通过视觉、声音、空间等多维度感知和理解世界,使大模型变得更加全面、智能和强大。蓝心大模型的使命是确保科技革命的成果能够平等地惠及...……更多
...学院香港创新院AI中心”),日前在香港发布医疗领域AI多模态大模型CARES Copilot1.0。据介绍,CARES Copilot系统由中国科学院香港创新院AI中心研发,是一款专为医疗领域设计的大型模型系统。该系统实现了图像、文本、语音、视频等...……更多
多模态模型、短剧游戏盘中逆市走强,文娱传媒ETF涨0.11%
2月20日,三大股指低开,多模态模型、短剧游戏盘中逆市走强,截至10:23,文娱传媒ETF(516190)翻红涨0.11%,持仓股中文在线、国脉文化、新华网纷纷涨停。消息面上,春节假期期间,OpenAI发布首个AI视频模型Sora,可生成长达60...……更多
国产模型指令跟随全球第一!来自LeCun亲推的最难作弊LLM新榜单
...在阶跃星辰开放平台通过API接入使用Step-2。语言模型和多模态模型全都要开篇咱们提到,Step模型是一个系列,而Step-2是其语言模型的实力代表。在这个系列中,除了语言模型,阶跃星辰的多模态模型也很有看头。Step-1.5V是阶跃...……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
...进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准,并设计了一种新颖的数据合成方法。无论是语言模型还是视觉模型,似乎都很难完成更抽象层次上的理解和推理任务。语言模型已经可以写诗写小说...……更多
本文转自:人民日报客户端曹玲娟国内首个千亿参数多模态金融大模型——“财跃F1金融大模型”3月23日在2024全球开发者先锋大会(GDC)上首发。该大模型由财跃星辰自研推出,上海报业集团旗下界面财联社与通用大模型公司...……更多
本文转自:文汇报 本报讯 国内首个千亿参数多模态金融大模型——“财跃F1金融大模型”于昨天在2024全球开发者先锋大会上正式发布。这款由上海财跃星辰智能科技有限公司研发的金融大模型,基于万亿级金融语料预训...……更多
...参数的4款大语言模型,以及视觉理解、音频理解两款多模态大模型,实现“全尺寸、全模态”开源。用户可在魔搭社区直接体验Qwen系列模型效果,也可通过阿里云灵积平台调用模型API,或基于阿里云百炼平台定制大模型应用。...……更多
更多关于科技的资讯:
持续加速行业绿色发展,SHEIN仓储物流园再增4家“零废工厂”认证
SHEIN在仓储物流环节的绿色减碳行动持续获得权威机构的认证。日前,国际独立第三方检测、检验和认证机构德国莱茵TÜV大中华区(以下简称“TÜV莱茵”)
2024-12-23 13:41:00
消费者又喝出异物,瑞幸慢下来但惯性大
图源:瑞幸官博文|李振兴日前,安徽合肥陈先生在网上称,在购买的瑞幸咖啡里喝出了昆虫(疑似蟑螂)异物。经过陈先生的投诉,瑞幸客服方面给出的处理结果是
2024-12-23 13:46:00
英诺赛科上市前再获2000万美元知名公司入股,投资者信心强劲
《港湾商业观察》王璐12月19日,矽力杰股份有限公司(SilergyCorp.)(以下简称,矽力杰)发布公告,拟以2000万美元投资英诺赛科
2024-12-23 13:47:00
\
共计163项优秀实践作品斩获雇主品牌创意大奖殊荣由领先的雇主品牌研究机构——雇主品牌研究所主办的"2024雇主品牌创意大赛"圆满落幕
2024-12-23 13:51:00
就在今天!日产和本田据传将开启合并谈判 或是近四年业内最大整合
上周,日本第二大汽车制造商本田和第三大汽车制造商日产可能合并的消息震惊了全球汽车行业。据两名知情人士透露,预计本田和日产将于本周一宣布开始业务整合谈判
2024-12-23 14:03:00
京东公布2024年终奖发放计划:迈向20薪!
快科技12月23日消息,据媒体报道,京东集团发布了2024年年终奖发放计划通知,O序列员工将于1月26日(腊月二十七)收到年终奖
2024-12-23 14:03:00
日媒感慨中国电动汽车/智驾遥遥领先:本田、日产、三菱合并也没戏
快科技12月23日消息,据国外媒体报道称,本田(Honda)和日产(Nissan)今天启动协商后,计划将于2025年6月敲定合并协议
2024-12-23 14:03:00
键德测试测量|低温探针台的主要特性
低温探针台是一种重要的实验仪器,可用来测试芯片、晶圆片和封装器件,应用领域包括半导体、MEMS、超导、铁电子学、材料科学等
2024-12-23 14:16:00
键德大功率探针台|探针台的发展趋势分析
探针台是一种广泛应用于科学研究、工业生产和教育实验中的重要设备。它在多个领域中发挥着至关重要的作用,如材料科学、电子学
2024-12-23 14:20:00
安踏发布ANTAZERO UPCYCLE 循环再造系列 行业首场可持续运动风尚大秀燃动上海武康路
上海2024年12月20日/美通社/ --2024年12月20日,安踏在上海武康路举办行业首场可持续运动风尚大秀,并发布全新ANTAZERO UPCYCLE 安踏循环再造系列产品
2024-12-23 14:21:00
上海银行助力“黑科技”解决丘陵植保难题
在广西百色芒果园里,苏州极目机器人研发的一架植保无人机正腾空而起,沿着设定的路线、高度,将雾状药剂均匀洒落,为果树披上了一层茁壮成长的“保护衣”
2024-12-23 14:21:00
喜悦之源,纯净之选:新悦纯牧JOYHANA举办\
在洋溢着欢庆与温馨氛围的岁末之际,新西兰品牌新悦纯牧JOYHANA精心打造"GO JOY!GO HANA"主题分享会,结合对中国烘焙食品行业现状与未来趋势的深刻剖析
2024-12-23 14:21:00
键德测试测量|国产全自动探针台与进口全自动探针台的区别
探针台从操作方式上来区分有:手动,半自动,全自动。其中全自动探针台是一种用于检测各种机械零件和测量工件的精密测量设备。它包括探针
2024-12-23 14:24:00
智橙动力总部启用 园区机器人产业添新军
12月20日,苏州工业园区科技领军人才企业智橙动力(苏州)科技有限公司在苏州阳澄湖半岛旅游度假区正式开业。据悉,智橙动力坚持“科技向善
2024-12-23 14:30:00
□娄欣叶近日,《中国微短剧行业发展白皮书(2024)》正式发布,今年中国微短剧市场规模预计将达到504.4亿元,同比增长高达34
2024-12-23 14:30:00