• 我的订阅
  • 头条热搜
...能沉浸式体验3D生成、音视频生成、智能编码等十余项多模态模型如何一步步化作生产力。“值得一提的是,由生数科技团队打造的首个国产纯自研视频大模型Vidu将进行公开展示。”刘湘雯介绍,大会也邀请到十余家多模态模型...……更多
...板苏州科达:公司的KD-GPT大模型相对于谷歌Gemini的通用多模态大模型在服务对象上存在明显区别 【五连板苏州科达:公司的KD-GPT大模型相对于谷歌Gemini的通用多模态大模型在服务对象上存在明显区别】财联社12月13日电,苏州科...……更多
北大等发布多模态版o1!首个慢思考VLM将开源,视觉推理超闭源
北大等出品,首个多模态版o1开源模型来了——代号LLaVA-o1,基于Llama-3.2-Vision模型打造,超越传统思维链提示,实现自主“慢思考”推理。在多模态推理基准测试中,LLaVA-o1超越其基础模型8.9%,并在性能上超越了一众开闭源模型...……更多
科学家开发多模态音乐理解和生成大模型,兼具理解和创作音乐能力
...音乐理解和生成结合在一起的想法比较新颖,论文也是多模态大模型领域的先期工作之一。并且,除了大模型本身,我们提出的针对模型训练的数据集制作流程和整理的数据集,对学术界也具有较大价值。”腾讯 ARC Lab 刘山松研...……更多
最前线|让用户跟虚拟人交朋友,Soul上线AI应用“异世界回响”
...用户可自行创建、融合出属于该角色的专属声音,实现多模态互动。以及,用户也可以在这款新应用上创建自己的数字分身,即虚拟的自己。通过用户的授权,该应用可以获取用户在平台产生的所有公域内容,包括用户发布的内...……更多
国际首个,我国团队开发糖尿病诊疗多模态大模型 DeepDR-LLM
...构建了全球首个面向糖尿病诊疗的视觉-大语言模型的多模态集成智能系统 DeepDR-LLM,成果于 2024 年 7 月 19 日在 Nature Medicine 发表(题为 Integrated image-based deep learning and language models for primary diabetes care)……更多
以假乱真,天工音乐大模型带来颠覆式AI体验
...、拓宽「天工SkyMusic」的能力边界,让模型具备更强的多模态情感理解与表达能力,为用户带来更优质的AI音乐体验。最后,我们将很快给出「天工SkyMusic」音乐创作Prompt指南,并提供更多的AI音乐Demo与使用技巧,与用户一同探索...……更多
arxiv研究人员:多模态ai模型存在安全隐患
...论文指出,包括GPT-4V、GPT-4o和Gemini1.5在内的大部分主流多模态AI模型,处理用户的多模态输入(例如一起输入图片和文本内容)之后,输出结果并不安全。这项研究标题为《跨模态安全调整》(Cross-ModalitySafetyAlignment),提出了...……更多
零成本突破多模态大模型瓶颈!多所美国顶尖高校华人团队,联合推出自增强技术CSR
新智元报道编辑:LRST【新智元导读】现有多模态大模型在对齐不同模态时面临幻觉和细粒度感知不足等问题,传统偏好学习方法依赖可能不适配的外源数据,存在成本和质量问题。Calibrated Self-Rewarding(CSR)框架通过自我增强学...……更多
多模态模型评测框架lmms-eval发布!全面覆盖,低成本,零污染
...qizhixin.com随着大模型研究的深入,如何将其推广到更多的模态上已经成为了学术界和产业界的热点。最近发布的闭源大模型如 GPT-4o、Claude 3.5 等都已经具备了超强的图像理解能力,LLaVA-NeXT、MiniCPM、InternVL 等开源领域模型也展现...……更多
...内瓦1月18日电 (记者 曾焱) 世界卫生组织18日发布的多模态大模型治理相关新指南说,人工智能在医疗卫生领域应用前景广阔,但同时也要防范其中可能出现的诸如“自动化偏见”导致的过度依赖等风险。作为一项快速发展的...……更多
MMMU华人团队更新Pro版!多模态基准升至史诗级难度:过滤纯文本问题、引入纯视觉问答
...候选选项、引入纯视觉输入设置)更严格地评估模型的多模态理解能力;模型在新基准上的性能下降明显,表明MMMU-Pro能有效避免模型依赖捷径和猜测策略的情况。多模态大型语言模型(MLLMs)在各个排行榜上展现的性能不断提...……更多
喜马拉雅音频大模型亮相,AI赋能内容创作者
...展示AI时代云上创新的潮流科技。喜马拉雅珠峰AI音频多模态大模型亮相云栖大会,在“人工智能+”主题馆吸引众多市民驻足围观体验。AI(人工智能)已经在深刻影响着我们的生活,也影响和改变着内容创作行业。作为在线音...……更多
新网银行“多模态深度神经网络风控模型体系”入选10项首批代表性创新产品榜单
...暨第一批人工智能应用场景发布大会上,新网银行的“多模态深度神经网络风控模型体系”入选“10项首批代表性创新产品”,彰显了新网银行在推动人工智能与金融深度融合方面的成果和贡献。活动现场。新网银行供图本次论...……更多
支付宝发布多模态医疗大模型:支持千亿级视觉识别
...快科技7月5日消息,在2024世界人工智能大会上,支付宝多模态医疗大模型正式亮相,成为国内首批多模态医疗大模型之一。据悉,该医疗大模型的基石,源自蚂蚁集团自主研发的蚂蚁百灵大模型,这一先进平台不仅拥有“视听言...……更多
蔚来 NOMI GPT 端云多模态大模型正式上线,并同步对搭载Banyan·榕智能系统的车型陆续开启推送。据悉,NOMI GPT是为NOMI打造的端云多模态大模型,基于自研的端云融合架构,拥有图像、音频、车身传感器等多模感知能力的NOMI可以...……更多
马斯克 xAI 展示首个多模态模型 Grok-1.5V
...下旬推出 Grok-1.5 大语言模型之后,近日再次推出首个多模态模型 Grok-1.5 Vision。xAI 表示将于近期邀请早期测试者和现有的 Grok 用户测试 Grok-1.5 Vision(Grok-1.5V),不仅能理解文本,还能处理文档、图表、截图和照片中的内容。xAI ...……更多
GPT-4V暴露致命缺陷?JHU等发布首个多模态ToM 测试集
...来自 JHU, NYU, MIT, Harvard 等机构的研究团队开创了第一个多模态的 ToM 测试基准,发现现有的多模态模型和 LLM 都表现存在系统性缺陷,同时他们提出了一种有效的新方法。在刚结束的 ACL 2024 会议中,这篇论文获得杰出论文奖。论...……更多
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
...实现AGI(通用人工智能)的重要里程碑。券商建议关注多模态技术Sora视频一出,立刻震惊业界。360集团创始人、董事长周鸿祎2月16日在微博发文表示,这意味着AGI实现将从10年缩短到1年。其实,Sora出现之前,也有其他类似的AI...……更多
苹果公司公布“mm1”多模态大模型
...omMultimodalLLMPre-training》的论文,其中介绍了一款“MM1”多模态大模型,该模型提供30亿、70亿、300亿三种参数规模,拥有图像识别和自然语言推理能力。IT之家注意到,苹果研究团队相关论文主要是利用MM1模型做实验,通过控制各...……更多
终于拿到内测!豆包-PixelDance真是字节视频生成大杀器
...个面向不同细分领域(视频生成、音乐和同声传译)的多模态大模型,同时给之前已有的通用语言模型、文生图模型、语音模型来了一波大升级。这些模型共同构建起了火山引擎的「豆包全模态大模型家族」。家族新秀:豆包视...……更多
AWS搭载“最强大模型”!40亿美元投向OpenAI竞对
...Anthropic合作的最新进展,并现场演示了Claude 3大模型的多模态、长文本、语境理解等能力。AWS近日宣布向Anthropic追加投资27.5亿美元,截至目前已经向这家OpenAI强力竞对累计注资40亿美元。此外,双方的合作关系也再次加深,Amazon ...……更多
多模态模型概念股集体高开 苏州科达、网达软件双双竞价涨停 【多模态模型概念股集体高开 苏州科达、网达软件双双竞价涨停】财联社12月8日电,苏州科达、网达软件双双竞价涨停,当虹科技涨超10%,博汇科技、声迅股份涨...……更多
毫末智行与火山引擎联手,建设自动驾驶智算中心MANA OASIS|最前线
...中,视觉自监督大模型,可以实现4D Clip的自动标注;多模态互监督大模型,则可以完成通用障碍物的识别;3D重建大模型助力毫末做数据生成,用更低成本解决数据分布问题,提升感知效果;动态环境大模型则进一步使用重感知...……更多
vivo蓝心大模型升级为“自研ai多模态大模型”
...432%。同时黄韬宣布,vivo的蓝心大模型升级为“自研AI多模态大模型”,这项技术通过视觉、声音、空间等多维度感知和理解世界,使大模型变得更加全面、智能和强大。蓝心大模型的使命是确保科技革命的成果能够平等地惠及...……更多
...学院香港创新院AI中心”),日前在香港发布医疗领域AI多模态大模型CARES Copilot1.0。据介绍,CARES Copilot系统由中国科学院香港创新院AI中心研发,是一款专为医疗领域设计的大型模型系统。该系统实现了图像、文本、语音、视频等...……更多
多模态模型、短剧游戏盘中逆市走强,文娱传媒ETF涨0.11%
2月20日,三大股指低开,多模态模型、短剧游戏盘中逆市走强,截至10:23,文娱传媒ETF(516190)翻红涨0.11%,持仓股中文在线、国脉文化、新华网纷纷涨停。消息面上,春节假期期间,OpenAI发布首个AI视频模型Sora,可生成长达60...……更多
国产模型指令跟随全球第一!来自LeCun亲推的最难作弊LLM新榜单
...在阶跃星辰开放平台通过API接入使用Step-2。语言模型和多模态模型全都要开篇咱们提到,Step模型是一个系列,而Step-2是其语言模型的实力代表。在这个系列中,除了语言模型,阶跃星辰的多模态模型也很有看头。Step-1.5V是阶跃...……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
...进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准,并设计了一种新颖的数据合成方法。无论是语言模型还是视觉模型,似乎都很难完成更抽象层次上的理解和推理任务。语言模型已经可以写诗写小说...……更多
本文转自:人民日报客户端曹玲娟国内首个千亿参数多模态金融大模型——“财跃F1金融大模型”3月23日在2024全球开发者先锋大会(GDC)上首发。该大模型由财跃星辰自研推出,上海报业集团旗下界面财联社与通用大模型公司...……更多
更多关于科技的资讯:
看大片更爽了 全国首家全高帧LED影院大年初一开幕:支持120帧放映
快科技1月26日消息,全国首家全高帧LED影院——华夏电影中心将于大年初一开幕,该影院位于北京市朝阳区北辰荟商业中心。据媒体报道
2025-01-26 07:35:00
《蛋仔派对》崩了 官方深夜致歉:各项异常均已修复
快科技1月26日消息,1月25日晚间,网易游戏《蛋仔派对》服务器疑似崩溃,玩家表示,好友被清空,啥都玩不了,啥都不能干
2025-01-26 07:35:00
纯血鸿蒙领衔!2024机圈热门技术总结
2024年,智能手机行业各条赛道多点开花,不仅硬件革新层出不穷,软件方面也因AI发展而不断提升。正值春节,今天我们就来盘点2024的五个重点技术
2025-01-26 07:35:00
极氪法务部:此前已辟谣“对撞”有关谣言 将追究造谣者法律责任
快科技1月26日消息,极氪法务部昨晚发布声明:“极氪已在2024年8月16日对有关谣言进行过辟谣,并表达了严正立场。今天注意到一些账号就此事情再度对极氪品牌进行无端的引导
2025-01-26 07:35:00
腾讯:《三角洲行动》2024年开挂封禁10年账号88万个
快科技1月26日消息,腾讯在2024年上线了重磅自研游戏《三角洲行动》,由天美J3工作室琳琅天上团队自主研发,是腾讯首款跨端战术射击游戏
2025-01-26 08:05:00
快科技1月26日消息,据媒体报道,近日,河南矿山集团举办了年会,会上公布该公司2024年产值高达103亿元,实现利润2
2025-01-26 08:35:00
女子买短乘长高铁霸座被行拘5天:网友齐声叫好
快科技1月26日消息,火车霸座不是新鲜事,总有人为了一己私利破坏规则和法律,那自然需要承担相应的后果。据央视网报道,近日
2025-01-26 08:35:00
能上网但不能洗澡:德国男子水下生活120天破纪录
快科技1月26日消息,近日,德国一名航空工程师因在巴拿马海岸附近的水下胶囊里生活了120天,打破了“水下生活时间最长”的吉尼斯世界纪录
2025-01-26 09:05:00
女子赛道内骑摩托逆行被撞:丝毫不认为自己有错
快科技1月26日消息,赛道里公然逆行,那可真是厕所里打灯笼——找死。1月25日,广东东莞麻涌赛车场发生一起女骑手逆行被撞的事故
2025-01-26 09:05:00
中小企观察 |“鲸算盘”携AI破局 为传统财务带来了怎样的变革?
大众网记者 高瑞嵩 青岛报道随着2024年人工智能(AI)迅速崛起,对其应用和前景的讨论就一直不绝于耳。特别是伴随一系列应用相继落地
2025-01-26 09:29:00
余承东开享界S9自驾回安徽老家过年:路上直播聊聊天
快科技1月26日消息,今天上午,余承东发文表示,今年过年开享界S9自驾回安徽老家,接两位朋友史小诺和说车的小宇在路上聊聊天
2025-01-26 09:35:00
向佐体验小鹏智驾频竖大拇指:很像赛车手开车 很厉害
快科技1月26日消息,近日向佐在广州喜提爱车小鹏X9,何小鹏带他体验了小鹏X9的最新车位到车位智驾能力,全程AI智驾护航稳如老司机
2025-01-26 09:35:00
611.767米!中联智慧产业城最长清水混凝土幕墙获吉尼斯认证
本文转自:人民网-湖南频道中联智慧产业成。受访单位供图“经专业测量公司测量,清水混凝土幕墙的连续长度达到611.767米
2025-01-26 10:24:00
一公司年会给员工送车 小伙领小米SU7激动到脚抽筋
快科技1月26日消息,据媒体报道,近日,深圳某科技公司在年会中慷慨地送出了多台新能源汽车,作为对员工辛勤付出的回馈,引起了广泛关注
2025-01-26 10:35:00
华为首款开放式耳机 曝FreeClip新配色玫瑰金2月开售
快科技1月26日消息,2024年12月,华为海外官网新增华为FreeClip“玫瑰金”配色,许多网友关心新配色何时发售
2025-01-26 10:35:00