• 我的订阅
  • 头条热搜
全国首个 成都创新团队发布机器人多模态模型
中国首个机器人多模态模型,可以相对明确地将水果和非水果进行区分和分拣如果你想吃苹果,根据语音指令,机器人会把苹果送到你手上;如果想收拾干净桌面,机器人就会把桌上所有的东西归置好……这个关于人工智能描...……更多
最强国产多模态刚刚易主!腾讯混元把GPT-4/Claude-3.5都超了
国产大模型,多模态能力都开始超越GPT-4-Turbo了??权威榜单,中文多模态大模型测评基准SuperCLUE-V,新鲜出炉:特别是腾讯的hunyuan-vision、上海AI Lab的InternVL2-40B,分别成为国内闭源和开源界两大领跑者,甚至超过Claude-3.5-Sonnet..……更多
...板苏州科达:公司的KD-GPT大模型相对于谷歌Gemini的通用多模态大模型在服务对象上存在明显区别 【五连板苏州科达:公司的KD-GPT大模型相对于谷歌Gemini的通用多模态大模型在服务对象上存在明显区别】财联社12月13日电,苏州科...……更多
MMMU华人团队更新Pro版!多模态基准升至史诗级难度:过滤纯文本问题、引入纯视觉问答
...候选选项、引入纯视觉输入设置)更严格地评估模型的多模态理解能力;模型在新基准上的性能下降明显,表明MMMU-Pro能有效避免模型依赖捷径和猜测策略的情况。多模态大型语言模型(MLLMs)在各个排行榜上展现的性能不断提...……更多
meta开源多感官大模型,ai用6种模态体验虚拟世界
Meta最新 6模态大模型,让AI以更接近人类的方式理解这个世界。比如当你听见倒水声的时候就会想到杯子,听到闹铃声会想到闹钟,现在AI也可以。尽管画面中没有出现人类,AI听到掌声也能指出最有可能来自电脑。这个大模型 I...……更多
科学家开发多模态音乐理解和生成大模型,兼具理解和创作音乐能力
...音乐理解和生成结合在一起的想法比较新颖,论文也是多模态大模型领域的先期工作之一。并且,除了大模型本身,我们提出的针对模型训练的数据集制作流程和整理的数据集,对学术界也具有较大价值。”腾讯 ARC Lab 刘山松研...……更多
北大等发布多模态版o1!首个慢思考VLM将开源,视觉推理超闭源
北大等出品,首个多模态版o1开源模型来了——代号LLaVA-o1,基于Llama-3.2-Vision模型打造,超越传统思维链提示,实现自主“慢思考”推理。在多模态推理基准测试中,LLaVA-o1超越其基础模型8.9%,并在性能上超越了一众开闭源模型...……更多
润建股份:公司曲尺平台开发的AI行业模型支持多模态 【润建股份:公司曲尺平台开发的AI行业模型支持多模态】财联社12月20日电,润建股份在互动平台表示,公司曲尺平台开发的AI行业模型支持多模态,多模态底座具备文生图...……更多
理想汽车多模态认知大模型Mind GPT正式上线 【理想汽车多模态认知大模型Mind GPT正式上线】财联社3月28日电,理想汽车今日宣布,全自研多模态认知大模型Mind GPT已正式上线,成为首个通过备案的汽车厂商自研大模型。(财联社...……更多
阿里多模态检索智能体,自带o1式思考过程!复杂问题逐步拆解
多模态检索增强生成(mRAG)也有o1思考推理那味儿了!阿里通义实验室新研究推出自适应规划的多模态检索智能体。名叫OmniSearch,它能模拟人类解决问题的思维方式,将复杂问题逐步拆解进行智能检索规划。随便上传一张图,...……更多
多模态模型评测框架lmms-eval发布!全面覆盖,低成本,零污染
...qizhixin.com随着大模型研究的深入,如何将其推广到更多的模态上已经成为了学术界和产业界的热点。最近发布的闭源大模型如 GPT-4o、Claude 3.5 等都已经具备了超强的图像理解能力,LLaVA-NeXT、MiniCPM、InternVL 等开源领域模型也展现...……更多
讯飞星火V3.0发布,打造每个人的AI助手
...学自动提炼规律、小样本学习、代码项目级理解能力、多模态指令跟随与细节表达等能力,进一步提升星火的落地应用能力。升级AI人设、启发式对话,打造每个人的AI助手自讯飞星火9月5日全民开放后,当前已有1200万用户,也...……更多
李未可科技正式推出WAKE-AI多模态AI大模型
...科技正式发布为眼镜等未来终端定向优化等自研WAKE-AI多模态大模型,具备文本生成、语言理解、图像识别及视频生成等多模态交互能力。 该大模型围绕GPS轨迹+视觉+语音打造新一代LLM-Based的自然交互,同时多模态问答技术的加...……更多
云鼎科技:公司盘古矿山大模型自然语言处理和多模态能力方面应用场景处于研发阶段 【云鼎科技:公司盘古矿山大模型自然语言处理和多模态能力方面应用场景处于研发阶段】财联社12月12日电,云鼎科技发布股价异动公告,...……更多
李开复:未来的大模型将拥有多模态和执行任务的功能 【李开复:未来的大模型将拥有多模态和执行任务的功能】《科创板日报》28日讯,在今日2023中关村论坛上,创新工场董事长李开复对AI 2.0中短期做了预测 ,威力强大的大...……更多
...12个重点领域,类型包含文本、图片、音频、视频等多种模态。其中,中国手语多模态数据集、“海河·谛听”言语多模态数据集、基于隐私计算技术政务流通数据集、恒达文博文旅·科普基础数据集等69个数据集为国内首次公开...……更多
跨模态大模型“白泽”学会藏语
...新藏语内容理解与应用技术,人民网人民中科“白泽”跨模态大模型与青海师范大学的“班智达”藏语识别与翻译引擎深度融合后,显著提升了“白泽”对藏语内容的理解和处理能力,为网络空间藏语内容处理提供了全新的技术...……更多
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
...实现AGI(通用人工智能)的重要里程碑。券商建议关注多模态技术Sora视频一出,立刻震惊业界。360集团创始人、董事长周鸿祎2月16日在微博发文表示,这意味着AGI实现将从10年缩短到1年。其实,Sora出现之前,也有其他类似的AI...……更多
网达软件:公司“视联网数字化智能平台”不涉及多模态模型 【网达软件:公司“视联网数字化智能平台”不涉及多模态模型】财联社12月8日电,网达软件发布异动公告,近日市场对于AI视频生成、多模态模型等相关概念较为...……更多
微软新专利:构建多模态3d面部模型
...单,微软公司获得了一项新的专利,通过深度学习构建多模态3D面部模型,可以创建非常逼真的虚拟肖像。这项专利全称为《多模态三维面部建模和跟踪,生成富有表现力的虚拟肖像》,该系统涉及处理器和存储系统,处理器负...……更多
云知声推出山海多模态大模型:实时生成文本、音频和图像
IT之家 8 月 26 日消息,云知声于 23 日宣布推出山海多模态大模型。通过整合跨模态信息,山海多模态大模型能够接收文本、音频、图像等多种形式作为输入,并实时生成文本、音频和图像的任意组合输出。▲云知声山海助手微...……更多
苹果公司公布“mm1”多模态大模型
...omMultimodalLLMPre-training》的论文,其中介绍了一款“MM1”多模态大模型,该模型提供30亿、70亿、300亿三种参数规模,拥有图像识别和自然语言推理能力。IT之家注意到,苹果研究团队相关论文主要是利用MM1模型做实验,通过控制各...……更多
百模大战又添新势力!李未可科技将发布自研AI大模型
近期,36kr研究院发布了《2024年AIGC行业研究:多模态大模型与商业应用》,文中基于AIGC产业生态现状和技术发展路径,深入分析AIGC商业化应用的方向与产业发展趋势。其中在36kr研究院梳理的产业图谱中,发现杭州李未可科技...……更多
...据交易所(以下简称“深数所”)发布了500个垂直行业多模态算料集,按照大模型应用的不同阶段(训练、推理、调优),有的放矢地提供数据源,让国产大模型厂商“寻数有路”。此次深数所发布的首批500个人工智能大模型高...……更多
【产业互联网周报】字节回应被曝秘密利用OpenAI;英特尔预告Gaudi 3将超越H100;阿里云M7蔡英华离职;马斯克回应Grok抄ChatGPT作业
...,但其中未见蔡英华的动向。(36氪)贾佳亚团队推出多模态大模型LLaMA-VID据介绍,该模型可支持单图、短视频,还可以将3个小时的电影或视频精简为数个Token,直接使用大语言模型进行理解和交互。(36氪)蚂蚁集团回应职级...……更多
2B多模态新SOTA!华科、华南理工发布Mini-Monkey,专治「切分增大分辨率」后遗症
【新智元导读】Mini-Monkey 是一个轻量级的多模态大型语言模型,通过采用多尺度自适应切分策略(MSAC)和尺度压缩机制(SCM),有效缓解了传统图像切分策略带来的锯齿效应,提升了模型在高分辨率图像处理和文档理解任务的...……更多
新网银行“多模态深度神经网络风控模型体系”入选10项首批代表性创新产品榜单
...暨第一批人工智能应用场景发布大会上,新网银行的“多模态深度神经网络风控模型体系”入选“10项首批代表性创新产品”,彰显了新网银行在推动人工智能与金融深度融合方面的成果和贡献。活动现场。新网银行供图本次论...……更多
首个可保留情感的音频LLM!Meta重磅开源7B-Spirit LM,一网打尽「音频+文本」多模态任务
【新智元导读】Meta最近开源了一个7B尺寸的Spirit LM的多模态语言模型,能够理解和生成语音及文本,可以非常自然地在两种模式间转换,不仅能处理基本的语音转文本和文本转语音任务,还能捕捉和再现语音中的情感和风格。...……更多
推动数智+大健康产业深度融合 又一研发总部落子长沙天心经开区
...会现场。单位供图活动现场发布了最新的深思考Dongni.ai多模态搜索引擎、智能终端(AI PC Suite、AI 摄像头、AI 显微镜)、重大疾病早期筛查等重磅产品,并宣布深思考人工智能机器人科技有限公司研发总部正式落户天心经开区。...……更多
vivo蓝心大模型升级为“自研ai多模态大模型”
...432%。同时黄韬宣布,vivo的蓝心大模型升级为“自研AI多模态大模型”,这项技术通过视觉、声音、空间等多维度感知和理解世界,使大模型变得更加全面、智能和强大。蓝心大模型的使命是确保科技革命的成果能够平等地惠及...……更多
更多关于科技的资讯:
让手机、PC、汽车、AIoT等“终端”都用好AI,搞定统一生态这事太重要了
2024年无疑是端侧AI爆发的一年,因此产业也通常将今年看作是“端侧AI元年”。当下,AI大模型在终端细分赛道展现出的强大生命力
2024-12-12 09:41:00
NeurIPS 2024最佳论文开奖!北大字节NUS夺冠,Ilya连续三年获奖
【新智元导读】NeurIPS 2024最佳论文终于正式揭晓了!今年,来自北大字节,以及新加坡国立大学等机构的团队摘得桂冠
2024-12-12 09:41:00
华为Mate70Pro+再见了!16GB+512GB突降2850元,卫星通信+麒麟芯片
“华为,华为,你为何如此秀?”——一位围观双十二促销的路人如是说。华为Mate60 Pro+作为华为家族的高端产品,过去可是售价高企
2024-12-12 09:41:00
从濒死到全球市值第一,英伟达30多年逆袭传奇!
【新智元导读】从一家濒临破产的公司,英伟达最终走向全球市值第一。这不仅仅是一个传奇的商业故事,更是黄仁勋用行动诠释绝地反击的「教科书」
2024-12-12 09:42:00
诺奖青睐AI的这一年,这些人工智能公司&人物&产品值得关注
AI时代浪潮,在2024年奔涌到哪里了?当站在岁末年终来回顾,这依然是人工智能高歌猛进的一年,甚至代表人类科学最高荣誉的诺贝尔奖
2024-12-12 09:42:00
7000mAh大电池真能用两天?真我Neo7上手一周,这几点不吐不快
12月11日下午,真我全新独立Neo系列首款产品Neo7正式发布,12+256GB起售版本为2099元(首销减100)
2024-12-12 09:42:00
今天,ChatGPT升级为生产力工具:Canvas全量开放,人+AI协作模式
这就是大模型最好的应用方式?今天是 OpenAI 十二天连更的第四天,OpenAI 准备革新的是生产力。是的,就是 OpenAI 在 10 月份宣布的「ChatGPT 写作和编程新方式」
2024-12-12 09:43:00
OpenAI员工意外泄露下一代ChatGPT!网友:故意的还是不小心的?
OpenAI员工发推介绍今天发布的新功能,结果意外泄露了未发布的模型?在Reddit上,被列文虎克附体的网友发现,OpenAI研究员Karina Nguyen展示的新功能界面中出现了一个陌生的名字——ChatGPT ε(第五个希腊字母
2024-12-12 09:46:00
新一代音乐手机!vivo Y300三扬声器超强外放:音量提升600%
快科技12月11日消息,今日,vivo宣布,vivo Y300将于12月16日发布,主打“超强外放”。vivo Y300除了手机听筒
2024-12-12 09:49:00
首个免费多模态大模型API:GLM-4V-Flash上线智谱开放平台
继 8 月语言模型 GLM-4-Flash 免费后,我们秉承技术领先、技术普惠的理念,在今天上线备受期待的第一款免费的多模态模型——GLM-4V-Flash
2024-12-12 09:49:00
微信上线新功能!网友:不用拉群了
来源:微信派版权归作者所有,如有侵权请及时联系微信发文称,将上线两个新功能,一起来看↓↓想发就发位置不变,容量加倍“最近转发”大扩容
2024-12-12 09:49:00
谷歌Willow芯片锋芒毕露,“悟空芯”能接招不?还有更强的吗?
谷歌最新的量子芯片 Willow正式亮相,也算是惊艳全场了!美国不少科技大佬,如马斯克和openai的sam 奥特曼都为其点赞了
2024-12-12 09:50:00
后置三扬+3D音频+6500大电池轻薄机身,vivo新一代音乐手机登场!
之前小智给大家推荐过一款定位很鲜明的千元机,它就是vivo Y300 Pro,它是首款在1500元档内搭载高端的等深微曲面屏的手机
2024-12-12 09:51:00
真我Neo7测评:7000mAh电池续航无双,是时候告别充电宝了!
realme真我一直是能够给人带来惊喜的手机品牌,毕竟“敢越级”的口号可不是随便喊喊。在真我GT5 Pro、GT7 Pro连续两款旗舰手机站稳高端质价比市场之后
2024-12-12 09:52:00
广汽、特斯拉、小鹏纷纷布局!车企跨界角逐人形机器人赛道
车企正不断在机器人领域发力。日前,2024年明珠湾国际气候投融资大会在广州南沙举行,广汽集团自主研发的第二代具身智能机器人在此期间亮相
2024-12-12 09:52:00