• 我的订阅
  • 头条热搜
华中科技大学白翔教授发布多模态大模型
...华中科技大学软件学院白翔教授领衔的VLRLab团队发布了多模态大模型——“Monkey”。该模型号称能够实现对世界的“观察”,对图片进行深入的问答交流和精确描述。▲图源Monkey项目的GitHub页面IT之家注:多模态大模型是一类可...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...人员于在 2023 年 10 月低调发布的一个名为 Ferret 的开源多模态大模型也没有收到太多关注。当时,该版本包含代码和权重,但仅供研究使用,而非商业许可。但随着 Mistral 开源模型备受关注、谷歌 Gemini 即将应用于 Pixel Pro 和 Andr...……更多
中信证券:OpenAI推出视频生成模型Sora AI产业围绕多模态不断加码 【中信证券:OpenAI推出视频生成模型Sora AI产业围绕多模态不断加码】财联社2月19日电,中信证券研报指出,近一周内,OpenAI和谷歌分别推出了他们的最新AI模型,...……更多
首批长三角跨区域创新联合体正式发布 激发“AI+”创新活力
...创新联合体。据了解,长三角跨区域创新联合体将围绕多模态大模型研究领域,通过联合攻关,在3年内突破机理研究、知识融合、模型评测、平台构建与领域应用等任务,提升多模态知识融合方法数量、大模型评测方案数量、...……更多
昆仑万维上半年收入25亿,AI应用加速落地,商业化成果显著
...。基座大模型侧,公司坚持技术创新,对文本大模型、多模态图文大模型、音乐大模型、3D大模型、视频大模型进行了全面升级,在性能上均达到行业领先水平,为用户带来前所未有的智能体验。AI应用侧,公司多款产品在全球...……更多
字节跳动豆包大模型发布,火山引擎全栈AI服务助力企业智能化转型
...现最佳效果和性价比。为此,豆包大模型提供的是一个多模态模型家族,企业可根据自身业务场景需求灵活选择,实现模型使用及成本控制的正循环。人人用得起 才是好模型谭待认为,降低成本是推动大模型快进到“价值创造...……更多
对比学习滥用隐私数据!中科院等发布「多步误差最小化」方法 | ACM MM2024
...出了一种新颖的多步误差最小化(MEM)方法,用于生成多模态不可学习样本,以保护个人数据不被多模态对比学习模型滥用。通过优化图像噪声和文本触发器,MEM方法有效地误导模型,降低其对隐私数据的学习能力,并在不同模...……更多
vivo自研大模型全家桶炸场,亮出PhoneGPT智能体,蓝心小V一键搞定衣食住行
...幕的力度、圈搜文字或图片、还是拖拽一段地址信息,多模态大模型都可以深度解读你的意图,进而给你需要的反馈和服务。依托文本大模型,结合自监督学习语音编解码、多语音任务学习和模态对齐等技术,蓝心小V在文本能...……更多
BEV“超融合”感知部署 轻舟智航迈出量产从0到1的关键一步
...先的数据闭环能力,并创新构建了离线点云大模型,为跨模态的数据标注、数据挖掘和模型训练提供强大支持,大幅提高数据价值和利用效率,提升长尾场景处理能力。在数据标注方面,轻舟智航可实现2D图像和3D图像的自动化...……更多
●多模态使人形机器人能融合图像、语义、力感知、环境感知等多种因素,综合判断、生成任务并执行任务,是让人形机器人具有自主思考能力的关键核心技术●标志着成都在我国多模态模型应用于人形机器人领域率先取得突...……更多
全国首个 成都创新团队发布机器人多模态模型
中国首个机器人多模态模型,可以相对明确地将水果和非水果进行区分和分拣如果你想吃苹果,根据语音指令,机器人会把苹果送到你手上;如果想收拾干净桌面,机器人就会把桌上所有的东西归置好……这个关于人工智能描...……更多
中国科学院地化所发布国际首个月球专业大模型,基于通义大模型及阿里云百炼专属版打造
...地球化学研究所与阿里云联合发布国际首个“月球科学多模态专业大模型”(简称“月球专业大模型”)。该大模型以视觉、多模态及自然语言等通义系列模型为基模,结合RAG检索增强等技术,于阿里云百炼专属版进行微调及训...……更多
最强国产多模态刚刚易主!腾讯混元把GPT-4/Claude-3.5都超了
国产大模型,多模态能力都开始超越GPT-4-Turbo了??权威榜单,中文多模态大模型测评基准SuperCLUE-V,新鲜出炉:特别是腾讯的hunyuan-vision、上海AI Lab的InternVL2-40B,分别成为国内闭源和开源界两大领跑者,甚至超过Claude-3.5-Sonnet..……更多
...板苏州科达:公司的KD-GPT大模型相对于谷歌Gemini的通用多模态大模型在服务对象上存在明显区别 【五连板苏州科达:公司的KD-GPT大模型相对于谷歌Gemini的通用多模态大模型在服务对象上存在明显区别】财联社12月13日电,苏州科...……更多
MMMU华人团队更新Pro版!多模态基准升至史诗级难度:过滤纯文本问题、引入纯视觉问答
...候选选项、引入纯视觉输入设置)更严格地评估模型的多模态理解能力;模型在新基准上的性能下降明显,表明MMMU-Pro能有效避免模型依赖捷径和猜测策略的情况。多模态大型语言模型(MLLMs)在各个排行榜上展现的性能不断提...……更多
开源证券:多模态模型再迎新突破,继续布局AI应用及算力
...议关注券商、银行。(三)券商行业掘金 开源证券:多模态模型再迎新突破,继续布局AI应用及算力1、OpenAI发布首个文生视频模型Sora,可输出长达60秒的视频2月16日凌晨,OpenAI发布了首个文生视频模型Sora。Sora可以直接输出长...……更多
北大等发布多模态版o1!首个慢思考VLM将开源,视觉推理超闭源
北大等出品,首个多模态版o1开源模型来了——代号LLaVA-o1,基于Llama-3.2-Vision模型打造,超越传统思维链提示,实现自主“慢思考”推理。在多模态推理基准测试中,LLaVA-o1超越其基础模型8.9%,并在性能上超越了一众开闭源模型...……更多
理想汽车多模态认知大模型Mind GPT正式上线 【理想汽车多模态认知大模型Mind GPT正式上线】财联社3月28日电,理想汽车今日宣布,全自研多模态认知大模型Mind GPT已正式上线,成为首个通过备案的汽车厂商自研大模型。(财联社...……更多
百灵大模型多模态能力全面提升
...IT之家从蚂蚁集团获悉,蚂蚁集团自研的百灵大模型的多模态能力全面提升。多模态能力让大模型能“看”会“听”,能“说”会“画”,可支持音、视、图、文等多模态理解与生成,可以让大模型更像人一样感知和互动,未来...……更多
昆仑万维重磅发布天工AI高级搜索功能,做最懂金融投资、科研学术的AI搜索
...精力进行解析,能够识别出其中的文本、图表、图片等多模态内容,同时将这些图表、图片信息做了相应的检索库。此外,天工AI还构建并搭载了分钟级的信源收录系统,能够更快地收集全网高价值信息;构建了自研搜索引擎、...……更多
李未可科技正式推出WAKE-AI多模态AI大模型
...科技正式发布为眼镜等未来终端定向优化等自研WAKE-AI多模态大模型,具备文本生成、语言理解、图像识别及视频生成等多模态交互能力。 该大模型围绕GPS轨迹+视觉+语音打造新一代LLM-Based的自然交互,同时多模态问答技术的加...……更多
云鼎科技:公司盘古矿山大模型自然语言处理和多模态能力方面应用场景处于研发阶段 【云鼎科技:公司盘古矿山大模型自然语言处理和多模态能力方面应用场景处于研发阶段】财联社12月12日电,云鼎科技发布股价异动公告,...……更多
多款技术产品问世!山东省新型智慧媒体重点实验室亮点纷呈
...”“基于主流价值观的党媒算法研究”“基于AI技术的多模态内容风控研究”“基于区块链技术的版权确权研究”五个方向,深入开展底层技术攻关研究,力求探索出一条能够使主流媒体与用户重新建立“深度连接”,重塑核心...……更多
跨模态大模型“白泽”学会藏语
...新藏语内容理解与应用技术,人民网人民中科“白泽”跨模态大模型与青海师范大学的“班智达”藏语识别与翻译引擎深度融合后,显著提升了“白泽”对藏语内容的理解和处理能力,为网络空间藏语内容处理提供了全新的技术...……更多
京东探索研究院院长、京东科技人工智能业务负责人何晓冬:让大模型在产业先跑起来
...犀大模型,经过不断升级,已从单一的语言处理走向了多模态能力,涵盖了语言、语音、图像、视频和数字人等。这一跨越,得益于京东在对话、语音、商品图像、视频、直播等多模态数据层面的训练积累以及包括BUTD Attention、A...……更多
网达软件:公司“视联网数字化智能平台”不涉及多模态模型 【网达软件:公司“视联网数字化智能平台”不涉及多模态模型】财联社12月8日电,网达软件发布异动公告,近日市场对于AI视频生成、多模态模型等相关概念较为...……更多
微软新专利:构建多模态3d面部模型
...单,微软公司获得了一项新的专利,通过深度学习构建多模态3D面部模型,可以创建非常逼真的虚拟肖像。这项专利全称为《多模态三维面部建模和跟踪,生成富有表现力的虚拟肖像》,该系统涉及处理器和存储系统,处理器负...……更多
云知声推出山海多模态大模型:实时生成文本、音频和图像
IT之家 8 月 26 日消息,云知声于 23 日宣布推出山海多模态大模型。通过整合跨模态信息,山海多模态大模型能够接收文本、音频、图像等多种形式作为输入,并实时生成文本、音频和图像的任意组合输出。▲云知声山海助手微...……更多
苹果大模型,不藏了
...模型领域的步伐。上个月,苹果先是推出了名为Ferret的多模态大语言模型,图像处理技术堪称惊艳;而后又发布了一篇题为《闪存中的大型语言模型:在有限内存下高效的大型语言模型推理》的论文,直指大模型落地iPhone等“内...……更多
国内首个极速超拟人交互向全民开放 可在星火大模型中体验
...模型算法持续演进,国外以GPT-4o、特斯拉FSD等为代表的多模态端到端方案,已被证实可进一步提升技术效果和用户体验。而讯飞星火极速超拟人交互将此前级联方案升级为统一神经网络,实现语音到语音的“端到端”建模,大幅...……更多
更多关于科技的资讯:
王自如关联公司经营异常!本人已从格力离职:大变样
快科技1月26日消息,近日,因未依照《企业信息公示暂行条例》第八条规定的期限公示年度报告,深圳市悦宸汽车美容有限公司被列入经营异常名录
2025-01-26 13:35:00
被传与华为密切接触:上汽申请“尚界”等商标
快科技1月26日消息,此前被曝与华为正密切接触的上汽集团有了新的动作。天眼查显示,近日上海汽车集团股份有限公司新提交“尚界”
2025-01-26 13:35:00
这不纯纯博主“引流”变“引火烧身”嘛~
军哥亲自转发了小米法务部的公告,闹挺大呀。事情是这样的,2014年某UP主做了小米和极氪的对撞视频,涉嫌故意抹黑小米汽车
2025-01-26 13:59:00
横向测评还是看权威第三方或者大型垂媒,自媒体UP主就算了吧
抹黑小米的那位博主被抓了!我基本不看自媒体的测评,我只关注像懂车帝汽车之家冬测这种大型的实测。极氪的几款车在2024懂车帝冬测里表现都挺好的,进阶版测试也榜上有名,实力可见一斑。
2025-01-26 14:02:00
雷军深情回应知名测评师王垠:令我很感动
快科技1月26日消息,近日,一段雷军回应知名测评师王垠的视频在网络上引起了广泛关注。在视频中,雷军首先表达了对王垠的深深敬意
2025-01-26 14:05:00
为什么连续五年没有大年三十 专家:正常现象
快科技1月26日消息,今年除夕是腊月二十九,有网友会问,为什么连续五年没有大年三十?对此,专家指出,农历的一个月主要是用月亮的圆缺变化来定义
2025-01-26 14:05:00
王平华运营总裁荣膺“2024 创新强国(行业)十大杰出人物”
在当今瞬息万变的商业世界中,企业如何才能在激烈的竞争中崭露头角、屹立不倒?是凭借独树一帜的创新理念,还是凭借对行业标准的深度参与和引领?海南众极客集团有限公司的故事
2025-01-26 14:16:00
蛇年春节临近,中新经纬董文博来到位于石家庄的1919裕华万达超市酒馆店,体验店员的一天。该店负责人魏永介绍,在进行酒水介绍和服务时
2025-01-26 14:18:00
行行行行行行行 这春联你会读吗
快科技1月26日消息,你见过只由一个字组成的春联吗?比如行行行行行行行。这类春联乍一看可能会让人一头雾水,但通过读音变化
2025-01-26 14:35:00
为什么肚子上的肉更难减:腹部运动量相对偏低
快科技1月26日消息,为什么肚子上的肉很难减掉?对很多人来说,这是个世纪性的大难题。据了解,人体的运动主要依赖骨骼肌,而腹部的骨骼肌相对偏少
2025-01-26 14:35:00
京东除夕抽奖超长清单公布:可得21999元宇树Go2机器狗、iPhone 16等
快科技1月26日消息,虽然京东今年没有与《春晚》合作,但依然会抽奖送礼品。官方介绍,除夕当天晚8点起,每个整点打开京东APP搜“除夕抽奖”
2025-01-26 15:05:00
折叠屏领域的里程碑式旗舰!OPPO Find N5开机动画惊艳
快科技1月26日消息,今天,ColorOS陈希分享了OPPO Find N5的开机动画。他表示,全新的OPPO Find N5是一个里程碑式的产品
2025-01-26 15:05:00
苏企造全系列国产化ECMO系统获批上市
近日,苏州恒瑞医疗器械有限公司自主研发的首款全系列国产化ECMO(体外心肺支持辅助)系统正式获得国家药品监督管理局批准上市
2025-01-26 15:31:00
苏州工业园区坚持以科技创新引领新质生产力发展,不断集聚创新资源,加快建设创新平台,持续完善创新生态,推动纳米技术应用及新材料产业向价值链高端攀升
2025-01-26 15:31:00
“欢乐春节”敦行故远中华文化全球行·2025 塞浦路斯之旅
在“一带一路”倡议的持续推动下,文化交流成为增进各国人民相互理解与友谊的重要桥梁。2025年1月16日至20日,“敦行故远中华文化全球行2025塞浦路斯之旅”盛大举行
2025-01-26 15:35:00