• 我的订阅
  • 头条热搜
多模态模型评测框架lmms-eval发布!全面覆盖,低成本,零污染
...qizhixin.com随着大模型研究的深入,如何将其推广到更多的模态上已经成为了学术界和产业界的热点。最近发布的闭源大模型如 GPT-4o、Claude 3.5 等都已经具备了超强的图像理解能力,LLaVA-NeXT、MiniCPM、InternVL 等开源领域模型也展现...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
... OpenAI o1 技术的深入分析累计点击量已超过 15 万。如何全模态大模型与人类的意图相对齐,已成为一个极具前瞻性且至关重要的挑战。在当前 AI 领域的快速发展中,「有效加速」和「超级对齐」已经成为两个主要的发展动向,...……更多
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5”
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5” 3月14日,商汤科技发布多模态多任务通用大模型“书生(INTERN)2.5”,在多模态多任务处理能力方面实现多项全新突破,其卓越的图文跨模态开放任务处理能力可...……更多
腾讯开源最大MoE大语言模型!3D大模型同时支持文/图生成,晒混元模型及应用全家桶
...混元API服务调用,可满足文生文、图生文、文生图等不同模态以及角色扮演、FunctionCall、代码等不同专项的模型需求。2024年年初,腾讯混元就宣布在国内率先采用MoE架构模型,总体性能比上一代密集模型提升50%。此后,腾讯混...……更多
击败Gemini-1.5-Pro、GPT-4V,从容大模型多模态能力跻身全球前三
...云从科技从容大模型在综合评测权威平台 OpenCompass 的多模态评测领域中取得重大进展。最新评测结果显示,云从科技的从容大模型在该体系中的平均得分为 65.5,这一成绩使得从容大模型跻身全球前三,超越了谷歌的 Gemini-1.5-Pro...……更多
AI安全守护计划启动!信通院牵头,AIIA安全治理委员会发布三类模型安全评测
...内容可溯源的能力。目前主要针对图片、音频和视频等多模态内容,采用隐式水印方法建立互认机制。文本内容上的实现仍有一定技术难度,后续将持续有针对性地突破。 此外,计划将通过AI保险机制,为相关人员和单位给予...……更多
《金融大模型应用评测指南》发布,系全国首个以金融业务能力...
...能,指南定义了包括文本分类、信息抽取等在内的11项单模态、图文检索、视频问答等在内的6项多模态指标要求。金融安全与价值对齐能力方面,围绕模型的可靠性、可解释性以及隐私保护,指南设计了内容合规、文化价值、伦...……更多
GPT-4就是冲着赚钱来的!
...本相似,主要提升了语言模型方面的能力,并添加了“多模态”的图片识别功能。此外,GPT-4 将“单词最大输出限制”提高到了 25000 个单词,比基于GPT-3的ChatGPT更强大,在对问题的理解和回答方面,GPT-4也显得更聪明,更像人了...……更多
百川智能发布baichuan3稳定语言模型
...,大模型的全能特性发挥着至关重要的作用。首先,其多模态学习能力能够整合文本、影像、声音等多种类型的医疗数据,提供更全面、准确的分析和诊断。其次,大模型的深层推理能力有助于复杂医疗决策的制定。此外,稳定...……更多
推理成本直降99%!百川智能「1+3」矩阵揭秘,两张4090玩转旗舰新模型
...信用风险等等。此时就需要大模型能够整合动态数据与多模态处理、具有强大的模型识别与实时预测能力。这样它才能快速集成结构化(交易记录)和非结构化数据(文本),并进行跨模态的信息分析。并且,它还能对数据中的...……更多
...批12个长三角跨区域创新联合体正式发布。其中长三角多模态大模型创新联合体由科大讯飞牵头,德清阿尔法研究院等6家机构参与。为头部互联网企业提供技术支撑长三角多模态大模型创新联合体主要研究什么项目?德清阿尔法...……更多
手机上能跑的「GPT-4V」来啦!多图、视频理解首次上端!面壁小钢炮开源史上最强端侧多模态
...导读】面壁小钢炮MiniCPM-V 2.6重磅出击,再次刷新端侧多模态天花板!凭借8B参数,已经取得单图、多图、视频理解三项SOTA ,性能全面对标GPT-4V。再次刷新端侧多模态天花板,面壁「小钢炮」 MiniCPM-V 2.6 模型重磅上新!仅8B参数...……更多
面壁智能发布2B模型:适配主流手机,推理成本仅为GPT-4的1/360 | 最前线
...,来源于经过数据治理、多维评测的数据工厂。为了将多模态能力搬上了手机,面壁智能还发布了多模态端侧模型MiniCPM-V。通过将手机调整为飞行模式来模仿野外无信号的情况,面壁智能演示了野外生存情况下人与MiniCPM-V的多模...……更多
AI潮起 共筑数智之基
...大会上,中国移动正式发布了由万卡级智算集群、千亿多模态大模型、汇聚百大要素的生态平台共同构成的“九天”人工智能基座,并开放三大人工智能基地,加快大模型产业化、规模化发展,为数字中国建设注入更加强劲动能...……更多
llava-1.6与gpt-4vmp面硬刚的性能,一起来看看
...Qwen-VL-Plus,与GPT-4V正面硬刚,这个有着SOTA级别性能的多模态大模型真正做到了“人无我有,人有我优”。继2023年4月的初级版本、2023年10月的LLaVA-1.5之后,2024年1月31日,微软研究院又联合威斯康星大学麦迪逊分校和哥伦比亚大...……更多
加速落地 京东云大模型已支持数百个场景
...态资源统一管理。在智能体构建方面,平台提供一系列多模态组件与应用框架,如文生图、语音识别等多模态组件,以及检索增强生成、智能体等AI应用框架,分钟级即可启动AI Agent构建,帮助企业高敏、高效地进行AI应用的开发...……更多
智谱AI新一代基座大模型GLM-4在司南评测中跻身前列,位居国内第一
...新提供坚实的技术支撑。评测榜单涉及的大语言模型和多模态大模型超过150个,已有包括Meta、阿里巴巴、腾讯、百度等30余家国内外企业和科研机构采用OpenCompass助力开展技术研发。作为本次榜单国内模型第一,总排名第二,GLM-...……更多
紫东.太初再进化,揭秘全模态大模型的想象力
...在演讲中介绍了基于昇腾AI与昇思MindSpore AI框架打造的全模态大模型紫东.太初2.0,并首次提出全模态多任务统一生成式学习框架。借用Hugging Face联合创始人Thomas Wolf的说法:“在过去的几年里,好的多模态模型一直是许多大型技...……更多
智源评测体系发布 国内外“百模”评估结果出炉
...系,发布并解读国内外140余个开源和商业闭源的语言及多模态大模型全方位能力评测结果。本次智源评测,分别从主观、客观两个维度考察了语言模型的简单理解、知识运用、推理能力、数学能力、代码能力、任务解决、安全与...……更多
模型即服务,卓世科技MaaS平台 2.0 正式上线
...各类模型架构:多种模型种类的支持,如大语言模型、多模态模型等;多种模型架构支持,如单体模型架构、MoE模型架构 7、平台提供多种模型微调方式:支持RLHF、LORA、P-turning等多种模型微调方式 8、支持多种模型压缩模式:平...……更多
...精细化标注水平,积极开发涵盖文本、图像、音视频等多模态的高质量数据集。要加快自主算力资源和供给能力建设。大力推动算力基础设施和算力网络建设,不断提升智能算力综合供给水平;稳步推进公共算力服务平台建设,...……更多
零成本突破多模态大模型瓶颈!多所美国顶尖高校华人团队,联合推出自增强技术CSR
新智元报道编辑:LRST【新智元导读】现有多模态大模型在对齐不同模态时面临幻觉和细粒度感知不足等问题,传统偏好学习方法依赖可能不适配的外源数据,存在成本和质量问题。Calibrated Self-Rewarding(CSR)框架通过自我增强学...……更多
中文大模型最新评测出炉:腾讯混元国内第一!
快科技8月5日消息,在最新发布的中文多模态大模型SuperCLUE-V基准评测中,腾讯混元大模型获国内排名第一,稳居卓越领导者象限。此次评测聚焦于大模型理解复杂现实世界的关键能力,即多模态理解,俗称“图生文”。多模态...……更多
国家大模型标准测试结果公布 首批仅四家企业产品通过
...智能性、安全性等维度开展,涵盖语言、语音、视觉等多模态领域,旨在建立大模型标准符合性名录,引领人工智能产业健康有序发展。【来源:凤凰网科技】返回搜狐,查看更多责任编辑: ……更多
WAIC 2024观察 | 大模型需要颠覆性应用,必然是技术与产业积累的结合
...态资源统一管理。在智能体构建方面,平台提供一系列多模态组件与应用框架,如文生图、语音识别等多模态组件,以及检索增强生成、智能体等AI应用框架,分钟级即可启动AIAgent构建,帮助企业高敏、高效地进行AI应用的开发...……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...也出现了大模型独角兽智谱AI的身影。36氪获悉,近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融资由启明创投领投,达泰资本、鸿福厚德、智谱AI、老股东BV百度风投和卓源亚洲跟投。据介绍,融资主要用于多模...……更多
vivo发布自研大模型,为用户和开发者带来诸多惊喜
...随着大模型技术日益成熟,vivo在语言、图像、语音、多模态等全模态的AI技术上逐步升级为大模型能力,正从传统的AI技术时代迈向大模型AI技术时代。vivoAI算法技术总监李方圆全新蓝心大模型带来4项核心升级:1、语言大模型升...……更多
“智算融合 共创未来”——开普云AI战略暨新产品发布会召开
...,公司的AI战略是以自主构建算力能力为底座,以开悟多模态大模型为支撑,通过中台体系的构建,实现了行业训练数据的有序治理、行业大模型的高效训练以及智能应用的敏捷开发。这一战略不仅催生了AIGC多模态内容生产平台...……更多
多模态大模型是当下很火的一种创新技术,加快对多模态大模型技术的布局,可进一步提高金融服务效率,缓解行业发展困境。为了攻克创新技术领域的难题,度小满联合哈尔滨工业大学共同研发出一种创新的自适应剪枝算法...……更多
AI“明星”选手巅峰对决!记者实测最新谷歌Gemini与GPT-4o
...模型能够实现无缝的文本、视频和音频输入,并生成相应模态的输出,真正意义上实现了多模态交互。紧随其后一天,年度Google I/O开发者大会如期而至,谷歌CEO Sundar Pichai宣布了一系列围绕其最新生成式AI模型Gemini的重大更新,...……更多
更多关于科技的资讯:
iphone16系列中国销售比例公布
近日有码博主公布了iPhone16系列四款机型在中国市场的销售比例数据。具体而言,以iPhone16Plus为基准,iPhone16系列的销售比例分别为
2024-12-08 13:28:00
因借鉴、模仿痕迹明显 多款国产摩托车型被宣告外观专利全部无效
快科技12月8日消息,据柠檬机车报道,日前,国家知识产权局发布多份审查决定书,包括星海高科(深圳)科技有限公司的79bike
2024-12-08 13:41:00
TCL小蓝翼P7新风空调如何智胜牛魔王
最近,短视频平台短剧最热榜第一名的宝座被《大话•大话西游》牢牢占据,各位是否已经沉浸在这部剧中无法自拔?该剧改编自周星驰经典电影《大话西游》
2024-12-08 13:49:00
大屏笔记本是未来的主流?
前两天看到一则数据,洛图科技发布了2024年第三季度中国大陆笔记本电脑市场数据,其中有一项数据与大家想象的不太一样,那就是笔记本的屏幕尺寸
2024-12-08 13:57:00
喧嚣都市中的私密时光:降噪耳机真正的救星
在现代城市生活中,喧嚣与繁忙几乎成了我们生活的常态。大街小巷的车水马龙、办公室内的闲聊、咖啡馆的音乐,这些声响常常让人感到疲惫和焦虑
2024-12-08 14:01:00
人民财评:“耳朵经济”,“声”财有道
本文转自:人民网-观点频道桃梓近日,“耳朵经济”冲上热搜,引发众多讨论。以播客为主要载体的音频节目正在受到越来越多人的喜爱
2024-12-08 14:07:00
vivos20人像和影像方面全面升级,用光上再次取得新突破
令人万般期待的vivoS20系列终于正式发布了,vivoS系列一直以其卓越的影像能力在智能手机市场中占据一席之地,而vivoS20更是将这一优势推向了新的高度
2024-12-08 14:09:00
如何测试家庭网速
互联网在现代生活中扮演着举足轻重的角色,无论是工作、学习还是娱乐,网络速度都直接影响着我们的使用体验。因此,学会如何测试网速成为了每位网民的必备技能
2024-12-08 14:10:00
华为matex6系列精美图片赏析
华为近日震撼发布了其最新的折叠屏手机系列——MateX6,以及更为高端的MateX6典藏版,再度引领了智能手机市场的潮流
2024-12-08 14:10:00
深蓝全新中大型SUV预告:搭载激光雷达 有望配备华为乾崑智驾
快科技12月8日消息,深蓝汽车于12月8日发布了一款全新SUV车型的预告图。图中揭示了其宽敞的内部空间和搭载的激光雷达
2024-12-08 14:12:00
手机呼叫转移的设置方法
在现代社会,手机已经成为我们生活中不可或缺的一部分。无论是工作还是生活,电话的沟通方式都极为重要。然而,有时我们可能因为各种原因无法接听电话
2024-12-08 14:12:00
手机对镜拍摄小技巧,让你的照片更具吸引力,提升社交媒体魅力
在这个信息爆炸的时代,手机已经成为我们生活中不可或缺的一部分。尤其是在社交媒体盛行的今天,拍摄照片已成为一种日常活动。手机对镜拍摄
2024-12-08 14:13:00
如何让手机自拍记录下那些珍贵的瞬间,让照片更具生气
在这个数字化时代,手机自拍已经成为一种流行文化。无论是在朋友聚会、旅行途中,还是日常生活中,自拍都能记录下那些珍贵的瞬间
2024-12-08 14:15:00
手机自媒体创作者的拍摄技巧
在如今这个信息爆炸的时代,手机自媒体拍摄已成为一种流行趋势。作为一名自媒体创作者,我深刻体会到,掌握一些拍摄手法和技巧
2024-12-08 14:15:00
如何用手机拍摄出美丽的紫兰花?
在这个数字化时代,手机摄影已经成为了许多人记录生活的主要方式。紫兰花,作为一种色彩绚丽、形态优雅的花卉,吸引了无数摄影爱好者的目光
2024-12-08 14:18:00