• 我的订阅
  • 头条热搜
多模态竞技场对标90B Llama 3.2!Pixtral 12B技术报告全公开
...lai首先,许多开源模型一般有个问题,就是为了多模态的性能而牺牲了本身的自然语言性能,之前英伟达的NVLM 1.0也谈到了这点。Pixtral本次也是成功避开了这个缺陷,单单比较文本模型的性能,也在同等尺寸的模型中居于前列。...……更多
阿里国际发布最新开源多模态模型Ovis,多模态能力再升级
...著提升多模态问答、指令跟随等任务表现。4、卓越模型性能:Ovis展现出了优异的榜单表现。在多模态权威综合评测Opencompass上,Ovis1.6-Gemma2-9B在30B参数以下的模型中取得了综合排名第一,超过了Qwen2-VL-7B、MiniCPM-V-2.6等模型。尤其...……更多
5项重大更新,NVIDIA助力人形机器人研发迈入新阶段
...rmer 引擎,其变压器引擎可提供 800 teraflops 的 8 位浮点 AI 性能,运行带宽达 100GB/s,AI 计算性能达 800TFLOPs,多层次规划能力卓越,以运行 GR00T 等多模式生成式 AI 模型。凭借集成的功能安全处理器、高性能 CPU 集群和 100GB 以太网……更多
商汤科技sensetime推出“云端边”全栈大模型体系
...行),不断突破大模型能力边界。”“日日新SenseNova5.0”性能超越GPT-4 Turbo:文理双修能力大幅提升,新增多模态交互自去年4月首次发布,商汤“日日新SenseNova”大模型体系已正式推出五个大版本迭代。基于超过10TBtokens训练、...……更多
小模型正在成为AI界的新宠
...理和学习的复杂性直接相关。模型容量越大,往往意味着性能越好。随着模型容量增加到数万亿个参数,大模型可以捕捉更复杂的模式,从而在自然语言处理、计算机视觉和其他任务上表现更好,具备更像人类的能力。另一方面...……更多
2024WAIC热议大模型助力产业新趋势,可信应用成焦点
...模型,天生具有不可控的机理,AI 须具备可预测和稳定的性能;第三,面对大模型可能产生的信息幻觉,确保内容的准确性和真实性是一大挑战;最后,必须包括内容安全、数据保护和网络安全,才能满足用户对 AI 应用的整体...……更多
空间智能版ImageNet来了!李飞飞吴佳俊团队出品
...队比较了不同的多模态模型在零镜头设置下理解长视频的性能。主要评估了三类模型,所有这些模型都在一个通用函数下运行:盲LLM:指是指在评估过程中,不考虑视频内容,仅依靠自身预先训练的知识来回答问题的大型语言模...……更多
击败GPT-4o的开源模型如何炼成?关于Llama 3.1 405B都写在论文里
...基础模型的能力上限,Meta 官方称,在一系列任务中,其性能可与最好的闭源模型相媲美。下表展示了当前 Llama 3 系列模型在关键基准测试上的性能。可以看出,405B 模型的性能与 GPT-4o 十分接近。与此同时,Meta 公布了《The Llama ...……更多
北大等发布多模态版o1!首个慢思考VLM将开源,视觉推理超闭源
...多模态推理基准测试中,LLaVA-o1超越其基础模型8.9%,并在性能上超越了一众开闭源模型。新模型具体如何推理,直接上实例,比如问题是:减去所有的小亮球和紫色物体,剩下多少个物体?选项:A. 4,B. 8,C. 2,D. 6传统提示词...……更多
自然语言处理:大模型理论与实践
...别等数据源,多模态数据集,以及数据处理方法和对模型性能的影响。还介绍预训练方法如语言建模和去噪自编码,优化参数设置和可扩展训练技术。- 微调:涵盖指令微调概念、构造指令实例的方法和数据集,指令微调任务中...……更多
蚂蚁数科能源电力时序大模型EnergyTS发布 预测精度超谷歌、亚马逊
...发电环节,容易受到太阳辐照、风速、云量、温度、设备性能等多重因素影响,存在发电效率不稳定的问题,进而带来用电供需不平衡、电价波动剧烈、储能调度收益低等关联风险。用AI技术可加强发电量预测的准确性,对电站...……更多
智谱AI发布视频生成大模型,B站参与研发,亦庄提供算力|甲子光年
...用场景示范、人才等全方位支持;清影的训练依托亦庄高性能算力集群,在北京亦庄算力集群诞生,未来也将应用于北京亦庄广阔的高精尖产业集群,形成大模型赋能实体经济的新业态。在生态合作上,bilibili作为合作伙伴也参...……更多
谷歌在AI赛道加速
...声称,该研究将大大提高训练速度和能效,比其他方法的性能高出 13 倍,能效高出 10 倍。随着有关 AI 数据中心对环境影响的讨论日益升温,新的 JEST 训练方法的出现可谓恰逢其时。DeepMind 的方法被称为 JEST 或联合示例选择,它...……更多
“杜甫很忙”梗图变视频!智谱AI生成视频模型上线
...表示,在此次生成式视频模型的研发中,坚信大模型最终性能主要与计算量、模型参数量和训练数据量相关的Scaling Law定律,继续在算法和数据两方面发挥作用。“我们积极在模型层面探索更高效的scaling方式。随着算法、数据不...……更多
感官协同配合的精细操纵,人大胡迪团队探索机器人模态时变性挑战
...所有设置上均优于所有基线方法。MS-Bot 在两个任务中的性能超过了使用自注意力(Self Attention)进行动态融合的 MULSA 基线,这表明 MS-Bot 通过在融合过程中基于对当前阶段的细粒度状态的理解更好地分配模态权重,而没有显示阶...……更多
昆仑万维SkyReels团队正式发布并开源SkyReels-V2
...经开源,可以直接使用。在视频理解测试集上的模型综合性能比较中,SkyCaptioner-V1表现优异,超越了SOTA的模型。 2.针对运动的偏好优化现有的视频生成模型在运动质量上表现不佳,主要原因是优化目标未能充分考虑时序一致性...……更多
GPT-4o的识图能力有多牛?四大维度深度体验
...技播客主持人DwarkeshPatel采访时透露,后训练是提高模型性能的关键因素。GPT-4o的识图能力有多牛?四大维度深度体验基于图片类型,记者将识图功能的测评分为4大维度,分别为普通图像、特定专业领域的图像、数据图像和手写...……更多
清华全球最大双臂机器人扩散大模型RDT,懂调酒能遛狗,登顶热榜
...扩展性(scalability)。换言之,扩大模型的参数量,它的性能也要跟着一起涨。二是,在之前的研究中,尚没有一个公认的在多种机器人数据上训练的方案。这主要是因为不同机器人的硬件结构和传感器不同,进而导致数据的格...……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...雨编辑 | 邓咏仪全球首家发布Sora同款底层架构的清华系模型公司,近期完成了新一轮融资。投资名单中,也出现了大模型独角兽智谱AI的身影。36氪获悉,近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融资由启明...……更多
斯坦福AI团队抄袭国产大模型?连识别“清华简”都抄了!清华系团队发文回应
...只花500美元训练,就能实现在多个基准测试中比肩GPT-4的性能。但很快有人发现,该模型跟清华系大模型创企面壁智能5月发布的MiniCPM-Llama3-V 2.5模型有不少相似处,而且没有任何相关致谢或引用。一开始团队面对抄袭质疑还嘴硬...……更多
手机上能跑的「GPT-4V」来啦!多图、视频理解首次上端!面壁小钢炮开源史上最强端侧多模态
...凭借8B参数,已经取得单图、多图、视频理解三项SOTA ,性能全面对标GPT-4V。再次刷新端侧多模态天花板,面壁「小钢炮」 MiniCPM-V 2.6 模型重磅上新!仅8B参数,取得 20B 以下单图、多图、视频理解 3 SOTA 成绩,一举将端侧AI多模态...……更多
MMMU华人团队更新Pro版!多模态基准升至史诗级难度:过滤纯文本问题、引入纯视觉问答
...更严格地评估模型的多模态理解能力;模型在新基准上的性能下降明显,表明MMMU-Pro能有效避免模型依赖捷径和猜测策略的情况。多模态大型语言模型(MLLMs)在各个排行榜上展现的性能不断提升,例如GPT-4o在大学水平上的多学...……更多
AI也会「刷抖音」!清华领衔发布短视频全模态理解新模型 | ICML 2024
...模态任务上表现优异,更在视听联合任务中展现了卓越的性能,证明了其全面性和准确性。想要看懂短视频,除了视觉内容外,语音和音频等听觉信息,如视频音乐、音效、语音内容等,也对短视频的理解起到关键作用。音视频...……更多
...“深数所”)发布了500个垂直行业多模态算料集,按照大模型应用的不同阶段(训练、推理、调优),有的放矢地提供数据源,让国产大模型厂商“寻数有路”。此次深数所发布的首批500个人工智能大模型高质量训练数据集,由...……更多
吉利星睿AI大模型正式发布 引领中国汽车进入全场景AI时代
...极端场景数据集ACDC(包含雨、雾、雪、夜等复杂场景)性能验证中,星睿AI DRIVE大模型均拿下实时排行榜第一名,位于国际领先水平。 强大的AI大模型,自然离不开强大的算力底座。星睿AI大模型基于全球首个“云、数、智”一...……更多
【产业互联网周报】字节回应被曝秘密利用OpenAI;英特尔预告Gaudi 3将超越H100;阿里云M7蔡英华离职;马斯克回应Grok抄ChatGPT作业
...PT”。据透露,该团队的任务是在今年年底前达到GPT-3.5的性能,在2024年年中达到GPT-4的性能。目前Seed大约有2000亿个参数。相比之下,GPT-3.5有1750亿个参数。 阿里云首席商业官蔡英华离职阿里云首席商业官蔡英华(花名:华琰)...……更多
群核科技(酷家乐)陈卓:用多模态AI助理赋能设计产业,用合成数据服务反哺AI | 新质生产力·AI Partner大会
...常长,往往会耗费大量的时间和资源,但通过云端部署高性能计算的方式,通过GPU+AI,让设计渲染速度比传统软件快几十倍甚至上百倍,并实现所见即所得的实时渲染效果。在过去十几年的时间里,群核科技的算力和数据得到了...……更多
开源社区参数量最大的文生视频模型来了,腾讯版Sora免费使用
...型模型成为可能,并评估了我们的文本到视频基础模型的性能,与最先进的视频生成模型(包括开源和专有模型)进行了比较。最后,我们展示了基于预训练基础模型构建的各种应用,并附上相关的可视化效果。精细的数据处理...……更多
让机器人拥有人一样潜意识,英伟达1.5M小模型就能实现通用控制了
当机器人也有潜意识。大模型固然性能强大,但限制也颇多。如果想在端侧塞进 405B 这种级别的大模型,那真是小庙供不起大菩萨。近段时间,小模型正在逐渐赢得人们更多关注。这一趋势不仅出现在语言模型领域,也出现在...……更多
蚂蚁发布EnergyTS能源电力大模型 预测精度远超谷歌、亚马逊
...yTS的MAE(平均绝对误差)仅为0.0233,较谷歌(TimesFM-V2.0)性能提升约22.4%。在T+3天预测任务中, EnergyTS的性能较谷歌(TimesFM-V2.0)提升46.8%,较亚马逊(Chronos-Large)提升62.4%。业内人士指出,该成果有望打破欧美企业在能……更多
更多关于科技的资讯:
湖北农发旗下米来生物荣获2025欧洲食品配料展食品与饮料技术创新大奖
12月2日,法国巴黎,在欧洲食品科技领域最具影响力的盛会——欧洲食品配料展(Food Ingredients Europe
2025-12-07 16:44:00
当城市核心区的物理空间增长几近饱和,未来的竞争力新高地何在?12月5日,一场发布会以别开生面的“数字气味”体验开场,为上城区加快建设中央创新区(CID)的战略发布
2025-12-07 07:21:00
日前,山西转型综改示范区入区企业山西恒真真空玻璃科技有限公司自主研发的新产品——“真空发热玻璃”上市。这一产品将高效真空玻璃技术与新型半导体制热技术深度融合
2025-12-07 07:32:00
生产设备共享给清河羊绒带来什么——河北特色产业集群共享智造故事(四)纱线在电脑横机上来回穿梭、电商平台的提示音此起彼伏……随着冬季来临
2025-12-06 08:04:00
厦门移动智慧康养产品亮相首届海峡两岸(厦门)银发博览会
市民现场体验移动随心屏(闺蜜机)的AI舌象问诊功能。厦门网讯 (文/厦门日报记者 许晓婷 王玉婷 通讯员 陈奕珣 图/厦门移动 提供)伸出舌头拍一拍
2025-12-06 08:26:00
厦门网讯 (厦门日报记者 林露虹)刷到一部微短剧,不知不觉被剧情吸引,回过神来看介绍,发现竟是AI参与制作的。类似经历
2025-12-06 08:26:00
从“手搓”到“智造” 厦门跑步机“跑”向全球
厦门网讯 (厦门日报记者 詹文 林健华)在位于同安工业集中区的生产车间里,一节一节钢板正传送上激光切割台,自动切割、打孔
2025-12-06 08:26:00
共建共享破局资源瓶颈:临沂联通与电信合作以5G RedCap创新实现业务与服务双突破
鲁网12月5日讯近日,临沂联通与临沂电信深度践行国家共建共享战略,成功完成全省首个基于电信800M频段的5G RedCap技术承载联通物联网专网业务的商用落地
2025-12-06 13:44:00
中国青年报客户端讯(中青报·中青网记者张均斌)近日,“中央引导地方”专项科技赋能文化方向立项课题——“面向文博场景的智能伴游导览系统研发及示范应用”启动会
2025-12-06 15:25:00
2025教室节能照明标杆盘点 四大品牌绿色护眼解决方案解析
在“双碳”目标引领下,校园节能改造成为教育领域绿色发展的重要方向。据住建部统计,商业建筑能耗中照明系统占比高达35%,学校作为人员密集
2025-12-06 16:09:00
海尔智慧家电亮相迪拜
11月26日至28日,中东地区极具影响力的家电电子展在迪拜世贸中心举办。展会中,海尔智家针对当地高温、多尘等特点,集中展示了洗衣机
2025-12-06 16:10:00
12月1日,豆包手机助手技术预览版正式发布,首发搭载于中兴Nubia工程样机。豆包手机助手是以豆包APP为基础,与手机厂商在操作系统层面合作开发的AI助手软件
2025-12-06 17:41:00
文化中国行|全场听觉无死角 吉林省音乐厅声学揭秘
历经修缮重生的丰乐剧场,以“吉林省音乐厅”之名即将绽放春城。这座历史建筑,从伪满时期影剧院到音乐剧场的跨越,背后藏着一套极致考究的声学设计方案
2025-12-06 18:41:00
伊贝格:让机床行业不再为“头”烦恼
“关键核心技术与高端装备对外依存度高”一直是制约制造业升级的瓶颈。五轴联动铣头作为五轴机床的核心功能部件,过去很长一段时间被欧洲部分知名厂商垄断
2025-12-06 22:07:00
山东重工潍柴集团2026年商务大会圆满召开
鲁网12月6日讯12月6日,以“乘势向上 聚力向新”为主题的山东重工潍柴集团2026年商务大会在潍坊举行。山东重工集团党委书记
2025-12-06 22:43:00