• 我的订阅
  • 头条热搜
反击OpenAI,谷歌放出最强悍大模型Gemini
...之久的GPT4真正竞品,也是目前谷歌能拿出手的功能最为强悍、适配最为灵活的大模型,包括三种不同套件,分别是Gemini Ultra, Gemini Pro和Gemini Nano。其中Ultra的能力最强,复杂度最高,能够处理最为困难的多模态任务;Pro能力稍弱...……更多
科学家打造多模态模型,7B和1.3B小模型均开源,可部署手机等终端
...模型。研究人员表示:“DeepSeek-VL 1.3B 小模型的性能同样强悍,在部分指标上超越了 7B 模型。” 这些小模型可以满足算力缺乏型开发者使用,也更方便在手机等移动终端上部署。日前,相关论文以《DeepSeek-VL:面向真实世界的...……更多
背水一战狙击GPT-4,谷歌最强大模型Gemini终发布,听说读写全能选手 | 焦点分析
...其进行微调,以进一步提升其能力。在性能上,Gemini相当强悍。Google放出了一系列测试结果,从自然图像、音频和视频理解到数学推理,在大型语言模型 (LLM) 研发中使用的32个广泛使用的学术基准上,Gemini Ultra的性能在30项上都...……更多
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5”
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5” 3月14日,商汤科技发布多模态多任务通用大模型“书生(INTERN)2.5”,在多模态多任务处理能力方面实现多项全新突破,其卓越的图文跨模态开放任务处理能力可...……更多
紫东.太初再进化,揭秘全模态大模型的想象力
...内部分享中,奇绩创坛创始人陆奇直言:他已经跟不上大模型时代的“狂飙”速度了。在ChatGPT引发的现象级讨论下,千亿级大模型的军备竞赛愈演愈烈,不少企业赶趟儿式的交出了自家的大模型答卷。尽管大模型的质量参差不...……更多
英伟达开源NVLM 1.0屠榜多模态!纯文本性能不降反升
【新智元导读】NVLM 1.0系列多模态大型语言模型在视觉语言任务上达到了与GPT-4o和其他开源模型相媲美的水平,其在纯文本性能甚至超过了LLM骨干模型,特别是在文本数学和编码基准测试中,平均准确率提高了4.3个百分点。文本...……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...雨编辑 | 邓咏仪全球首家发布Sora同款底层架构的清华系模型公司,近期完成了新一轮融资。投资名单中,也出现了大模型独角兽智谱AI的身影。36氪获悉,近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融资由启明...……更多
让大模型能听会说,国内机构开源首个端到端语音对话模型Mini-Omni
...非与启元世界多模态负责人吴昌桥,研究兴趣为多模态大模型、LLM Agents 等。本论文上线几天内在 github 上斩获 1000+ 星标。随着多类型大模型的飞速发展,全球 AI 已经进入到了多模交互时代。2024 年 5 月,OpenAI 推出了全新的多模...……更多
商汤如何玩转大模型+大算力?详解“日日新SenseNova”大模型体系的关键招
出品 | 搜狐科技作者 | 梁昌均在ChatGPT引发的大模型和生成式AI热潮下,国内AI公司商汤科技也秀出自家肌肉。在4月10日下午的技术交流日上,商汤正式发布“日日新SenseNova”大模型体系。这一大模型体系的名称取自《礼记·大学...……更多
“智算融合 共创未来”——开普云AI战略暨新产品发布会召开
...展示了在AI领域的综合实力。开普云已构建从数据治理、模型训练、产品研发到运维服务的全流程能力体系,开发出多款大模型平台级产品及AI智能应用类产品,并以全系列AI一体机产品,为大模型应用客户和大型智算中心客户提...……更多
手机上能跑的「GPT-4V」来啦!多图、视频理解首次上端!面壁小钢炮开源史上最强端侧多模态
...步骤,还能根据说明书和工具箱帮你找到合适的工具。2. 强悍的多图复杂推理能力,竟能读懂你的梗!得益于强大的多图复杂推理能力,MiniCPM-V 2.6 不仅能联合识别多张图片的表面信息,还能「读懂」梗图背后的槽点。比如让模...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...为刘家铭博士,研究方向为面向开放世界的多模态具身大模型与持续性学习技术。本工作第二作者为刘梦真,研究方向为视觉基础模型与机器人操纵。指导老师为仉尚航,北京大学计算机学院研究员、博士生导师、博雅青年学者...……更多
别只盯着ChatGPT版Her,多模态AI拟人互动上,国内玩家也支棱起来了
...利用少量有标签和大量无标签数据视频数据来训练自己的模型,并对模型在无标签数据集上的表现和泛化能力进行评估。该赛道获胜的关键在于通过改进半监督学习技术来提高模型情感识别性能,比如预测情绪类别的准确率。自...……更多
llava-1.6与gpt-4vmp面硬刚的性能,一起来看看
...-Plus,与GPT-4V正面硬刚,这个有着SOTA级别性能的多模态大模型真正做到了“人无我有,人有我优”。继2023年4月的初级版本、2023年10月的LLaVA-1.5之后,2024年1月31日,微软研究院又联合威斯康星大学麦迪逊分校和哥伦比亚大学的研...……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
...的关注,但最近浙大、中科院等机构的学者们提出,先进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准,并设计了一种新颖的数据合成方法。无论是语言模型还是视觉模型,似乎都很难完成更抽象层...……更多
CybotStar——大模型一站式应用开发平台
...的基础层由CPU、GPU、TPU等算力系统组成,为整个体系提供强悍的算力支撑,支撑企业级API高强度的算力调用;中间层内置了机器学习自动部署平台,集成了国内外多个基础型大模型,支持模型全流程高效的训练和部署;上层则是...……更多
迎战GPT-4V!谷歌PaLI-3视觉语言模型问世,更小、更快、更强
...况,这一举动引起了业界的广泛关注。然而,在视觉语言模型的角逐中,谷歌也不甘示弱。 近日,Google Research、Google DeepMind 和 Google Cloud 共同推出了一个更小、更快、更强大的视觉语言模型(VLM)——PaLI-3,该模型与相似的体...……更多
Meta首款多模态Llama 3.2开源!1B羊驼宝宝,跑在手机上了
...点在于,Llama 3.2成为羊驼家族中,首个支持多模态能力的模型。Connect大会上,新出炉的Llama 3.2包含了小型(11B)和中型(90B)两种版本的主要视觉模型。正如Meta所说,这两款模型能够直接替代,相对应的文本模型,而且在图像...……更多
...工智能研究院理事长、北京大学教授黄铁军表示,构建大模型生态首先要建立数据流通机制,推动从数据到智能的正反馈。汇聚数据超700万亿字节“如果没有开源数据集,很难想象人工智能怎样才能实现如此快速的迭代,然而,...……更多
科学家开发多模态音乐理解和生成大模型,兼具理解和创作音乐能力
“同行们认为我们用大模型把音乐理解和生成结合在一起的想法比较新颖,论文也是多模态大模型领域的先期工作之一。并且,除了大模型本身,我们提出的针对模型训练的数据集制作流程和整理的数据集,对学术界也具有较...……更多
多模态大模型是当下很火的一种创新技术,加快对多模态大模型技术的布局,可进一步提高金融服务效率,缓解行业发展困境。为了攻克创新技术领域的难题,度小满联合哈尔滨工业大学共同研发出一种创新的自适应剪枝算法...……更多
智谱AI发布视频生成大模型,B站参与研发,亦庄提供算力|甲子光年
视频大模型进入百模大战。今年是“视频生成”大模型爆发元年。在过去两个月,我们看到了快手可灵、商汤Vimi、Luma AI、爱诗科技Pixverse、Runway Gen-3等等视频大模型的你追我赶。但上半年的视频生成大模型公司,往往只聚焦在...……更多
林达华谈大模型发展之路:未来会有更高效的模型结构出现
大模型的上下文长度快速增长,超长上下文解锁新应用,但推理计算代价高昂,上下文本身对于信息不会进行压缩,不能直接捕捉其中的深层知识和规律。上海人工智能实验室领军科学家林达华。过去一年,人工智能领域风起...……更多
清华领衔发布多模态评估MultiTrust:GPT-4可信度有几何?
...专利产学研转化落地应用。以GPT-4o为代表的多模态大语言模型(MLLMs)因其在语言、图像等多种模态上的卓越表现而备受瞩目。它们不仅在日常工作中成为用户的得力助手,还逐渐渗透到自动驾驶、医学诊断等各大应用领域,掀...……更多
支持1024帧、准确率近100%,英伟达「LongVILA」开始发力长视频
现在,长上下文视觉语言模型(VLM)有了新的全栈解决方案 ——LongVILA,它集系统、模型训练与数据集开发于一体。现阶段,将模型的多模态理解与长上下文能力相结合是非常重要的,支持更多模态的基础模型可以接受更灵活...……更多
科学家研发自动驾驶新模块,让自动驾驶场景理解更接近人类认知
...,可以迅速地定位在关键区域。为了提高端到端自动驾驶模型的可解释性,该团队首次引入人类驾驶员的注意力机制。通过预测当前上下文中的驾驶员注意区域,他们将其作为一个掩码来调整原始图像的权重,从而使自动驾驶车...……更多
...“深数所”)发布了500个垂直行业多模态算料集,按照大模型应用的不同阶段(训练、推理、调优),有的放矢地提供数据源,让国产大模型厂商“寻数有路”。此次深数所发布的首批500个人工智能大模型高质量训练数据集,由...……更多
零成本突破多模态大模型瓶颈!多所美国顶尖高校华人团队,联合推出自增强技术CSR
新智元报道编辑:LRST【新智元导读】现有多模态大模型在对齐不同模态时面临幻觉和细粒度感知不足等问题,传统偏好学习方法依赖可能不适配的外源数据,存在成本和质量问题。Calibrated Self-Rewarding(CSR)框架通过自我增强学...……更多
苹果公司公布“mm1”多模态大模型
...dalLLMPre-training》的论文,其中介绍了一款“MM1”多模态大模型,该模型提供30亿、70亿、300亿三种参数规模,拥有图像识别和自然语言推理能力。IT之家注意到,苹果研究团队相关论文主要是利用MM1模型做实验,通过控制各种变量...……更多
文档处理效能飙升!浩鲸科技“文档大模型”核心技术揭秘!
在当今大模型技术日新月异的背景下,数据已跃升为构建企业大模型知识库、优化训练与微调,乃至驱动模型创新不可或缺的核心要素。对于企业来说,积累的宝贵知识广泛散布于形式多样的电子文档之中,这些文档不仅格式...……更多
更多关于科技的资讯:
纯国产高速激光打印机来了!龙芯2P0500主控打印机首批量产出货
快科技9月27日消息,日前,基于龙芯2P0500的极印高速激光打印机首批量产订单下线交付,标志着龙芯专用打印产品量产正式走向开放市场
2024-09-29 10:00:00
喜大普奔!微信公众号可以修改封面了!
9月27日,微信公众号发布新规——图文消息支持修改封面。传媒茶话会测试发现,通过“修改”入口进入文章后,修改页面的最底部已经新增修改封面的功能
2024-09-29 10:00:00
14年了,苹果又在美国本土制造芯片了,拜登:美国制造的重大胜利
美国本土可以生产4nm芯片了?据说,台积电在亚利桑那州的新工厂已经开始用上了先进的4N工艺,说白了,这就是5纳米技术的升级版
2024-09-29 13:32:00
顶固最接地气的长期主义:与“健康”同行
在历史的长河中,健康一直是人类追求的永恒主题。从苏东坡“宁可食无肉,不可居无竹”的诗意生活,到现代人对品质家居的渴望,健康的理念贯穿其中
2024-09-29 10:26:00
本文转自:人民网-北京频道人民网北京9月29日电 (记者董兆瑞)随着回天行动计划的稳步实施及昌平区“两谷一园”创新格局加速形成
2024-09-29 10:49:00
如何定义个贷不良资产处置3.0时代?
前言在金融领域,个贷不良资产处置的演变经历了显著的变革。1.0时代的处置特征依赖于传统的人工催收和法律诉讼,而2.0时代则引入了基础信息化手段
2024-09-29 10:53:00
吉利汽车CEO淦家阅:全新一代雷神超级电混续航超2000km
快科技9月29日消息,日前,在2024世界新能源汽车大会上,吉利汽车集团CEO淦家阅透露:吉利年内将发布全新一代雷神超级电混
2024-09-29 11:03:00
存储产业寒冬将至:金士顿已率先启动降价策略!
快科技9月29日消息,据媒体报道,近期,尽管存储大厂美光的财报一度给市场带来暖意,但摩根士丹利的报告却预测存储产业的寒冬即将到来
2024-09-29 11:03:00
Etsy店铺运营秘籍
Etsy是个汇集了无数手工艺品、复古商品和独特创意作品的电商平台,为全球的手工艺人和小型企业提供了一个展示和销售创意成果的舞台
2024-09-29 11:04:00
世界级的碰撞在郎酒庄园上演!中国郎的“世界级”梦想逐步照进现实
并肩同行,共绘世界建筑新篇章。9月27日,2024世界建筑节 中国盛典(以下简称:2024 WAF China)在郎酒庄园举行
2024-09-29 11:13:00
打破传统医疗服务的地域与机构壁垒,京东方健康视图板块上线
文|罗曾近日,京东方健康在智慧医疗领域有了新进展。据悉,其在合肥、成都、苏州三家自建医院正式推出创新健康视图板块,该板块是京东方医院服务号
2024-09-29 11:14:00
拿起手机、打开网约车软件,不一会儿,一辆自动驾驶出租车停到面前,扫二维码上车,系好安全带,在车载屏幕上点击“一切已准备好”
2024-09-29 11:16:00
张雪峰公司新增互联网游戏服务
张雪峰公司新增电竞相关业务天眼查App显示,近日,苏州峰狂文化科技有限公司发生工商变更,经营范围新增互联网游戏服务,演出经纪
2024-09-29 11:31:00
余承东:智能驾驶让人开车不劳累了 车相当于一个移动的家
快科技9月29日消息,日前,鸿蒙智行会客厅节目中,余承东与马东对话时表示,智能驾驶让人开车不劳累了,车相当于一个移动的家
2024-09-29 11:33:00
vivo韩伯啸公布X200标准版正面实拍图:等深四曲面 窄边框设计
快科技9月29日消息,今日vivo韩伯啸公布了X200标准版正面实拍图,称其采用超窄黑边全等深微四曲的设计,兼顾直屏的体验和曲屏的美感
2024-09-29 11:33:00