• 我的订阅
  • 头条热搜
英伟达开源NVLM 1.0屠榜多模态!纯文本性能不降反升
...源模型(如GPT-4o)的表现并不一致。为了改变这一现状,英伟达的研究团队最近宣布推出NVLM 1.0,在视觉-语言任务上取得了最先进的成果,能够与最强大的闭源模型(如GPT-4o)和开源模型(如Llama 3-V 405B和InternVL 2)相媲美,并且...……更多
支持1024帧、准确率近100%,英伟达「LongVILA」开始发力长视频
...(涵盖系统、数据和 pipeline)是必不可少的。本文,来自英伟达、MIT、UC 伯克利、得克萨斯大学奥斯汀分校的研究者引入了 LongVILA,这是一种用于训练和部署长上下文视觉语言模型的全栈解决方案,包括系统设计、模型训练策略...……更多
Meta首款多模态Llama 3.2开源!1B羊驼宝宝,跑在手机上了
...了闭源Claude 3 Haiku。甚至,90B版本击败了GPT-4o mini。就连英伟达高级科学家Jim Fan都不禁夸赞,在轻量级模型中,开源社区整体上并不落后! 同时,为了适配边缘计算和终端设备,Meta还推出了1B和3B两个轻量级纯文本的版本,可支...……更多
MMMU华人团队更新Pro版!多模态基准升至史诗级难度:过滤纯文本问题、引入纯视觉问答
...候选选项、引入纯视觉输入设置)更严格地评估模型的多模态理解能力;模型在新基准上的性能下降明显,表明MMMU-Pro能有效避免模型依赖捷径和猜测策略的情况。多模态大型语言模型(MLLMs)在各个排行榜上展现的性能不断提...……更多
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5”
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5” 3月14日,商汤科技发布多模态多任务通用大模型“书生(INTERN)2.5”,在多模态多任务处理能力方面实现多项全新突破,其卓越的图文跨模态开放任务处理能力可...……更多
智谱AI发布视频生成大模型,B站参与研发,亦庄提供算力|甲子光年
...脸书的Make-A-Video、谷歌的Phenaki和MAGVIT、微软女娲DragNUWA、英伟达Video LDMs等视频生成模型工作中都有引用。2024年5月,GLM大模型技术团队在ICLR 2024主旨演讲环节全面阐述了GLM大模型面向AGI三大技术趋势,原生多模态大模型在其中扮...……更多
对比学习滥用隐私数据!中科院等发布「多步误差最小化」方法 | ACM MM2024
...出了一种新颖的多步误差最小化(MEM)方法,用于生成多模态不可学习样本,以保护个人数据不被多模态对比学习模型滥用。通过优化图像噪声和文本触发器,MEM方法有效地误导模型,降低其对隐私数据的学习能力,并在不同模...……更多
微软宣布Team Copilot发布,年内将推出初步预览版
...的业务流程。AzureAIStudio现已支持提供GPT-4oAPI将率先使用英伟达BlackwellAI芯片纳德拉介绍,由OpeanAI开发的最新旗舰模型GPT-4o,现已在AzureAIStudio中提供,并作为API提供。该多模态模型集成了文本、图像和音频处理能力,带来了全新...……更多
疯狂一夜!美国AMD、谷歌纷纷亮出大杀器,人类迎来巨变前夜?|钛媒体焦点
...夜,谷歌(Google)、AMD先后上新,终于要“打爆”OpenAI和英伟达了。钛媒体App 12月7日消息,北京时间今天凌晨,谷歌CEO桑达尔·皮查伊 (Sundar Pichai) 宣布,谷歌公司正式发布迄今为止功能最强大、最通用的多模态人工智能(AI)...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...谷歌。如果大量人工智能使用转向苹果硬件,它们也会对英伟达构成威胁,Arm 和台积电将获胜。”有网友说到苹果在大模型发展上的状况。也有网友认为,苹果在大模型上的发力将为其在未来的手机市场竞争中带来优势。他们...……更多
背水一战狙击GPT-4,谷歌最强大模型Gemini终发布,听说读写全能选手 | 焦点分析
...圈,Gemini才在千呼万唤中面世。△图源:谷歌一个月前,英伟达的资深科学家Jim Fan就为Gemini捏了把汗:“人们对谷歌Gemini的期望高得离谱!”他表示,Meta要惊艳世界的话,只要让Llama 3开源就好了。但谷歌想要重夺当年AlphaGo的...……更多
阿里国际发布最新开源多模态模型Ovis,多模态能力再升级
...手写英文准确翻译成中文、还能精准分析财报数据……多模态能力再次升级!今天,阿里国际AI团队发布了一款多模态大模型Ovis,在图像理解任务上不断突破极限,多种具体的子类任务中均达到了SOTA(最新技术)水平。多模态...……更多
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
...:HK)、三人行(605168)等;上游增加需求来看,推荐关注英伟达等算法、算力方面标的。东方证券早前的报告认为,从技术突破的角度来看,下一阶段的重点攻克方向必然会是多模态技术。能够真正处理和应用好多模态AI能力,...……更多
GPT-4撞上文心一言,百度压力骤增:多模态和中文能力受关注,或多种方式落地
...元为 OpenAI 建造了一台巨大的超级计算机,使用了上万颗英伟达GPU计算芯片,并称愿意投入更多资金。前述互联网分析师也提到,对文心一言等类似大模型来说,最重要的还是算力。“这次百度抢先在国内最早发布类ChatGPT应用,...……更多
迎战GPT-4V!谷歌PaLI-3视觉语言模型问世,更小、更快、更强
...像与语音识别能力。本月初,微软更是公布了 166 页的多模态版 GPT-4V 的相关文档,详细探讨了 GPT-4V 的功能和使用情况,这一举动引起了业界的广泛关注。然而,在视觉语言模型的角逐中,谷歌也不甘示弱。 近日,Google Research...……更多
别只盯着ChatGPT版Her,多模态AI拟人互动上,国内玩家也支棱起来了
... AI 发起挑战的高规格赛事落下了帷幕!这就是第二届多模态情感识别挑战赛(MER24),它由清华大学陶建华教授、中国科学院自动化研究所连政、帝国理工学院 Björn W.Schuller、奥卢大学赵国英以及南洋理工大学 Erik Cambra 联合在 A...……更多
紫东.太初再进化,揭秘全模态大模型的想象力
...有云、私有云、混合云在内的多种部署方式,兼容昇腾、英伟达、AMD、英特尔等不同AI硬件,作为AI框架的昇思MindSpore还提供了数据中心、训练中心、模型中心、推理中心在内大模型微调套件,进一步降低了大模型的开发门槛,...……更多
击败Gemini-1.5-Pro、GPT-4V,从容大模型多模态能力跻身全球前三
...云从科技从容大模型在综合评测权威平台 OpenCompass 的多模态评测领域中取得重大进展。最新评测结果显示,云从科技的从容大模型在该体系中的平均得分为 65.5,这一成绩使得从容大模型跻身全球前三,超越了谷歌的 Gemini-1.5-Pro...……更多
llava-1.6与gpt-4vmp面硬刚的性能,一起来看看
...Qwen-VL-Plus,与GPT-4V正面硬刚,这个有着SOTA级别性能的多模态大模型真正做到了“人无我有,人有我优”。继2023年4月的初级版本、2023年10月的LLaVA-1.5之后,2024年1月31日,微软研究院又联合威斯康星大学麦迪逊分校和哥伦比亚大...……更多
Gemini引领多模态AI热潮,产业发展有望加速
12月11日,多模态AI概念股继续活跃,苏州科达(603660.SH)三连板。截至当日中午收盘,因赛集团(300781.SZ)涨13.32%,苏州科达涨9.96%,宣亚国际(300612.SZ)涨9.7%。消息面上,GoogleAI大模型Gemini近日发布,Gemini是Google到目前为止规……更多
文档处理效能飙升!浩鲸科技“文档大模型”核心技术揭秘!
...的整体性方案,不仅包含了文档大模型能力,还提供了多模态文档工具链 DocChain 和开箱即用的软硬件一体机,基于垂直模型能力和软硬件相互配合,可帮助企业实现文档的知识抽取、知识融合,直至知识推理和问答的全流程覆...……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
...进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准,并设计了一种新颖的数据合成方法。无论是语言模型还是视觉模型,似乎都很难完成更抽象层次上的理解和推理任务。语言模型已经可以写诗写小说...……更多
本周硅谷发生了什么?| 高通第三代骁龙8;谷歌20亿美元追投Anthropic;联想拿出能跑大模型个人PC
...拥有70名员工。Moreh 表示,旗舰人工智能软件 MoAI类似于英伟达的CUDA,但与现有的机器学习框架(如Meta的PyTorch、谷歌的TensorFlow)以及以前只能在英伟达上运行的应用程序和人工智能模型兼容。(新浪VR) 新玩意Zero123++:从单一...……更多
多模态大模型是当下很火的一种创新技术,加快对多模态大模型技术的布局,可进一步提高金融服务效率,缓解行业发展困境。为了攻克创新技术领域的难题,度小满联合哈尔滨工业大学共同研发出一种创新的自适应剪枝算法...……更多
只有谷歌受伤的世界达成了,但“全能模型”到底该不该跟?
...OpenAI、谷歌那样做不行。最简单的,GPT-4o能第一时间拿到英伟达最先进的显卡,这就是国内厂商很难拥有的资源。此外,ToB领域对模型可控性的要求、私有化部署的需求等,国内企业的智能化要从数据清洗、知识库等基础工作开...……更多
支付宝发布多模态医疗大模型:支持千亿级视觉识别
...快科技7月5日消息,在2024世界人工智能大会上,支付宝多模态医疗大模型正式亮相,成为国内首批多模态医疗大模型之一。据悉,该医疗大模型的基石,源自蚂蚁集团自主研发的蚂蚁百灵大模型,这一先进平台不仅拥有“视听言...……更多
2B多模态新SOTA!华科、华南理工发布Mini-Monkey,专治「切分增大分辨率」后遗症
【新智元导读】Mini-Monkey 是一个轻量级的多模态大型语言模型,通过采用多尺度自适应切分策略(MSAC)和尺度压缩机制(SCM),有效缓解了传统图像切分策略带来的锯齿效应,提升了模型在高分辨率图像处理和文档理解任务的...……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...数据泄露,从而反映模型的真实性能。研究团队测试了多模态大模型(LMMs)和纯文本大模型(LLMs)。对于LLMs的测试,输入时不提供任何与图像相关的信息给模型,仅提供文本。所有评估均采用零样本(zero-shot)思维链(Chain of ...……更多
清华教授唐杰:Scaling Laws虽被质疑,但至今仍是提高大模型性能的重要方法
...事实性以及推理能力的缺陷,实现更精细的语义理解、多模态(文本、图像、语音、视频等)输入和输出,具备更强的个性化能力。”“人工智能的发展会更多瞄向通用人工智能,实现AI的自我解释、自我评测和自我监督,构建...……更多
ChatGPT一周年|炼制大模型芯片短缺数据有限,何以解忧?
...更紧迫的优化需求。如果说OpenAI是这场浪潮的引领者,那英伟达就是获得了最大实际利益的玩家。今年以来,这家AI芯片公司的股价已上涨241%,市值突破万亿美元,其领先市场的GPU(图形处理器)和高性能计算设施被全球科技企...……更多
更多关于科技的资讯:
掌阅科技荣获2024北京民营企业文化百强和中小企业百强
近日,北京市工商业联合会联合有关部门发布了2024北京民营企业1+4百强榜单。掌阅科技上榜“北京民营企业文化产业百强”第17名
2024-09-29 11:59:00
酷睿Ultra 7 265K第一次真身显现:LGA1851新接口
快科技9月29日消息,代号Arrow Lake的酷睿Ultra 200K系列即将登场,现在网上有人泄露了主流型号酷睿Ultra 7 265K的工程样品谍照
2024-09-29 12:03:00
特斯拉德国工厂病假率大增至17% 是德国汽车行业三倍!马斯克发声
快科技9月29日消息,据报道,特斯拉在欧洲唯一的汽车制造厂因高缺勤率引起了首席执行官埃隆·马斯克的关注。报道称,位于勃兰登堡Grünheide的特斯拉工厂在8月份的员工病假率攀升至17%
2024-09-29 12:03:00
海信在迪拜设立综合性研发中心
近日,位于迪拜的海信中东非研发中心正式开业。山东省委常委、青岛市委书记曾赞荣,中国驻迪拜总领事欧渤芊,海信集团董事长贾少谦
2024-09-29 12:24:00
赋能绿色出行,“青岛造”VR充电维保培训系统上线
近日,城运能源科技集团凭借其前瞻性的技术视野,推出了创新的VR充电维保培训系统,该系统为“青岛造”,为充电设施运维培训带来了新变化
2024-09-29 12:25:00
加速品质换新与消费升级 海信发布以旧换新品牌价值主张
近日,国家发展改革委召开专题新闻发布会,提出当前家电、家居、家装消费紧贴百姓生活,呈现市场规模大、升级需求旺、发展空间广三大趋势
2024-09-29 12:25:00
国庆出游的打工人搜爆“病号服” 网友:自从神经以后 精神状态果然好多了
快科技9月29日消息,十一长假将近,这届年轻人选择选择在假期“疯游”,来治愈自己因工作“损耗”的精神状态。据报道, 一些年轻人在没人认识的地方放飞自我
2024-09-29 12:33:00
颜值出色实力出圈 国庆出游用机选华为nova 12系列就对了
十一长假临近,国内长线游和出境游热度双双高涨,今年国庆或成年轻人销年假高峰期。除了提前抢票、规划行程、做好攻略之外,一款颜值出色
2024-09-29 12:33:00
奥特曼7万亿美元投资方案遭台积电高管嘲笑:门外汉
快科技9月29日消息,今年年初的时候,OpenAI CEO奥特曼被曝要进行7万亿美元的芯片投资。随后,他还在东亚进行了一次旋风式的访问
2024-09-29 12:33:00
丝滑加倍!ColorOS 15重构安卓图形框架:动画效果指哪打哪
快科技9月29日消息,OPPO ColorOS设计总监陈希今日发文称:“ColorOS 15从底层出发,重构了安卓图形框架
2024-09-29 13:03:00
珂尼娜品牌:以植物萃取 科学养肤,启迪时代智慧女性
在当今这个快速变化的时代,每一位智慧女性都在以坚韧的践行,立足于社会与经济的前沿,她们不仅追求事业的成功,更注重生活的品质与健康
2024-09-29 13:08:00
小米之家国庆福利来了:送60万瓶正能量矿泉水 48万份城市限定冰箱贴
快科技9月29日,今日,小米之家宣布将在国庆假期期间推出一系列的优惠活动,这些活动包括赠送价值丰厚的礼品,还有购物优惠和特别服务
2024-09-29 13:33:00
通用技术环球医疗荣耀加冕:ICT中国(2024)双奖见证,科技创新引领医疗健康新飞跃
近日,由中国通信企业协会举办的“ICT中国(2024)案例征集与发布”活动已完成多轮评选,通用技术环球医疗申报的《面向医院集团管理场景下的云网端一体化创新应用示范》
2024-09-29 14:02:00
奥迪RS5路上狂飙超300km/h:结果追尾大货车 车顶被削飞
快科技9月29日消息,日前,有博主分享了一条奥迪RS5高速狂飙的惨烈车祸视频,引起网友热议。从奥迪RS5车内人员拍摄的视频来看
2024-09-29 14:03:00
雷神新款25寸显示器上市:1080P 300Hz屏首发949元
快科技9月29日消息,雷神推出黑武士CF25F300L显示器,首发949元。外观上,新款显示器采用纯黑外观设计,机身背面有荧光蓝色灯环
2024-09-29 14:03:00