• 我的订阅
  • 头条热搜
反击OpenAI,谷歌放出最强悍大模型Gemini
... CEO戴密斯·哈萨比斯在谷歌官网联名发文,官宣了最新多模态大模型Gemini 1.0(双子星)版本正式上线。这个上线时间早于外界猜测的明年1月,保密程度很高,仅有少数媒体提前猜出。Gemini 1.0是谷歌筹备了一年之久的GPT4真正竞...……更多
GPT-4V暴露致命缺陷?JHU等发布首个多模态ToM 测试集
...来自 JHU, NYU, MIT, Harvard 等机构的研究团队开创了第一个多模态的 ToM 测试基准,发现现有的多模态模型和 LLM 都表现存在系统性缺陷,同时他们提出了一种有效的新方法。在刚结束的 ACL 2024 会议中,这篇论文获得杰出论文奖。论...……更多
苹果公司公布“mm1”多模态大模型
...omMultimodalLLMPre-training》的论文,其中介绍了一款“MM1”多模态大模型,该模型提供30亿、70亿、300亿三种参数规模,拥有图像识别和自然语言推理能力。IT之家注意到,苹果研究团队相关论文主要是利用MM1模型做实验,通过控制各...……更多
清华提出CharacterGLM;DeepMind联创发全新一代大模型;大模型版“5年高考3年模拟”来了丨AI新零售早报
...大模型版“5年高考3年模拟”来了!6141道数学题,还是多模态的那种|微软&UCLA&UW联合出品》MathVista是一个多模态数学推理基准数据集,由微软、UCLA和UW联合开发,包含6141个数学问题,涵盖丰富的任务类型、推理能力和图...……更多
苹果发布mm1.5-ui模型
10月13日消息,近日,苹果公司推出了300亿参数的多模态AI大模型MM1.5,该版本是在前代MM1的架构基础上发展而来的。该模型继续遵循数据驱动的训练原则,着重探究在不同训练周期中混合各类数据对模型性能产生的影响,相关模...……更多
21.5万张X光,78万个问题!德州大学NIH等联合发布医学视觉问答数据集Medical-CXR-VQA
【新智元导读】多模态大语言模型(MLLM)在医学视觉问答(VQA)领域展现出巨大潜力,通过提供针对医学图像的具体临床问题的回答,有助于提高医疗专业人员的工作效率。然而,现有医学VQA数据集规模较小且问题过于简单,...……更多
Meta提出“可持续思维链”,让大模型在连续潜空间中推理
...的创新框架。DiffSensei 集成了基于扩散的图像生成器和多模态大语言模型(MLLM),后者是一种文本兼容身份适配器。他们的方法采用了掩码交叉注意力技术,可无缝整合字符特征,从而在不直接传输像素的情况下实现精确的布局...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...人员于在 2023 年 10 月低调发布的一个名为 Ferret 的开源多模态大模型也没有收到太多关注。当时,该版本包含代码和权重,但仅供研究使用,而非商业许可。但随着 Mistral 开源模型备受关注、谷歌 Gemini 即将应用于 Pixel Pro 和 Andr...……更多
百万鲁棒数据训练,3D场景大语言模型新SOTA!IIT等发布Robin3D
...高模型在3D场景理解中的鲁棒性和泛化能力,在多个3D多模态学习基准测试中取得了优异的性能,超越了以往的方法,且无需针对特定任务的微调。多模态大语言模型(Multi-modal Large Language Models, MLLMs)以文本模态为基础,将其它...……更多
OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性
...超过90%。在启用视觉感知能力的情况下,o1模型在MMMU(多模态理解)测试中获得了78.2%的高分,成为首个能与人类专家展开竞争的AI模型。在 MMLU(大规模多任务语言理解)测试中,在总计57个子类别中,o1在54个类别上都超越了GPT...……更多
华中科技大学白翔教授发布多模态大模型
...华中科技大学软件学院白翔教授领衔的VLRLab团队发布了多模态大模型——“Monkey”。该模型号称能够实现对世界的“观察”,对图片进行深入的问答交流和精确描述。▲图源Monkey项目的GitHub页面IT之家注:多模态大模型是一类可...……更多
背水一战狙击GPT-4,谷歌最强大模型Gemini终发布,听说读写全能选手 | 焦点分析
...布,“大杀器”Gemini 1.0,正式上线。Gemini是一个原生多模态大模型,谷歌在今年5月的I/O大会宣布开始研发后,Gemini的传说不断:将谷歌大脑和DeepMind部门合并,数百人攻坚,几乎耗尽谷歌内部计算资源……如此种种,只为和OpenA...……更多
商汤升级“日日新5.0”大模型,对标GPT-4Turbo
...金融、数据分析等场景落地提供基础。“日日新5.0”的多模态能力在多模态大模型权威综合基准测试MMBench中综合得分排名首位,在多模态榜单MathVista、AI2D、ChartQA、TextVQA、DocVQA、MMMU中取得领先成绩。“日日新5.0”支持高清长图...……更多
【产业互联网周报】字节回应被曝秘密利用OpenAI;英特尔预告Gaudi 3将超越H100;阿里云M7蔡英华离职;马斯克回应Grok抄ChatGPT作业
...,但其中未见蔡英华的动向。(36氪)贾佳亚团队推出多模态大模型LLaMA-VID据介绍,该模型可支持单图、短视频,还可以将3个小时的电影或视频精简为数个Token,直接使用大语言模型进行理解和交互。(36氪)蚂蚁集团回应职级...……更多
击败Gemini-1.5-Pro、GPT-4V,从容大模型多模态能力跻身全球前三
...云从科技从容大模型在综合评测权威平台 OpenCompass 的多模态评测领域中取得重大进展。最新评测结果显示,云从科技的从容大模型在该体系中的平均得分为 65.5,这一成绩使得从容大模型跻身全球前三,超越了谷歌的 Gemini-1.5-Pro...……更多
阿里国际发布最新开源多模态模型Ovis,多模态能力再升级
...手写英文准确翻译成中文、还能精准分析财报数据……多模态能力再次升级!今天,阿里国际AI团队发布了一款多模态大模型Ovis,在图像理解任务上不断突破极限,多种具体的子类任务中均达到了SOTA(最新技术)水平。多模态...……更多
Sam Altman或筹数十亿美元自造AI芯片,DeepMind首席科学家或将辞职创业
...期版本,并接近最新版本的表现。此外,GLM-4还增强了多模态能力,其CogView3模型在多项评测维度上达到了DALL·E3的90%以上水平。智谱AI还发布了GLMs和GLM Store,为用户提供定制化的个人GLM大模型和模型应用商店。GLMs降低了大模型...……更多
跨模态大升级!少量数据高效微调,LLM教会CLIP玩转复杂文本
在当今多模态领域,CLIP 模型凭借其卓越的视觉与文本对齐能力,推动了视觉基础模型的发展。CLIP 通过对大规模图文对的对比学习,将视觉与语言信号嵌入到同一特征空间中,受到了广泛应用。然而,CLIP 的文本处理能力被广...……更多
商汤科技sensetime推出“云端边”全栈大模型体系
...a5.0”性能超越GPT-4 Turbo:文理双修能力大幅提升,新增多模态交互自去年4月首次发布,商汤“日日新SenseNova”大模型体系已正式推出五个大版本迭代。基于超过10TBtokens训练、覆盖大量合成数据,全新的“日日新SenseNova5.0”(以...……更多
疯狂一夜!美国AMD、谷歌纷纷亮出大杀器,人类迎来巨变前夜?|钛媒体焦点
...布,谷歌公司正式发布迄今为止功能最强大、最通用的多模态人工智能(AI)大模型:Gemini(中文称“双子座”)。具体来看,谷歌最新发布的Gemini 1.0系列,主要是英语模型,共包括三个不同尺寸版本:Ultra(超大杯)、Pro(大...……更多
大模型「标王」硬气:不做Sora ,要帮更多企业做出Sora
被神话的 Sora ,被低估的多模态。Sora 终于来了!只要是 ChatGPT Plus/Pro 用户,直接就能用上。至于效果 ......看完官方放出的 demo,网友大呼:不太行 !当人们对「超级应用」的热情被 Sora 浇上一盆凉水时,多模态应用已经悄咪...……更多
下载次数破39万!CMU、Meta联合发布VQAScore文生图优化方案:Imagen3已采用
...论文提名和最佳短论文奖等。其研究成果在生成模型和多模态学习领域受到了学术界和工业界的广泛认可。Pengchuan Zhang是Meta AI(原Facebook AI研究院)的人工智能研究科学家,曾在微软研究院担任高级研究科学家。他的研究领域主...……更多
谷歌王者归来?最新推出的大模型到底有多强,能否挑战GPT-4
...Demis Hassabis)在发布会上表示,谷歌运行了32个完善的多模态基准测试来比较Gemini和OpenAI的GPT-4,Gemini“在32项基准测试的30项中大幅领先”。据谷歌介绍,在训练后期,Gemini在各类任务上都表现优异。例如,MMLU(大规模多任务语...……更多
中文大模型最新评测出炉:腾讯混元国内第一!
快科技8月5日消息,在最新发布的中文多模态大模型SuperCLUE-V基准评测中,腾讯混元大模型获国内排名第一,稳居卓越领导者象限。此次评测聚焦于大模型理解复杂现实世界的关键能力,即多模态理解,俗称“图生文”。多模态...……更多
突破视频多模态大模型瓶颈!「合成数据」立大功,项目已开源
... S-Lab 的博士生 Bo Li, 字节跳动研究员 Wei Li, Zejun Ma.视频多模态大模型(LMMs)的发展受限于从网络获取大量高质量视频数据。为解决这一问题,我们提出了一种替代方法,创建一个专为视频指令跟随任务设计的高质量合成数据集...……更多
llava-1.6与gpt-4vmp面硬刚的性能,一起来看看
...Qwen-VL-Plus,与GPT-4V正面硬刚,这个有着SOTA级别性能的多模态大模型真正做到了“人无我有,人有我优”。继2023年4月的初级版本、2023年10月的LLaVA-1.5之后,2024年1月31日,微软研究院又联合威斯康星大学麦迪逊分校和哥伦比亚大...……更多
Claude 3.5深夜觉醒,学会模仿人类用电脑!编程干翻o1,Agent一夜变天
...,检测是否发生危害。 研究过程Anthropic在工具使用和多模态的工作,为AI识别和解释图像奠定了基础。在此基础上,Claude还需要推理如何以及何时根据屏幕内容执行操作。为此,研究者训练Claude准确计算像素,从而完成命令,...……更多
字节跳动为企业提供极具性价比的多模态大模型能力
...正式发布豆包视觉理解模型,为企业提供极具性价比的多模态大模型能力。豆包视觉理解模型千tokens输入价格仅为3厘,一元钱就可处理284张720P的图片,比行业价格便宜85%,以更低成本推动AI技术普惠和应用发展。火山引擎总裁...……更多
Meta首款多模态Llama 3.2开源!1B羊驼宝宝,跑在手机上了
【新智元导读】Meta首个理解图文的多模态Llama 3.2来了!这次,除了11B和90B两个基础版本,Meta还推出了仅有1B和3B轻量级版本,适配了Arm处理器,手机、AR眼镜边缘设备皆可用。Llama 3.1超大杯405B刚过去两个月,全新升级后的Llama 3....……更多
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
...实现AGI(通用人工智能)的重要里程碑。券商建议关注多模态技术Sora视频一出,立刻震惊业界。360集团创始人、董事长周鸿祎2月16日在微博发文表示,这意味着AGI实现将从10年缩短到1年。其实,Sora出现之前,也有其他类似的AI...……更多
更多关于科技的资讯:
价格接近400万元!法拉利首款纯电动车将于今年秋季发布
快科技2月5日消息,日前,法拉利首席执行官在财务业绩发布会上证实,法拉利首款纯电动汽车将于今年秋季发布,具体日期或为10月9日
2025-02-05 16:42:00
告别黄牛!任天堂为Switch 2大量备货:信心满满保障需求
快科技2月5日消息,任天堂即将发布的Switch 2游戏机备受玩家期待,而任天堂也正在积极准备,以确保这款新游戏机不会重蹈初代Switch因缺货而被黄牛囤积炒卖的覆辙
2025-02-05 16:42:00
舒适防臭耐磨:三枪中筒男女运动商务袜5双到手14.9元
天猫三枪袜品旗舰店,三枪中筒男女运动商务袜5双当前售价24.9元,限时限量10元券,实付14.9元包邮。款式简约百搭,舒适防臭又耐磨
2025-02-05 16:42:00
无人机避障黑科技横空出世!时速73km 夜间也能跟踪目标
快科技2月5日消息,据媒体报道,近日,中国香港大学科技团队研发的无人机自主避障技术,吸引了众多无人机爱好者的目光。据介绍
2025-02-05 16:42:00
轴距加长赶上X5 新一代国产宝马X3配置曝光:选装很丰富
快科技2月5日消息,近日,新一代国产宝马X3的相关消息曝光,包括部分配置。据悉,新车将将于2月上市,一季度开启交付,共三款车型
2025-02-05 17:12:00
中国联通首条自由空间光承载业务顺利开通:无需物理介质 跨湖高速传输
快科技2月5日消息,中国联通官方介绍,中国联通研究院联合江苏联通、蓝星光域对研发设备成果进行了现场验收,现场部署环境是跨湖1
2025-02-05 17:12:00
天钡GT37迷你主机首发5299元:锐龙AI 9 HX 370旗舰芯
快科技2月5日消息,天钡推出了新款迷你主机——天钡GT37,首发5299元。新款迷你主机采用硬朗的电竞外观,左右侧有斜切的通风开口
2025-02-05 17:12:00
国产科幻大片《流浪地球3》下月开机:网友喊话求加入我国6代战机
快科技2月5日消息,据国内媒体报道称,国产科幻大片《流浪地球3》将会在下月开机,预计2027年春节上映(此前官方已经宣布2027年大年初一上映)
2025-02-05 17:12:00
创史高 春节充电量最多的三条高速公路出炉:京沪高速排第3
快科技2月5日消息,据国家电网智慧车联网平台的最新数据显示,2025年春节期间,我国新能源汽车在高速公路上的充电量实现了大幅增长
2025-02-05 17:12:00
国货爆款:颐莲玻尿补水喷雾30元速囤(必入)
颐莲玻尿酸喷雾300ml日常售价89元,今日百亿补贴万人团买一送一,到手价为60元2瓶。一喷瞬补水,时刻水润充盈。3大维度补水
2025-02-05 17:12:00
布鲁可携多IP系列产品亮相德国纽伦堡玩具展,持续推进全球化战略布局
随着中国春节的钟声敲响,全球玩具行业的的目光将再次聚焦于欧洲的"玩具都城"——德国纽伦堡市。1月28日至2月1日,这里举办被称为是"世界三大玩具展"之一的纽伦堡玩具展
2025-02-05 17:14:00
刷手机真的会让“大脑腐化”吗?牛津大学教授反驳称研究不支持
近日,英国《卫报》刊发文章——《刷手机真的会让“大脑腐化”吗?》,令人耳目一新:多位神经科学家、心理学家的研究和观点认为
2025-02-05 17:15:00
华为引望申请5D蟹行商标
华为引望申请华尔兹掉头商标天眼查知识产权信息显示,近日,深圳引望智能技术有限公司申请注册“5D蟹行”“华尔兹掉头”商标
2025-02-05 17:17:00
浙江在线2月5日讯(通讯员 王蓉) 近日,南京银行杭州分行在支付业务管理工作领域传来喜讯,凭借在支付结算、移动支付等多方面的卓越表现
2025-02-05 17:25:00
欧戈雅刘凡立:家居的另一种可能
莫尔说:“为了寻找想要的东西,我们走遍了全世界。回到家找到了”。家,是一个有温度的词语。一间房子,里面装满了爱,生活就有了意义
2025-02-05 17:34:00