模态,推理,北大,视觉,模型,推理头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

小红书技术副总裁王晓博：大模型让AI越来越像人，更懂小红书的

...力的建设。目前，小红书技术团队同时针对语言模型和多模态能力进行了综合研发，结合小红书自身的业务场景和需求，更早做了视觉理解大模型方向的技术攻关：在多模模型架构、多模态alignment和整个数据体系和视觉感知能力...……更多

2024-07-08 14:43:00小红,越来,副总,模型,越来越,内容

Sora再度颠覆AI视频行业，A股哪些公司有相关布局？

...实现AGI（通用人工智能）的重要里程碑。券商建议关注多模态技术Sora视频一出，立刻震惊业界。360集团创始人、董事长周鸿祎2月16日在微博发文表示，这意味着AGI实现将从10年缩短到1年。其实，Sora出现之前，也有其他类似的AI...……更多

2024-02-19 08:10:00颠覆,布局,行业,视频,公司,模型

全球首篇！调研近400篇文献，鹏城实验室&中大深度解析具身智

...数字空间和物理世界的交互来完成复杂任务。近年来，多模态大模型和机器人技术得到了长足发展，具身智能成为全球科技和产业竞争的新焦点。然而，目前缺少一篇能够全面解析具身智能发展现状的综述。因此，鹏城实验室多...……更多

2024-07-29 09:39:00中大,文献,调研,深度,实验室,实验

面壁智能发布2B模型：适配主流手机，推理成本仅为GPT-4的

...，来源于经过数据治理、多维评测的数据工厂。为了将多模态能力搬上了手机，面壁智能还发布了多模态端侧模型MiniCPM-V。通过将手机调整为飞行模式来模仿野外无信号的情况，面壁智能演示了野外生存情况下人与MiniCPM-V的多模...……更多

2024-02-03 16:03:00适配,推理,模型,主流,成本,智能

联合实验室的科研将基于字节跳动豆包大模型展开

...AIInfra、AISafety等。该团队已推出自研通用大模型，提供多模态能力，下游支持豆包、扣子、即梦等50+业务，并通过火山引擎开放给企业客户。今年5月，字节跳动在2024春季火山引擎Force原动力大会上宣布自家豆包大模型正式开启...……更多

2024-12-14 01:07:00豆包,字节,实验室,模型,科研,实验

大模型重构生命科学！最大基础模型面世，解锁DNA超长序列

...规模高达2100亿，覆盖蛋白质、DNA、RNA、细胞等七大主流模态。背后玩家正是来自李彦宏孵化创办的百图生科。与应用于其他行业的基础模型有所不同，他们解码的是生命语言，而非自然语言，意味着不仅能处理复杂的生物序列...……更多

2024-11-07 09:50:00模型,重构,生命科学,序列,生命,基础

阿里云通义千问 Qwen2-VL 第二代视觉语言模型开源

...，使得其可以更灵活高效地进行图像处理。二是使用了多模态旋转位置嵌入（M-ROPE）方法。传统的旋转位置嵌入只能捕捉一维序列的位置信息，M-ROPE 使得大规模语言模型能够同时捕捉和整合一维文本序列、二维视觉图像以及三...……更多

2024-09-03 09:45:00二代,通义,阿里,模型,视觉,语言

21.5万张X光，78万个问题！德州大学NIH等联合发布医学

【新智元导读】多模态大语言模型（MLLM）在医学视觉问答（VQA）领域展现出巨大潜力，通过提供针对医学图像的具体临床问题的回答，有助于提高医疗专业人员的工作效率。然而，现有医学VQA数据集规模较小且问题过于简单，...……更多

2024-08-10 09:47:00德州,问答,视觉,医学,联合,数据

《永劫无间》手游首次将具有18亿参数的大语言模型引入终端侧

...龙8至尊版适配优化 GLM-4V端侧视觉大模型，支持丰富的多模态交互方式。GLM-4V端侧视觉大模型能够实现令人惊叹的处理能力，以超过 70tokens/秒的速度在终端侧高速运行。此外通过与骁龙8至尊版进行深度适配和推理优化，终端侧...……更多

2024-10-23 02:55:00终端,模型,参数,语言,高通,终端

“智算融合共创未来”——开普云AI战略暨新产品发布会召开

...，公司的AI战略是以自主构建算力能力为底座，以开悟多模态大模型为支撑，通过中台体系的构建，实现了行业训练数据的有序治理、行业大模型的高效训练以及智能应用的敏捷开发。这一战略不仅催生了AIGC多模态内容生产平台...……更多

2024-04-11 10:30:00新产,开普,共创,共创未来,发布会,新产品

商汤科技sensetime推出“云端边”全栈大模型体系

...a5.0”性能超越GPT-4 Turbo：文理双修能力大幅提升，新增多模态交互自去年4月首次发布，商汤“日日新SenseNova”大模型体系已正式推出五个大版本迭代。基于超过10TBtokens训练、覆盖大量合成数据，全新的“日日新SenseNova5.0”（以...……更多

2024-04-25 01:02:00商汤,云端,模型,体系,科技,商汤

商汤升级“日日新5.0”大模型，对标GPT-4Turbo

...金融、数据分析等场景落地提供基础。“日日新5.0”的多模态能力在多模态大模型权威综合基准测试MMBench中综合得分排名首位，在多模态榜单MathVista、AI2D、ChartQA、TextVQA、DocVQA、MMMU中取得领先成绩。“日日新5.0”支持高清长图...……更多

2024-04-24 09:32:00商汤,模型,升级,商汤,模型,推理

苹果的封闭生态为大模型打开！发布开源多模态大模型、每天为 A

...人员于在 2023 年 10 月低调发布的一个名为 Ferret 的开源多模态大模型也没有收到太多关注。当时，该版本包含代码和权重，但仅供研究使用，而非商业许可。但随着 Mistral 开源模型备受关注、谷歌 Gemini 即将应用于 Pixel Pro 和 Andr...……更多

2023-12-26 14:06:00模型,生态,模态,零碎,苹果,模型

阿里云CTO周靖人：全面投入升级AI大基建

...模型Qwen2.5系列，同时上架语言、音频、视觉等100多款全模态模型，通义开源模型累计下载量已经突破4000万，通义原生模型和衍生模型总数超过5万，成为仅次于美国Llama的世界级模型群。打造最强AI基建不同于传统IT时代，AI时代...……更多

2024-09-19 15:53:00阿里,基建,投入,升级,模型,通义

北京智源研究院发布原生多模态世界模型Emu3

...者刘峣）近日，北京智源人工智能研究院正式发布原生多模态世界模型Emu3。该模型实现了视频、图像、文本三种模态的统一理解与生成，成功验证了基于下一个token（词元）预测的多模态技术范式，释放其在大规模训练和推理上...……更多

2024-10-24 05:12:00模态,北京,研究院,模型,研究,世界

字节跳动为企业提供极具性价比的多模态大模型能力

...正式发布豆包视觉理解模型，为企业提供极具性价比的多模态大模型能力。豆包视觉理解模型千tokens输入价格仅为3厘，一元钱就可处理284张720P的图片，比行业价格便宜85％，以更低成本推动AI技术普惠和应用发展。火山引擎总裁...……更多

2024-12-18 17:35:00模态,字节,性价比,模型,能力,企业

2023IDEA大会：让大模型更好应对复杂问题

...机视觉领域在呼唤通用大模型的来临。以GPT-4V为代表的多模态大模型，是在语言能力上增加视觉能力；IDEA研究院的计算机视觉团队则选择了另一条路径，先将基础的视觉能力做到极致，再增加语言能力。目前风靡全球的“大模...……更多

2023-11-24 10:53:00模型,大会,问题,模型,研究,能力

突破时间序列组合推理难题！南加大发布一站式多步推理框架TS-

...以适应不同领域和多样化的数据特性，无法在多任务、多模态的环境中有效工作。4. 缺乏端到端的任务执行框架：由于在结构化推理和时间信号的数值计算交叉点上的研究较少，实现端到端的时间序列任务执行仍然面临挑战。现...……更多

2024-10-29 09:55:00推理,时间序列,序列,框架,难题,突破

AI也会「刷抖音」！清华领衔发布短视频全模态理解新模型 |

...失函数和混合未配对音视频数据训练。该模型不仅在单一模态任务上表现优异，更在视听联合任务中展现了卓越的性能，证明了其全面性和准确性。想要看懂短视频，除了视觉内容外，语音和音频等听觉信息，如视频音乐、音效...……更多

2024-08-01 09:45:00模态,清华,领衔,模型,视频,音视

商汤绝影在行业内率先实现了原生多模态大模型的车端部署

...家王晓刚17日宣布，商汤绝影在行业内率先实现了原生多模态大模型的车端部署。车载端侧8B模型首包延迟在300毫秒以内，推理速度40Tokens/秒，覆盖主流算力平台。商汤绝影为多模态大模型打造计算引擎“HyperPPL”，目前扩展并支...……更多

2024-07-19 22:04:00商汤,模态,模型,业内,商汤,模态

全国首个成都创新团队发布机器人多模态模型

中国首个机器人多模态模型，可以相对明确地将水果和非水果进行区分和分拣如果你想吃苹果，根据语音指令，机器人会把苹果送到你手上；如果想收拾干净桌面，机器人就会把桌上所有的东西归置好……这个关于人工智能描...……更多

2024-08-13 09:51:00模态,人多,成都,模型,团队,机器

OpenAI o1模型到博士水平了?复旦教授:没有真正推理能

...超过90%。在启用视觉感知能力的情况下，o1模型在MMMU（多模态理解）测试中获得了78.2%的高分，成为首个能与人类专家展开竞争的AI模型。在 MMLU（大规模多任务语言理解）测试中，在总计57个子类别中，o1在54个类别上都超越了GPT...……更多

2024-09-13 16:44:00复旦,相关性,概率,推理,模型,教授

通义千问再放大招：720亿大模型开源，全尺寸赶上LLaMA-

...阿里云也首次开源了音频理解大模型Qwen-Audio，这是在多模态领域的一次探索。Qwen-Audio能够感知和理解人声、自然声、动物声、音乐声等各类语音信号。用户可以输入一段音频，要求模型给出对音频的理解，甚至基于音频进行文...……更多

2023-12-01 21:07:00通义,模型,尺寸,移动,模型,阿里

云计算一哥终于搞多模态了：一口气6个大模型，还有个3nm芯片

...—亚马逊CEO Andy Jassy亲自站台re:Invent24，发布自家新款AI多模态系列大模型，名曰Amazon Nova。而且是一口气涵盖文本对话、图片生成、视频生成，甚至直接吐露一个小目标：将来我们不仅要Speech to Speech，更要Any-to-Any！整体而言，Am...……更多

2024-12-05 09:45:00模态,一口,芯片,模型,一口气,亚马