模态,推理,北大,视觉,模型,推理头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...达到 750 亿参数，性能获得了大幅升级。AInno-75B 增加了多模态处理能力，支持输入文本、图像、视频以及工业场景中的行为（Action）模态，如 CAD 等。通过引入高参数量大模型 AInno-75B，创新奇智的主推产品 ChatDoc、ChatBI 获得了...……更多

2024-09-03 10:00:00工业,机器人,成效,落地,模型,方向

国产GPU万卡集群终于来了！摩尔线程CEO张建中：做难而正确

...ansformer架构不能实现大一统，从稠密到稀疏模型，再到多模态模型的融合，多元架构持续演进并共存，面向特定领域设计的专用芯片难以适应未来算法，通用型算力才具备更强的抗风险能力。三是AI、3D、高性能计算（HPC）跨技...……更多

2024-07-09 09:47:00摩尔,张建中,万卡,张建,集群,线程

LeCun 的世界模型初步实现！基于预训练视觉特征，零样本规

...常有限…… 无法理解物理世界，没有持续性记忆，不能推理（只要推理的定义是合理的）、不能规划。」Yann LeCun 批评 LLM 的推文之一相反，他更注重所谓的世界模型（World Model），也就是根据世界数据拟合的一个动态模型。比...……更多

2024-11-19 09:48:00样本,模型,特征,视觉,训练,规划

终于拿到内测！豆包-PixelDance真是字节视频生成大杀

...个面向不同细分领域（视频生成、音乐和同声传译）的多模态大模型，同时给之前已有的通用语言模型、文生图模型、语音模型来了一波大升级。这些模型共同构建起了火山引擎的「豆包全模态大模型家族」。家族新秀：豆包视...……更多

2024-09-30 09:51:00豆包,字节,生成,视频,模型,豆包

Infocomm China2024见闻：大家每天忙于开会，

...是人物讲话、视频内容、共享屏幕还是会议纪要，都是多模态大模型重要的信息来源。”今年，腾讯会议已经将其混元大模型能力融合到会议场景中，以类似于“AI助理”的方式呈现。不仅是腾讯会议，钛媒体还注意到，今年的I...……更多

2024-04-22 17:00:00见闻,会议,腾讯,模型,能力,场景

大模型如何链接产业？“联通元景”重磅发布！

...、对外赋能千行百业。在公众应用方面，中国联通基于多模态大模型，聚焦视觉渲染、智能通话和智能交互三大领域，赋能视频彩铃、联通云盘、XR通话、数字人、联通安全管家、5G宽视界等多项数智生活产品，提升人们的生活...……更多

2024-03-01 11:22:00重磅,模型,链接,产业,模型,中国联通

研究员探讨如何让gpt4模型玩《毁灭战士》游戏

...》游戏。deWynter为此设计了一个系统，使用GPT-4V（GPT4的多模态衍生版本，可以接收图像作为输入）捕捉游戏引擎的画面截图，并返回游戏状态的结构化描述。他设计了一个Agent模型，根据视觉输入信息，并对比此前历史记录作出...……更多

2024-03-13 10:51:00研究员,战士,模型,研究,模型,截图

阿里大模型，再次开源大放送

...版让不少人都迫不及待想试试。并且还顺便问问，那个多模态大模型Qwen-VL-Max有可能开源吗？除此之外，还集成到了Huggingfacetransformers，以及同主流的十余个框架合作，从微调、部署、量化到本地推理一步到位。 01Qwen1.5开源此次...……更多

2024-02-20 14:45:00阿里,模型,再次,模型,多语,能力

千行百业加速拥抱大模型（AI前沿观察）

...语料数据联盟成员单位共同开源发布“书生·万卷”1.0多模态预训练语料。本次开源的数据总量超过2TB，包含超5亿个文本、2200万个图文交错文档、1000个影像视频。在11月举行的2023人工智能计算大会上，智源研究院联合阿里云、...……更多

2023-12-22 03:26:00百业,模型,观察,模型,语料,数据

大模型推理乘上RISC-V快车？国内AI芯片创企推大模型系列

...并发、技术自主可控方面具有优势的新选择。AI大模型在推理侧的新机遇与RISC-V创新架构具有的可扩展性、可编程性、超大规模等优势特点不谋而合。技术和场景应用的双重优势下，希姆计算的大模型一体机能支撑企业将基座模...……更多

2023-11-15 15:41:00模型,一体机,推理,快车,芯片,一体

全球最强开源大模型Llama 3发布：使用15T数据预训练，

...示，在接下来的几个月中，他们预计将推出新功能（如多模态）、更长的上下文窗口、更多不同大小版本的模型和更强的性能，以及 Llama 3 研究论文。另外，Llama 3 模型将很快在 AWS、Databricks、Google Cloud、Hugging Face、Kaggle、IBM Wats.……更多

2024-04-20 11:03:00模型,训练,参数,数据,全球,模型

Sora出现，手机行业将出现大洗牌？

...效率的储备，包括文本摘要等；“创作”包括文生图等多模态创作；“专属”是培养为用户超级助理，在适当时主动提供信息和服务推荐，因此要有储备用户画像的能力、智能体记忆能力等，帮助AI体验更加专属化。这也要基于...……更多

2024-02-22 18:01:00行业,手机,手机,模型,用户,智能

RAG没有银弹！四级难度，最新综述覆盖数据集、解决方案，教你

...据通常是高度非结构化的，包含表格、图像、视频等多种模态，将数据进行分段（segmenting）或分块（chunking）处理时，仍然需要保持原始上下文和意义。2. 数据检索困难：从大型非结构化数据集中检索相关数据段可能会耗费大量...……更多

2024-11-22 09:54:00银弹,数据,姿势,难度,解决方案,方案

蚂蚁井贤栋：通过专业智能体的深度连接，AI会像互联网一样带来

...具备专家知识水平。垂直领域、高质量的数据往往以多种模态存在，体系庞杂，比较分散，对隐私保护和资产价值保护的要求高，很难直接“喂给”通用大模型。井贤栋介绍，蚂蚁依托知识图谱、密态计算等技术，构建了大规模...……更多

2024-07-04 18:07:00代际,蚂蚁,深度,升级,互联网,智能

刘庆峰谈科大讯飞与华为合作：任正非高度重视，双方共同看好，非

...数”，也很清楚与GPT-4在小样本快速训练、复杂推理、多模态综合使用、长文本内容等方面还有差距。“国内大模型都有不小差距，那些说跟它差不多的，我觉得还是要更客观。要有科学精神，才能真正实现从追赶到超越。”刘...……更多

2023-10-25 21:02:00讯飞,华为,双方,高度,合作,讯飞

谷歌和微软两位“印度老乡”CEO，正面硬刚

...，不同于ChatGPT、GPT-4模型率先发布文本功能再逐渐扩充多模态功能，Gemini被设计为原生多模态大模型，从一开始就支持多模态输入输出。Pichai对此讲道：“就像人一样，它不仅从文本中学习，还能通过视频、音频和代码进行学习...……更多

2023-12-08 16:29:00印度,微软,老乡,正面,模型,微软

微软宣布Team Copilot发布，年内将推出初步预览版

...型GPT-4o，现已在AzureAIStudio中提供，并作为API提供。该多模态模型集成了文本、图像和音频处理能力，带来了全新的生成式和对话式AI体验。此外，由微软开发的Phi-3列AI小型语言模型（SLM）中的一种新型多模态模型Phi-3-vision现已...……更多

2024-05-22 20:01:00微软,微软,纳德拉,纳德,模型,功能

混合架构赋予AI人类推理能力

...AI)系统在编码、战略规划和机器人科学三个领域执行复杂推理任务。聊天生成预训练转换器(ChatGPT)和“克劳德3-奥普斯”(Claude 3 Opus)等大语言模型(LLM)，根据人类输入“提示词”处理和生成文本。研究人员说，过去18个月，这些技...……更多

2024-06-12 18:15:00推理,架构,混合,人类,能力,语言

京东探索研究院院长、京东科技人工智能业务负责人何晓冬：让大模

...犀大模型，经过不断升级，已从单一的语言处理走向了多模态能力，涵盖了语言、语音、图像、视频和数字人等。这一跨越，得益于京东在对话、语音、商品图像、视频、直播等多模态数据层面的训练积累以及包括BUTD Attention、A...……更多

2024-07-31 11:48:00京东,人工智能,院长,研究院,人工,模型

对话王田苗：万亿市场之下，大模型 + 机器人还有四大问题未解

...丰富物理和语义属性的物体。接着到 4 月，特斯拉推出多模态大模型 Grok-1.5v，利用端到端高速大模型 FSD 推理，有望连接数字世界与物理世界，解决自动驾驶边缘案例的在线迭代学习问题。硬氪：业界对机器人「大脑 + 小脑」路...……更多

2024-04-26 23:00:00机器人,模型,对话,机器,问题,市场

o1 基石论文火爆传阅：Ilya 仍是关键先生，核心项目清北

...后的贡献者。Ilya 在 o1 的作用 OpenAI o1 主打进行通用复杂推理，在输出回答之前，会在产生一个很长的思维链，以此增强模型能力。而 Ilya 此前合著的这篇论文主要就是探讨了提高大语言模型多步推理能力的方法。他们主要比较...……更多

2024-09-18 09:51:00基石,闪光,校友,火爆,核心,先生

人形机器人q系列亮相，一起来看看吧

...IT之家获悉，人形机器人攻关团队在中国科学院院士、多模态人工智能系统全国重点实验室主任乔红带领下，面向国家航天、制造产业等重大需求，基于“环境吸引域”高精度作业和类脑智能机器人理论等原始创新积累，自主突...……更多

2024-02-12 21:03:00人形,机器人,看吧,机器,机器人,机器

3岁智能人“通通”入选中关村论坛重大科技成果

...于认知架构，由价值和因果驱动的自主智能，能够通过多模态交互达到价值与人类对齐，具备透明、可解释的推理和决策过程。朱松纯告诉记者，“通通”的日常学习与训练使用不超过10块A100芯片，这意味着“通通”不依赖庞大...……更多

2024-04-26 11:07:00中关,中关村,科技成果,成果,智能,科技

全面叫板OpenAI！谷歌发布多模态大模型全家桶：从AI助手

...先一天后，科技巨头谷歌不甘示弱，推出了自己的最新多模态AI（人工智能）产品。当地时间5月14日，在谷歌I/O开发者大会上的主题演讲中，谷歌展示了由升级后Gemini模型驱动的AI助手项目Project Astra、对标Sora的文生视频模型Veo，...……更多

2024-05-15 09:54:00文生,模型,模态,全家,助手,视频

微软连发3款Phi-3.5模型：128K上下文，首用MoE架

...支持128k上下文长度。Phi-3.5-mini-instruct主要面向基础快速推理任务，Phi-3.5-MoE-instruct可胜任复杂推理任务，Phi-3.5-vision-instruct则兼具文本与视觉能力。性能最强大的Phi-3.5-MoE-instruct模型有419亿个参数，……更多

2024-08-22 09:49:00上下文,微软,架构,模型,上下,性能