模型,训练,参数,模型,文本,评测头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

苹果发布mm1.5-ui模型

...13日消息，近日，苹果公司推出了300亿参数的多模态AI大模型MM1.5，该版本是在前代MM1的架构基础上发展而来的。该模型继续遵循数据驱动的训练原则，着重探究在不同训练周期中混合各类数据对模型性能产生的影响，相关模型文...……更多

2024-10-13 10:57:00模型,苹果,模型,苹果公司,数据,苹果

面壁智能发布2B模型：适配主流手机，推理成本仅为GPT-4的

文 | 周鑫雨编辑 | 邓咏仪当大模型加速应用落地，运行成本就成为各厂商的现实考量。将模型做小，成为现实市场需求下的趋势。但模型的Scaling Law（规模定律）已指出，参数规模是决定模型性能的最关键因素。如何用更小的参...……更多

2024-02-03 16:03:00适配,推理,模型,主流,成本,智能

AI大模型“国标”首批测试结果公布，人工智能成市场新焦点

12月22日，国内首个官方“大模型标准符合性评测”结果公布，百度文心一言、腾讯混元大模型、360智脑、阿里云通义千问四款国产大模型首批通过测试。测试结果称，上述四款模型符合《人工智能大规模预训练模型第2部分：评...……更多

2023-12-26 14:16:00人工智能,国标,人工,模型,结果,智能

阿里通义实验室黄斐：开源进入千问时代，即将发布的推理模型会更

阿里通义千问已成全球第一大开源模型系列，将“很快”放出基于最新模型Qwen2.5-Max的推理模型。2月21日，全球开发者大会（GDC）在上海开幕，在阿里云魔搭社区主办的论坛上，据阿里巴巴通义实验室科学家黄斐介绍，到目前为...……更多

2025-02-21 23:22:00通义,阿里,推理,实验室,模型,实验

Kimi爆火背后：访问量仅次于文心一言和阿里通义，国内外大模

...念股因此连续拉出三个涨停。这背后是由一款叫Kimi的大模型产品催化，其是国内大模型初创公司月之暗面发布的一款面向C端的大模型产品。早前，该公司宣布在大模型长上下文窗口技术上取得新的突破，Kimi已支持200万字超长无...……更多

2024-03-23 14:00:00卷上,通义,阿里,文心,下文,模型

鄂维南院士领衔新作：大模型不止有RAG、参数存储，还有第3种

2.4B 的 Memory3比更大的 LLM 和 RAG 模型获得了更好的性能。近年来，大型语言模型 (LLM) 因其非凡的性能而获得了前所未有的关注。然而， LLM 的训练和推理成本高昂，人们一直在尝试通过各种优化方法来降低成本。本文来自上海算...……更多

2024-07-11 09:33:00维南,领衔,院士,新作,模型,存储

Mistral放大招！124B多模态巨无霸登场，免费版Cha

...了！一连发布两大更新——Pixtral Large：前沿级124B多模态模型，用于驱动新Le Chat。全新Le Chat：具备网页搜索、Canvas、图像生成、图像理解等功能——而且所有功能免费提供！Mistral的CEO兼联创Arthur Mensch宣布道：「此次发布是一个...……更多

2024-11-20 09:43:00巨无霸,免费版,模态,突袭,模型,生成

透视2025丨中国AI模型厂商已在特定领域形成一定优势

...果、微软，苹果推出Apple Intelligence AI系统等等。而在AI大模型方面，最主要事件则是OpenAI推出多模态大模型ChatGPT-4o，这一版本具有实时处理和生成文本、音频以及图像等多种模态的能力，被誉为技术上一个巨大突破。事实上，中...……更多

2024-12-26 21:56:00中国,模型,厂商,优势,领域,模型

让大模型“外挂硬盘”，百川智能发布新API系列，企业定制成本

...爆全球AI浪潮以来，AI圈子已经迅速走过了造出了通用大模型的第一道关卡，如今最关键的问题在于——如何让大模型高效地在实际应用场景中落地？百川智能的最新实践是：用大模型+增强技术，可以大大提升企业应用大模型的...……更多

2023-12-21 15:32:00百川,外挂,模型,成本,硬盘,智能

非Transformer架构站起来了!首个纯无注意力大模型,

Mamba 架构的大模型又一次向 Transformer 发起了挑战。Mamba 架构模型这次终于要「站」起来了？自 2023 年 12 月首次推出以来，Mamba 便成为了 Transformer 的强有力竞争对手。此后，采用 Mamba 架构的模型不断出现，比如 Mistral 发布的首...……更多

2024-08-14 09:39:00力大,架构,模型,模型,架构,训练

多样任务真实数据，大模型在线购物基准Shopping MML

谁是在线购物领域最强大模型？也有评测基准了。基于真实在线购物数据，电商巨头亚马逊终于“亮剑”——联合香港科技大学、圣母大学构建了一个大规模、多任务评测基准Shopping MMLU，用以评估大语言模型在在线购物领域的...……更多

2024-11-21 09:45:00在线购物,基准,模型,任务,购物,数据

观察｜手机厂商“卷”大模型，人工智能会是下一个竞争赛道吗

手机厂商也加入了“大模型”赛道。11月1日，vivo在开发者大会上正式发布了自研通用大模型矩阵——蓝心大模型BlueLM，以及智能辅助应用“蓝心小V”和以公版App形式推出的自然语言对话机器人“蓝心千询”。科技公司不能错失...……更多

2023-11-02 21:20:00人工智能,赛道,人工,模型,观察,厂商

火出圈的Kimi，AI营销背后的产品逻辑

...竞争中，市场同质化严重，尤其在风口上的AI创投圈，大模型更不例外，大家都在晒参数，公布评测数据集，讲开源闭源，一顿猛如虎的操作，大众用户根本无法对某一个大模型留下特定的记忆，更别谈知道他们的优势了，最多...……更多

2024-04-07 13:56:00逻辑,背后,营销,产品,用户,对话

通义千问系列AI开源模型升至Qwen2：5个尺寸，最高 12

...息，通义千问（Qwen）今天宣布经过数月的努力，Qwen 系列模型从 Qwen1.5 到 Qwen2 的重大升级，并已在 Hugging Face 和 ModelScope 上同步开源。IT之家附上 Qwen 2.0 主要内容如下：5 个尺寸的预训练和指令微调模型，包括 Qwen2-0.5B、……更多

2024-06-07 09:32:00通义,模型,尺寸,模型,训练,上下文

轻量化模型架构catvton的优势在哪里

...在话下。来自中山大学、Pixocial等机构联合发布轻量化模型架构CatVTON。他们是以StableDiffusionv1.5inpainitng为基础模型。来看看更多效果。用扩散模型进行虚拟试衣CatVTON可以实现传统平铺服装图到人物的换装。不管是上衣、裤子、...……更多

2024-08-01 08:52:00架构,模型,优势,模型,训练,模块

智谱AI新一代基座大模型GLM-4在司南评测中跻身前列，位居

1月30日，上海人工智能实验室发布了大模型开源开放评测体系司南（OpenCompass 2.0），同时揭晓了2023年度大模型公开评测榜单，GPT-4 Turbo在各项评测中均获最佳表现，智谱AI新一代基座大模型GLM-4紧随其后，排名第二。上海人工智...……更多

2024-02-04 14:00:00司南,基座,前列,新一代,模型,评测

腾讯推出 Hunyuan-Large 开源大模型

IT之家11月5日消息，腾讯今日宣布推出Hunyuan-Large大模型，官方表示这是目前业界已经开源的基于Transformer的最大MoE模型，拥有3890亿总参数（389B）和520亿激活参数（52B）。腾讯今日在HuggingFace开源了Hunyuan-A52B-Pretrain、Hun……更多

2024-11-05 18:56:00腾讯,模型,模型,长上,腾讯,训练