通义,模型,尺寸,模型,训练,上下文头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...专家架构，超10TB tokens训练，覆盖大量合成数据，推理时上下文窗口达200K左右。云、端、边全栈大模型产品矩阵中，用于终端设备的“商汤端侧大模型”可满足各类终端用户对大模型技术的应用需求。“日日新5.0”和GPT-4回答趣...……更多

2024-04-24 09:32:00商汤,模型,升级,商汤,模型,推理

开源大模型新的里程碑！Llama 3.1 模型准时发布

...eta和Llama团队对开源的巨大贡献"。他表示："Llama3.1增加了上下文长度和改进了功能，是送给每个人的奇妙礼物。"图源：网络总的来说，Llama3.1模型有以下几个特点：1.包含8B、70B和405B三个尺寸，最大上下文提升到了128K，支持多语...……更多

2024-07-24 12:13:00模型,里程,里程碑,准时,模型,伯格

阿里云首席技术官周靖人：阿里云已搭建完善的AI大模型训练平台

...的快速的发展。”周靖人表示。据他介绍，继数月前发布通义千问1.0大模型后，今天下午阿里云将发布新的通义千问2.0大模型，进行更加重量级的升级，此外还会发布一系列的行业模型，有效的帮助开发者在各行各业利用人工智...……更多

2023-10-31 12:18:00阿里,首席,模型,训练,平台,技术

让大模型“外挂硬盘”，百川智能发布新API系列，企业定制成本

...，大模型是新时代的计算机，就如同中央处理器一样；而上下文窗口可以看做计算机的内存，存储了当下正在处理的文本。互联网实时信息与企业完整知识库，则共同构成大模型时代的硬盘。而基于搜索增强技术推出的API系列，...……更多

2023-12-21 15:32:00百川,外挂,模型,成本,硬盘,智能

对标or颠覆？Anthropic让创业者狠狠共情

...能力为优势的大模型，Claude3 Opus版本支持了 200K Tokens 的上下文窗口，并且可以处理100万Tokens 的输入。对于许多自然语言处理任务来说，例如机器翻译、摘要生成、问答系统等，长期依赖性是一个关键挑战，因为文本的含义通常...……更多

2024-03-08 15:00:00创业者,颠覆,狠狠,创业,人工智能,人工

姚期智院士大模型新研究：思维图DoT，用数学理论确保AI逻辑

...过程中在这些角色之间无缝切换，利用其自回归能力根据上下文预测下一个token。推理过程始于提议者引入一个命题，向DAG添加一个节点。然后，由评论者评估验证或提供批评。如果提供了批评，将添加一个新节点，并在该命题...……更多

2024-09-24 13:36:00维图,院士,逻辑,模型,一致,理论

史无前例！Seq2Seq和GAN同获NeurIPS时间检验奖

...码器（Encoder）：将输入序列逐步编码为一个固定长度的上下文向量。编码器逐一接收输入序列的元素（例如单词），并通过LSTM的隐藏状态逐渐生成该上下文向量。解码器（Decoder）：基于编码器生成的上下文向量，解码器逐步...……更多

2024-11-28 09:56:00获奖,检验,时间,生成,判别,生成器

三维天地AI智能体应用落地场景：敏感数据识别

...类型数据及其所在位置，难以提供更多与网络安全相关的上下文信息。数据安全管理人员不得不手动检查新记录并收集缺失的信息，这种依赖人工的方式不仅效率低下，很可能因人为疏忽引入错误，影响数据安全防护的准确性和...……更多

2025-08-06 17:14:00三维,落地,场景,智能,应用,天地

chatgpt爆火刷屏！华为称相关大模型领域早有布局

...通过学习和理解人类的语言来进行对话，并能根据聊天的上下文进行互动，真正像人类一样来聊天交流 ……更多

2023-02-10 13:39:00华为,布局,模型,领域,华为,模型

大模型「标王」硬气：不做Sora ，要帮更多企业做出Sora

...说地更具体点。训练 Vidu 大模型需要长序列训练和较大的上下文窗口，百舸创新提供了序列并行策略、显存优化策略，还支持超长上下文训练。作为结果，大模型训练中最费时间的渲染环节，效率提升了 3 倍。同时，通过优化数...……更多

2024-12-11 09:52:00标王,模型,更多,企业,模态,模型

无一大模型及格！北大/通研院提出超难基准，评估长文本理解生

...据集：LooGLE，专门用于测试和评估大语言模型（LLMs）长上下文理解能力。该数据集既能够评估LLMs对长文本的处理和检索能力，又可以评估其对文本长程依赖的建模和理解能力。结果不评不知道，一评估发现这些模型在复杂的长...……更多

2024-08-08 09:39:00基准,北大,生成,模型,文本,评估

超百项互动体验项目等你来打卡

...其境的震撼体验。阿里巴巴集团（展位号：7C11）打造的通义大模型互动体验区，设计了AIGC邮筒、通义App、钉钉AI助理等一系列场景应用体验项目。大家可以感受通义千问在创意文案、办公助理、学习助手、趣味生活等多方面的...……更多

2024-05-21 07:59:00打卡,体验,项目,展位,体验,数字

背水一战狙击GPT-4，谷歌最强大模型Gemini终发布，听

...…简单来说，越来越像一位真正的人类助手了。Gemini 1.0上下文窗口为32k，基于谷歌自家的TPUs v4 和 v5e进行大规模训练。这次，谷歌顺势推出了新的TPU 系统 Cloud TPU v5p，希望为训练AI模型的客户提供支持。△Google 数据中心内，一...……更多

2023-12-07 08:18:00全能,选手,模型,焦点,分析,模型

开源助推AI技术落地

...效捕捉局部信息和短依赖信息，使模型能够更精准地掌握上下文之间的强语义关联，学习人类语言习惯范式本质，大幅提升数理逻辑、数学计算、代码生成能力。浪潮信息于2021年9月在业界率先推出了中文人工智能（AI）巨量模...……更多

2023-12-04 03:07:00助推,落地,技术,模型,数据,浪潮信息

36氪晚报｜支付宝已申请社交关系处理专利；TikTok商店将

...道宣布将开源有道速读背后的RAG引擎“QAnything”。阿里云通义千问APP上线免费功能“通义舞王”36氪获悉，阿里云通义千问APP上线免费功能“通义舞王”，用户在通义千问APP内输入“通义舞王”“全民舞王”等口令后，即可进入...……更多

2024-01-04 17:39:00英特,立新,英特尔,佣金,美国,社交

腾讯Angel机器学习平台获世界互联网大会领先科技奖

...的开源MoE模型混元Large，总参数量 389B，激活参数量 52B ，上下文长度高达256K，其训练和推理均基于腾讯Angel机器学习平台。 ……更多

2024-11-21 14:04:00科技奖,腾讯,机器,领先,大会,互联网

中国电信人工智能研究院携手智源研究院推动开源社区发展

...司大语言模型3-80亿参数版本），在中文上优于Qwen1.5-72（通义千问1.5-72）。经过微调的对话模型进行了客观、自动化的能力评测，评测结果显示，总分上Tele-FLM完成了对GPT-3.5-Turbo的超越。在分项得分中，Tele-FLM在总共的11个分项中...……更多

2024-04-30 20:00:00研究院,中国电信,研究,人工智能,中国,人工

同济大学首发专属大模型ChatTJ

...操作记录)进行分析与计算，以便更好地理解所提问题和上下文语境，从而提供更具有相关性的信息。同时，大模型还会基于所收集的数据以及模型生成的对应回复，用于模型训练，从而不断调整优化模型的效果。后续还将扩展...……更多

2024-06-11 20:00:00同济大学,同济,模型,大学,同济,同济大学

Meta推出Llama 3，号称“最强开源大模型”

...这比Llama2使用的数据集大7倍，代码也多出4倍，支持的8K上下文长度也是Llama2容量的两倍。Llama3与竞争对手的对比Meta还在Llama3的开发中采用了多种创新技术，包括数据并行化、模型并行化和管道并行化，极大提高了训练效率。同...……更多

2024-04-20 19:17:00模型,模型,越来,多语,版本,伯格

马斯克承诺开源版大模型来了！Grok-1：3140亿参数迄

...2 个。旋转位置嵌入大小为 6144，与输入嵌入大小相同。上下文长度为 8192 tokens，精度为 bf16。此外还提供了一些权重的 8bit 量化内容。当然，我们还是希望 xAI 官方能够尽快公布 Grok-1 的更多模型细节。Grok-1 是个什么模型？能...……更多

2024-03-18 11:51:00马斯,马斯克,权重,架构,模型,参数

全球最强开源大模型Llama 3发布：使用15T数据预训练，

...几个月中，他们预计将推出新功能（如多模态）、更长的上下文窗口、更多不同大小版本的模型和更强的性能，以及 Llama 3 研究论文。另外，Llama 3 模型将很快在 AWS、Databricks、Google Cloud、Hugging Face、Kaggle、IBM WatsonX、Micr……更多

2024-04-20 11:03:00模型,训练,参数,数据,全球,模型