多语,大规,模型,语料,基准,大规模头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

媲美OpenAI事实性基准，这个中文评测集让o1-previ

...（具体详见论文）。得出了以下几个有见地的发现：1. 更大规模的模型有更好的校准性能我们要求模型在回答问题时提供 0 到 100 的信心指数，以衡量模型的校准程度，即模型对其答案的自信程度。理想的校准模型应该是信心指...……更多

2024-11-21 09:43:00事实性,基准,中文,评测,事实,模型

谷歌再出大招，发布最新开源大模型Gemma，笔记本上即可运行

...直接在笔记本电脑上运行。性能表现方面，Gemma7B在MMLU（大规模多任务语言理解）测试中取得了64.3%的高分，而之前的佼佼者Mistral7B得分为62.5%，Meta的Llama-27B和13B模型也有所不及。此外，Gemma还在HuggingFace和HuggingChat平台上上线……更多

2024-02-23 09:18:00模型,运行,笔记本,笔记,模型,人工智能

腾讯推出新一代大模型“混元Turbo”，性能大幅提升，定价低

...在中国电子学会2023科学技术奖评选中，腾讯混元《面向大规模数据的Angel机器学习平台关键技术及应用》获科技进步一等奖。基于领先的模型能力积累，腾讯混元大模型正在积极推进内部应用落地，让大模型创造更多价值，目前...……更多

2024-09-05 17:29:00腾讯,新一代,模型,定价,性能,腾讯

腾讯版“GPT-4o”来了！混元Turbo首发并上线，效率翻

...产品（简称“5T”），兼容国内主流的芯片厂商，在多个大规模的集群上稳定运行，落地覆盖金融、交通、政务、互联网、医疗、传媒等多个行业，积累了丰富的融合创新实践。数据库TDSQL产品能力不断突破，能提供业界领先的...……更多

2024-09-06 10:00:00腾讯,效率,价格,腾讯,模型,企业

安全强化学习方法、理论与应用综述，慕工大、同济等深度解析

...而言比 MuJoCo 和 Robosuite 要快至少十倍。该环境主要用于大规模多智能体任务中的安全学习。五、应用、挑战与展望应用前景安全强化学习在许多关键领域都有着广泛的应用前景：自动驾驶：通过安全强化学习算法，可以在复杂...……更多

2024-10-09 09:51:00同济,学习方法,深度,理论,方法,应用

CVPR’24 Navsim挑战赛冠军方案！

...种新型的端到端自动驾驶框架 Hydra-MDP。在 CVPR 2024 NAVSIM（大规模端到端驾驶）挑战赛中，Hydra-MDP 获得了第一名和创新奖，并且在 nuPlan 基准测试中的表现优于当前最先进的规划器。 Hydra-MDP 框架采用新颖的多教师、学生-教师知...……更多

2024-09-06 10:00:00挑战赛,冠军,方案,驾驶,规划,范式

中国科技创新“乘”数直上

...飞星一号”平台，在此基础上，讯飞星火大模型开启了更大规模的训练。目前，基于“飞星一号”的讯飞星火V3.5已完成训练，并于1月30日发布。升级后的讯飞星火V3.5在逻辑推理、语言理解、文本生成、数学答题、多模态等方...……更多

2024-02-09 06:29:00科技创新,中国,科技,数据,模型,讯飞

北大林宙辰团队全新混合序列建模架构MixCon：性能远超Ma

... MMLU、BBH），采用不同的学习策略。MixCon 性能与类似或更大规模的先进公开模型相当或更优，尽管总参数比 Llama - 2 少，但作为稀疏模型，其活跃参数仅 5B，处理长序列时 KV 缓存仅需 2GB，而 Mixtral 需 32GB（如表 2 所示）。消融实...……更多

2024-10-16 13:34:00序列,架构,北大,混合,团队,性能

百融云创荣获“2024大模型创新应用奖”

...复杂和庞大的网络结构、更多的参数和更深的层数。但更大规模，并不等于更强模型能力。产业大模型考验的是算力+行业know-how+模型精调的综合能力。其中行业know-how尤为关键，这是专家经验、行业知识、组织能力、工程能力的...……更多

2024-09-25 11:51:00模型,应用,模型,知识,知识库,行业

MMMU华人团队更新Pro版！多模态基准升至史诗级难度：过滤

...以提高性能。MMMU-Pro：更健壮的MMMU重新审视MMMU基准测试大规模多学科多模态理解和推理（MMMU）基准测试是一个综合性的数据集，能够评估多模态人工智能模型在需要特定学科知识和深思熟虑推理的大学水平任务上的表现。MMMU由...……更多

2024-09-18 13:31:00模态,史诗,基准,难度,问答,文本

首个支持普通话和方言混说的TTS大模型：河南话、上海话说得溜

...方言语音合成。2.精细化 Token 对齐技术：我们提出了基于大规模多模态预训练的精细化 token-wise 对齐技术。3.层次混合专家结构：我们设计了一种层次混合专家体系结构，用于学习多个汉语方言的统一表示和每种方言的特定表示...……更多

2024-08-14 09:38:00河南,上海,方言,普通话,模型,话说

网易有道高级副总裁刘韧磊博鳌谈“AI+教育”：人工智能在教育

...然场景，人工智能在教育领域的应用前景非常广阔，能让大规模因材施教成为可能。继全球首个虚拟人口语教练Hi Echo后，有道近期也将推出一款全新大模型应用，更好地助力学习效率提升。3月26日至29日，博鳌亚洲论坛2024年年...……更多

2024-03-28 12:09:00博鳌,教育,人工智能,网易,副总,人工

更快、更强、更经济！港大开源大模型RAG系统LightRAG

...完善，很多学者的目光聚焦于如何帮助大模型处理和感知大规模的私有数据库。RAG（Retrieval-Augmented Generation）系统采用检索方法，从私有数据库中高效、准确地召回与查询高度相关的信息内容，用以增强通用大模型处理查询的语...……更多

2024-10-15 09:57:00更快,模型,经济,系统,检索,数据

清华提出时间序列大模型：面向通用时序分析的生成式Transf

...于起步阶段。近期，清华大学的研究团队基于Transformer在大规模时间序列上进行生成式预训练，获得了任务通用的时序分析模型，展现出大模型特有的泛化性与可扩展性时间序列提供了数据随时间变化的视角，对于理解复杂系统...……更多

2024-07-22 09:44:00时间序列,时序,清华,序列,生成,模型

文生图参数量升至240亿！Playground v3发布：深

...上甚至超越了人类设计师，同时支持精确的RGB颜色控制和多语言识别。自去年以来，文本到图像生成模型取得了巨大进展，模型的架构从传统的基于UNet逐渐转变为基于Transformer的模型。Playground Research最近发布了一篇论文，详细...……更多

2024-10-08 09:48:00文生,图形设计,深度,图形,人类,参数

通义千问再放大招：720亿大模型开源，全尺寸赶上LLaMA-

...产品模型。当时，阿里云就已经预告，接下来还要再发更大规模的开源模型。12月1日，三款新模型如约而至——包括Qwen-72B、Qwen-1.8B和Qwen-Audio大模型，通义千问大模型也升级到了2.1版本。最受瞩目的首先是Qwen-72B，参数达到720亿...……更多

2023-12-01 21:07:00通义,模型,尺寸,移动,模型,阿里

易联众发布民生信息服务大模型平台,助推民生事业提质增效

...等细分业务场景出发,引入具体行业知识和业务逻辑进行大规模自学习训练,自动挖掘行业知识,进而提高大模型的准确度和专业性。此外,易联众“智鼎云帆”行业大模型融合“智鼎天宫AI平台”已有的AI原子能力,可通过行业插件、...……更多

2024-03-18 10:00:00民生,联众,助推,模型,事业,服务

AI圈卷疯了！xAI、Anthropic同日上线API：Gr

...应迅速的聊天机器人，能够处理大量用户互动。这对需要大规模互动的客户服务、电商和教育平台尤为有价值。 3. 数据提取和标注：Claude 3.5 Haiku能够高效处理和分类信息，使其在快速数据提取和自动化标注任务中表现出色。此...……更多

2024-11-06 09:44:00公测,价格,模型,公测,价格,性能

AI大模型“国标”首批测试结果公布，人工智能成市场新焦点

...批通过测试。测试结果称，上述四款模型符合《人工智能大规模预训练模型第2部分：评测指标与方法》语言大模型的相关技术要求，通用性、智能性等维度达到国家相关标准。该测试由工信部中国电子技术标准化研究院发起，...……更多

2023-12-26 14:16:00人工智能,国标,人工,模型,结果,智能

谷歌Gemini大模型的“先进”表现如何？一文告诉你

...了超越当前时代的“先进结果”，成为第一个在MMLU上（大规模多任务语言理解）超过人类专家的模型。该模型在数学、物理、历史、法律、医学和伦理等57个学科上取得了90.0%的成绩。明年初，谷歌还将推出全新升级的Bard Advanced...……更多

2023-12-09 17:02:00一文,模型,先进,模型,视频,提示

OpenAI掀小模型血战！苹果DCLM强势登场，碾压Mist

...B模型的指令微调版本，在数学推理任务GSM8K上的性能实现大规模提升，分数由原来的2.1直接飙到52.5。https://huggingface.co/apple/DCLM-7B-8k除了7B版本，1.4B版本也同步上线。神奇的是，训练数据量相比7B版本不降反增，多了0.1T。https://……更多

2024-07-22 09:41:00血战,强势,模型,苹果,模型,数据