模型,逻辑推理,中文,推理,逻辑,国产头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...始在一些权威评测中取得领先。今天，国内首款具备中文逻辑推理能力的 o1 模型来了，它便是由昆仑万维推出的「天工大模型 4.0」 o1 版（英文名：Skywork o1）。这也是近一个月来，该公司在大模型及相关应用上的第三次大动作...……更多

2024-11-28 10:00:00模型,逻辑推理,中文,推理,逻辑,国产

大模型降价背后，国产大模型的竞争逻辑变了

配图来自Canva可画随着人工智能技术的快速发展，大模型以其强大的数字处理能力和深度学习能力，不断与各领域交叉融合，逐步成为产业创新的关键抓手，和驱动新质生产力的关键引擎。据国家最新公布的数据显示，截至今年...……更多

2024-05-29 09:29:00模型,逻辑,背后,国产,竞争,模型

重磅！TeleAI 完成首个全国产化万卡万参大模型训练

...一在今年5月的 OpenCampass 测试榜单中，TeleChat 系列模型的逻辑推理能力名列开源大模型榜单第一。作为新一代版本，TeleChat2-115B 在9月最新公布的 C-Eval 评测 Open Access 模型综合榜单中，以 86.9 分的成绩排名第一。其通用能力较 Tele……更多

2024-09-30 09:50:00万卡,重磅,模型,国产,训练,模型

奥林匹克竞赛里选最聪明的AI：Claude-3.5-Sonn

...竞赛不仅是对人类（碳基智能）思维敏捷性、知识掌握和逻辑推理的极限挑战，更是AI（“硅基智能”）锻炼的绝佳练兵场，是衡量AI与“超级智能”距离的重要标尺。OlympicArena——一个真正意义上的AI奥运竞技场。在这里，AI不...……更多

2024-06-25 09:45:00奥林,奥林匹克,竞赛,模型,推理,能力

360智脑7b参数模型采用3.4万亿tokens训练

...包括自然语言理解、知识、数学计算和推理、代码生成、逻辑推理等。其中360模型在四个评测数据集上达到第一，平均分为第三。在LongBench（多任务、中英双语、针对大语言模型长文本理解能力的评测基准）测试中，360选择其中...……更多

2024-04-14 01:04:00模型,训练,参数,模型,文本,评测

让OpenAI o1逆天的慢思考，360两月前就做出来了？周

...势以外，CoE模型在其余11项指标上均优于GPT-4o，特别是「逻辑推理」、「多步推理」、「诗词赏析」这类比较具有中文特色的问题，CoE的领先优势更加明显。目前，360的「多模型协作」已经能打败并远远甩开GPT-4o，媲美o1-preview。...……更多

2024-09-21 09:50:00周鸿,前瞻,应用,模型,推理,协作

智源评测体系发布国内外“百模”评估结果出炉

...存在一定的偏差。当前，大模型的发展具备了通用性，在逻辑推理能力上有显著提升，日趋接近人脑的特征。因此，在海淀区教委支持下，智源研究院联合与海淀区教师进修学校对齐学生测验方式，考察大模型与人类学生的学科...……更多

2024-05-17 17:26:00评测,评估,体系,结果,模型,评测

港中文团队提出大模型元推理范式，革新大模型的评价体系

...院工作过一段时间。在 ChatGPT 面世以后，他意识到针对大模型的研究范式存在一定的不足，于是决定来到香港中文大学读博。图 | 曾忠燊（来源：曾忠燊）前不久，曾忠燊和所在团队提出一个全新评测范式。基于这一评测范式，...……更多

2024-03-04 10:23:00革新,模型,范式,中文,推理,团队

商汤又“夺金”！SuperCLUE-V多模态大模型基准发布1

...度30个二级维度。报告称SenseChat-Vision 5.5在基础能力-数理逻辑推理任务如图表推理、场景推理方面具备领先优势。榜单显示，在数理逻辑分析能力中，SenseChat-Vision 5.5超越国内外所有参评模型包括GPT-4o的最新版本，位列第一。Super...……更多

2024-10-14 13:34:00商汤,模态,基准,模型,模型,能力

百川智能发布baichuan3稳定语言模型

...语言处理和代码生成领域的强大实力。不仅如此，其在对逻辑推理能力及专业性要求极高的MCMLE、MedExam、CMExam等权威医疗评测上的中文效果同样超过了GPT-4，是中文医疗任务表现最佳的大模型。Baichuan3还突破“迭代式强化学习”...……更多

2024-01-29 19:57:00百川,模型,语言,智能,模型,百川

深数所发布500个行业多模态算料集

...“深数所”）发布了500个垂直行业多模态算料集，按照大模型应用的不同阶段（训练、推理、调优），有的放矢地提供数据源，让国产大模型厂商“寻数有路”。此次深数所发布的首批500个人工智能大模型高质量训练数据集，由...……更多

2024-04-13 01:58:00模态,行业,数据,模型,模态,人工智能

国产大模型加速落地，争夺“中国版ChatGPT”心智定位

从创业狂潮到争相落地，国产大模型进入了新的竞争阶段。5月7日，零一万物官宣了一站式AI工作平台——万知。据官方介绍，万知可以帮助用户做会议纪要、周报、写作助手，还可以解读财报、论文等各类文件，也可以实现PPT...……更多

2024-05-07 18:33:00心智,中国,落地,模型,定位,国产

国产模型指令跟随全球第一！来自LeCun亲推的最难作弊LLM

...方都是谁。模型辩论，主要靠的是信息理解、知识整合、逻辑推理、语言生成和对话能力。当然了，同时还能测复杂语境中信息的处理深度和迁移应变能力，反映其学习与推理的进步水平。浅玩了一下，有些议题还蛮有意思。比...……更多

2024-11-22 09:54:00指令,模型,国产,全球,模型,模态

位列第一梯队，腾讯混元再度领跑国内大模型

...、多维度的综合性测评基准，由十大基础任务组成，包括逻辑推理、代码、语言理解、长文本、角色扮演等。本次报告选取了国内外具有代表性的32个大模型4月份的版本，通过多维度综合性测评，真实准确地反映了国内外大模型...……更多

2024-05-06 16:52:00腾讯,梯队,模型,腾讯,模型,能力

赋能行业创新发展！浪潮海若大模型正式通过备案

...加持的行业安全可信大模型，具备生成创作、多轮对话、逻辑推理等多项核心能力，通过海量通用数据与行业特有数据融合，更好的适应行业客户的业务需求，推动大模型在政企行业场景的精准落地。面向行业的安全可信行业专...……更多

2023-12-19 14:04:00海若,浪潮,模型,发展,行业,模型

推理性能直逼o1，DeepSeek再次出手，重点：即将开源

...了，这次又是重磅炸弹。昨晚，DeepSeek 上线了全新的推理模型 DeepSeek-R1-Lite-Preview，直接冲击 OpenAI o1 保持了两个多月的大模型霸主地位。在美国数学竞赛（AMC）中难度等级最高的 AIME 以及全球顶级编程竞赛（codeforces）等权威评...……更多

2024-11-22 09:50:00推理,性能,再次,重点,模型,推理

云天励飞发布14nm Chiplet大模型推理芯片

...总经理陈宁介绍，DeepEdge10是国内首创的国产14nm Chiplet大模型推理芯片，采用自主可控的国产工艺，内含国产RISC-V核，支持大模型推理部署。依托自研芯片DeepEdge10创新的D2D chiplet架构打造的X5000推理卡，已适配并可承载SAM CV大模型...……更多

2023-11-16 18:36:00云天,推理,芯片,模型,芯片,云天

大语言模型逻辑推理“很糟糕”

...个只有8%。研究人员根据答案是否正确以及答案所包含的逻辑推理是否有效，对大语言模型的答案进行了分类。实验的第一个结果是，在每个测试重复十次的情况下，答案是不一致的。例如，在同一个测试中，有的模型十次中答...……更多

2024-06-12 18:15:00逻辑推理,推理,逻辑,模型,语言,模型