逻辑推理,新论,推理,缺陷,逻辑,模型头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

百川智能发布baichuan3稳定语言模型

...语言处理和代码生成领域的强大实力。不仅如此，其在对逻辑推理能力及专业性要求极高的MCMLE、MedExam、CMExam等权威医疗评测上的中文效果同样超过了GPT-4，是中文医疗任务表现最佳的大模型。Baichuan3还突破“迭代式强化学习”...……更多

2024-01-29 19:57:00百川,模型,语言,智能,模型,百川

香港金融科技周|度小满CEO朱光：推理大模型将深入到金融核心

...布了GPT-o1大模型，“思考能力”显著提升，能够进行复杂逻辑推理和问题拆解。在本次大会上，朱光也分享了度小满用推理大模型在风控场景上做的一些创新性探索。在信贷领域，推理大模型可以通过分析客户的征信报告、银行...……更多

2024-11-21 13:55:00金融,香港,推理,模型,核心,业务

火山引擎谭待：大模型的超低定价，来自对技术的信心

...大模型的超低价格引发行业震动。据悉，豆包主力模型的推理输入价格只有0.0008元/千Tokens，比行业便宜99.3%。对此，谭待坦言，“降价是用技术优化成本来实现的。如果只是补贴，用亏损换收入是不可持续的，火山引擎不会走这...……更多

2024-05-16 11:29:00火山,模型,定价,信心,引擎,技术

人工智能的真面目到底是什么？是数学、逻辑学，还是计算机科学？

...在人工智能中发挥着重要作用。早期的专家系统就是基于逻辑推理构建的。逻辑学提供了一种形式化的方法来描述和推理世界，使得计算机能够模拟人类的思维方式进行推理和决策。虽然现代的深度学习技术已经不再直接使用逻...……更多

2024-08-05 09:46:00逻辑学,人工智能,真面目,人工,逻辑,数学

重磅！TeleAI 完成首个全国产化万卡万参大模型训练

...一在今年5月的 OpenCampass 测试榜单中，TeleChat 系列模型的逻辑推理能力名列开源大模型榜单第一。作为新一代版本，TeleChat2-115B 在9月最新公布的 C-Eval 评测 Open Access 模型综合榜单中，以 86.9 分的成绩排名第一。其通用能力较 Tele……更多

2024-09-30 09:50:00万卡,重磅,模型,国产,训练,模型

RAG没有银弹！四级难度，最新综述覆盖数据集、解决方案，教你

...成到LLMs中的三种主要方式。从简单的事实检索到复杂的推理任务，每个级别都有其独特的难点和解决方案，需要不同的技术和方法来优化性能。受参数量和知识更新的限制，大模型在执行很多真实场景下的任务时，都需要连接...……更多

2024-11-22 09:54:00银弹,数据,姿势,难度,解决方案,方案

位列第一梯队，腾讯混元再度领跑国内大模型

...、多维度的综合性测评基准，由十大基础任务组成，包括逻辑推理、代码、语言理解、长文本、角色扮演等。本次报告选取了国内外具有代表性的32个大模型4月份的版本，通过多维度综合性测评，真实准确地反映了国内外大模型...……更多

2024-05-06 16:52:00腾讯,梯队,模型,腾讯,模型,能力

云天励飞发布14nm Chiplet大模型推理芯片

...理陈宁介绍，DeepEdge10是国内首创的国产14nm Chiplet大模型推理芯片，采用自主可控的国产工艺，内含国产RISC-V核，支持大模型推理部署。依托自研芯片DeepEdge10创新的D2D chiplet架构打造的X5000推理卡，已适配并可承载SAM CV大模型、Lla...……更多

2023-11-16 18:36:00云天,推理,芯片,模型,芯片,云天

面壁智能发布2B模型：适配主流手机，推理成本仅为GPT-4的

...在MMLU（多任务语言理解）、Knowledge（知识）、Reasoning（推理）、Comprehension（理解）等关键指标上均超越了Meta Llama 2的13B模型。这一个故事，在2024年2月1日的发布会上，也被AI模型层公司面壁智能的CEO李大海不断提起。对标Mistral..……更多

2024-02-03 16:03:00适配,推理,模型,主流,成本,智能

面壁智能发布开源大模型eurux-8x22b

...大规模、高质量的对齐数据集，包含了覆盖数学、代码和逻辑推理问题的12个开源数据集的86K条指令和220K偏好对，共有五十万条左右数据。 ……更多

2024-05-04 08:57:00模型,智能,测试,数据,模型,推理

9.11比9.9大？多个大模型翻车！业内人士：就是偏科，文科

...文认为，模型产生幻觉的三大来源：数据源、训练过程和推理。大模型可能会过度依赖训练数据中的一些模式，如位置接近性、共现统计数据和相关文档计数，从而导致幻觉。此外，大模型还可能会出现长尾知识回忆不足、难以...……更多

2024-07-17 20:56:00理科,文科,业内人士,模型,业内,多个

Sam Altman或筹数十亿美元自造AI芯片，DeepMi

...功证明了AI在解决复杂数学问题上的巨大潜力，尤其是在逻辑推理和证明方面。8.大模型自我奖励：Meta让Llama2自己给自己微调，性能超越了GPT-4Meta和纽约大学的研究团队最近提出了一种创新的“自我奖励语言模型”方法，使得微...……更多

2024-01-29 09:20:00首席,科学家,芯片,创业,科学,模型

商汤科技与金山办公达成商业合作，“日日新”大模型补强办公软件

...力一直是大模型的痛点，理科领域需要高度的抽象思维和逻辑推理能力，并且要求非常精准的答案，作为计算机科学和信息技术领域的重要工具，代码能力被视作衡量大模型智慧的关键维度。事实上，在过去一年国产大模型如火...……更多

2024-04-12 15:11:00商汤,办公,补强,金山,办公软件,理科

OpenAI o1太贵？那就自己做一个！纯提示方法让普通LL

...爆火，利用纯提示方法让普通LLM摇身一变，成为具备复杂推理能力的OpenAI o1。九月份，OpenAI o1正式登场。作为新一代的老大哥，o1系列专注于复杂的推理任务，一经推出也是直接屠榜了大模型竞技场。在下面这些难度较大的数学...……更多

2024-11-08 09:43:00太贵,推理,进化,提示,能力,方法

ICML2024演讲爆火!Meta朱泽园揭秘大模型内心世界:

...M) 是如何解数学题的？是通过模板记忆，还是真的学会了推理思维？模型的心算过程是怎样的？能学会怎样的推理技能？与人类相同，还是超越了人类？只学一种类型的数学题，是会对通用智能的发展产生帮助？LLM 为什么会犯...……更多

2024-08-06 09:27:00推理,模型,内心,人类,世界,模型

如何让大模型输出更精准、更可靠的结果？

...拥有强大的知识长期记忆和理解关联能力，能进行复杂的逻辑推理和概念关联，从而生成更深入的解析和推断。这使得大模型兼具专业性、精准性、可追溯三大优势。01专业性RAG如同给大模型开了一个外挂，让它在回答问题之前...……更多

2024-05-13 15:03:00输出,模型,结果,模型,博坦,知识

专注于推理的OpenAI“草莓”模型两周内发布？是人工智能下

...“秋季发布”（9月至11月）要更早。上述报道称，专注于推理能力的人工智能“草莓”发布前后还有一些亟待解决的问题，但看似“仓促上马”似乎说明OpenAI感受到了大语言模型驱动产品领域的激烈竞争压力，希望通过近几个月...……更多

2024-09-11 09:55:00人工智能,推理,草莓,人工,模型,突破

AI推理速度提升超10倍，Groq LPU能否取代英伟达GP

...美国人工智能初创公司Groq最新推出的面向云端大模型的推理芯片引发了业内的广泛关注。其最具特色之处在于，采用了全新的Tensor Streaming Architecture (TSA) 架构，以及拥有超高带宽的SRAM，从而使得其对于大模型的推理速度提高了1...……更多

2024-02-21 14:03:00英伟,推理,速度,加速卡,内存,芯片

绿军or小牛，瞎蒙只是一种感觉

...人工智能所基于的模型是常规的大数据收集和按类别进行逻辑推理，这是绝大多数从业者使用的通用模型。人类的阅读量远远不如人工智能，所以在数据收集上肯定比不过人工智能，但是人类有一个特性是人工智能永远比不上的...……更多

2024-06-07 17:46:00小牛,只是,感觉,季后赛,凯尔,凯尔特

真香！智谱大模型，有了首个免费的API

...性的同时增加多样性）。体验地址：https://open.bigmodel.cn/逻辑推理能力，从简单到复杂，包含一般逻辑推理和数学推理。测试 1：先来一道前段时间让很多大模型翻车的「9.11 和 9.9 哪个更大」问题，很容易就答对了。类似的数字...……更多

2024-08-28 09:43:00真香,模型,模型,能力,应用,开发

科大讯飞股价跌停，市值蒸发120亿元

...为单位数，提升最多的是代码能力，仅有提升9%，其次是逻辑推理（8%），文本生成、知识问答、多模态能力则均只有7%。此前科大讯飞在8月15日发布星火V2.0时，七大能力大幅度提升，其中语言理解能力提升78%，文本生成、知识...……更多

2023-10-24 16:15:00跌停,讯飞,市值,股价,蒸发,讯飞

9.11和9.9哪个大？实测12个大模型8个都答错，Chat

...模型的短板，此前行业也多次讨论过大模型的数学和复杂推理能力较差，即便是目前最好的大模型GPT-4也仍然有很大进步空间。最近的一次，第一财经曾在6月报道过，根据司南评测体系OpenCompass的高考全卷测试，包括GPT-4在内，7...……更多

2024-07-17 11:56:00实测,模型,模型,数学,小数,问题

突破时间序列组合推理难题！南加大发布一站式多步推理框架TS-

【新智元导读】TS-Reasoner是一个创新的多步推理框架，结合了大型语言模型的上下文学习和推理能力，通过程序化多步推理、模块化设计、自定义模块生成和多领域数据集评估，有效提高了复杂时间序列任务的推理能力和准确性...……更多

2024-10-29 09:55:00推理,时间序列,序列,框架,难题,突破

GPT刚刚公开「草莓」项目：推理能力翻倍，定价200美元？

... OpenAI 在大语言模型领域的新尝试，也可能是对人工智能推理能力一次新的革命性提升。根据目前流出的信息来看，相比以往的 GPT 模型，「草莓」在处理复杂问题、执行多步骤任务方面展现出前所未有的潜力，使其成为通用人...……更多

2024-09-12 09:49:00推理,草莓,定价,能力,项目,草莓

构建数字经济新引擎：枫清科技高雪峰解读AI技术的未来趋势

...，其核心是通过输入的字符串来预测下一个字符。而符号逻辑推理的典型代表是过去出现的专家系统。然而，由于各自的局限性，这两种方法在AI的发展过程中并未带来彻底的革命性变革。当前，联结主义的巅峰——AIGC 技术，...……更多

2024-09-13 18:28:00雪峰,趋势,数字,引擎,经济,技术

混合架构赋予AI人类推理能力

...AI)系统在编码、战略规划和机器人科学三个领域执行复杂推理任务。聊天生成预训练转换器(ChatGPT)和“克劳德3-奥普斯”(Claude 3 Opus)等大语言模型(LLM)，根据人类输入“提示词”处理和生成文本。研究人员说，过去18个月，这些技...……更多

2024-06-12 18:15:00推理,架构,混合,人类,能力,语言

都可赋予大模型慢思考能力 360首创CoE架构媲美OpenA

...到了和OpenAI o1-preview类似的反思决策效果。经过21道复杂逻辑推理题测试结果显示，其效果与OpenAI o1-preview相当，完全超越GPT-4o，有时还能超越o1-preview。“所以，以后比的不是多快能给你答案，而是给的答案完不完整，这也会改...……更多

2024-09-16 17:42:00架构,模型,思维,能力,模式,模型

喜报！明途科技四川省智能数字人工程技术研究中心获批

...成相关的文章、报告或广告内容。（3）数据驱动的决策推理算法通过精确分析和利用现有数据，数据驱动的决策推理算法能够显著提高决策的准确性和效率。适用于金融市场分析、医疗诊断支持系统，以及企业战略规划等场景...……更多

2024-03-25 18:00:00四川省,喜报,四川,研究中心,工程技术,数字

GPT-4o的识图能力有多牛？四大维度深度体验

...呈现，准确率高达100%。图片来源：GPT-4o四、手写指令和逻辑推理最后，记者上了点难度，用手写的逻辑推理题来测试了GPT-4o的识图和逻辑推理能力。GPT-4o的回答堪称完美，不仅准确识别了手写体文字并遵照指示，且答题逻辑完...……更多

2024-05-19 14:21:00维度,深度,能力,体验,模型,训练

推理性能直逼o1，DeepSeek再次出手，重点：即将开源

...出手了，这次又是重磅炸弹。昨晚，DeepSeek 上线了全新的推理模型 DeepSeek-R1-Lite-Preview，直接冲击 OpenAI o1 保持了两个多月的大模型霸主地位。在美国数学竞赛（AMC）中难度等级最高的 AIME 以及全球顶级编程竞赛（codeforces）等权...……更多

2024-11-22 09:50:00推理,性能,再次,重点,模型,推理