• 我的订阅
  • 头条热搜
云从科技发布从容大模型 可支持图文理解、文案写作、逻辑推理等功能 【云从科技发布从容大模型 可支持图文理解、文案写作、逻辑推理等功能】《科创板日报》18日讯,云从科技发布从容大模型。在现场演示中,从容大模型...……更多
告别搜索引擎!讯飞星火认知大模型评测:改变人机交互方式 还能帮你写代码!
...以完成特定复杂的任务能力,人机共创带来全新机会。在逻辑推理和数学能力上,V1.5版本主要升级了包括长链条思维链推理和数理逻辑推理,比如农夫、狼、羊、菜过河问题,直线相交问题,概率问题等等,并将大模型的语言...……更多
科技企业竞逐“大模型”:谁能聊下去?谁更接地气? | 2023世界人工智能大会
...”和“文心一言” 新民晚报记者 陈梦泽 摄(下同)秒答逻辑推理题、创作一幅描绘申城未来的图画……大模型能有多聪明?一眼看穿一家陌生公司的门道、成为房产经纪的贴心小助手……大模型能有多实用?今年世界人工智能...……更多
大模型面临四大关键缺陷,“知识方程”能否通向强人工智能
...大模型面临的最重要的挑战之一。第二,大模型的数学和逻辑推理能力仍然需要加强。虽然GPT-4在某些考试中表现优异,但在面对一些精心设计的逻辑推理问题时,大模型的回答与随机答案相差无几。因为在进行深度推理时,即...……更多
蚂蚁自研知识增强大模型服务框架KAG,可显著提升知识推理准确率
...个错误的引导,但这种错误的引导,尤其是大模型生成的文案可能是几百字,甚至上千字的,这时候就很难从里面观察到这类细节问题。通过测评发现,大语言模型即便是加入 RAG 以后,依然有大概 30% 到 40% 的幻觉率。在真实业...……更多
真香!智谱大模型,有了首个免费的API
...性的同时增加多样性)。体验地址:https://open.bigmodel.cn/逻辑推理能力,从简单到复杂,包含一般逻辑推理和数学推理。测试 1:先来一道前段时间让很多大模型翻车的「9.11 和 9.9 哪个更大」问题,很容易就答对了。类似的数字...……更多
...个只有8%。研究人员根据答案是否正确以及答案所包含的逻辑推理是否有效,对大语言模型的答案进行了分类。实验的第一个结果是,在每个测试重复十次的情况下,答案是不一致的。例如,在同一个测试中,有的模型十次中答...……更多
重磅!OpenAI o1模型还没有实现真正的逻辑推理能力
...二、社会评测与同行水平社会评测普遍认可o1 系列模型的逻辑推理能力优于 GPT-4o,但也有很多人提出了不同看法。差评XPIN邀请了理综三科的博士测评,物理评价较高,而生物、化学评价较低,综合认为o1在认知上达到硕士水平...……更多
多轮对话、逻辑和数学能力升级,讯飞星火大模型V1.5发布 | 科技前线
...实测,讯飞星火认知大模型可应对实时信息问答、复杂的逻辑推理问题,以及复杂的多轮对话任务。发布会上,讯飞星火APP和小程序发布,并推出纯语音对话、多模态输入、多终端支持、多功能小助手等功能,能够实现随时随地...……更多
国产大模型首发中文逻辑推理,「天工大模型4.0」o1版来了
...始在一些权威评测中取得领先。今天,国内首款具备中文逻辑推理能力的 o1 模型来了,它便是由昆仑万维推出的「天工大模型 4.0」 o1 版(英文名:Skywork o1)。这也是近一个月来,该公司在大模型及相关应用上的第三次大动作...……更多
姚期智院士大模型新研究:思维图DoT,用数学理论确保AI逻辑一致
...看看DoT长啥样。大模型复杂推理新框架 如前所述,DoT将逻辑推理过程建模为在单个LLM内构建有向无环图(DAG)。其框架内部管理三个关键角色:提议者:生成命题或推理步骤,添加新节点。 批评者:评估命题,识别错误、不...……更多
苹果新论文证明LLM大模型存在缺陷!没有进行真正的逻辑推理
...地依赖于训练数据中的模式进行预测。当需要进行真正的逻辑推理时,这些模型往往无法产生合理的结果,这一发现对人工智能的发展提供了重要的参考。虽然LLM在许多领域表现优异,但其推理能力仍有待改进。【本文结束】如...……更多
超级干货:企业如何用AI工具做好营销实战?
...备的能力已经超过我们过去的想象了,现在它不但可以做逻辑推理,还能识别人类语言中的感情,进行风格模仿并做出人性化、情感化的内容创作。未来大量的内容都可以交给AI来做。第三个理由:营销方法有套路。营销一半是...……更多
云知声山海大模型成功发布,为各行业带来新增长范式
...型的十大核心能力,即语言生成、语言理解、知识问答、逻辑推理、代码能力、数学能力、安全合规能力七项通用能力及插件扩展、领域增强、企业定制三项行业落地能力,云知声通过语音输入、实时互动的方式进行讲解演示,...……更多
罗格斯大学团队提出思想链概念,提高大模型的算数推理能力
...概念,提高了大语言模型(LLM,large language models)在复杂推理任务上的性能,例如算术推理、常识推理和符号推理等。图 | 金明宇(来源:金明宇)CoT 的原理是通过提供推理过程的示例,来教会模型处理推理,详细说明导致最...……更多
图灵奖得主杨立昆:AI的逻辑推理和规划能力有限,会犯事实错误和逻辑错误
...”杨立昆表示,人工智能距离人类和动物的能力差距在于逻辑推理和规划,这是智能的重要特征,现在的大模型只能“本能反应”。“如果你用一万亿或两万亿个token来训练它们,机器的性能是惊人的,但最终机器会犯事实错误...……更多
人类和AI在推理任务中的表现相似,Google DeepMind研究揭示AI局限性
...,尽管这些模型在处理自然语言方面表现卓越,但在复杂逻辑推理任务中,人类和语言模型都会受到语义内容合理性和可信度的影响,表现出类似的错误倾向。研究背景人类在推理过程中存在两种系统:“直觉系统”和“理性系...……更多
百度大语言模型文心一言app上架苹果appstore
...作生成的综合能力;数理逻辑推算,能够学会数学推演及逻辑推理等相对复杂任务;灵感中心,上百款实用工具能够覆盖日常生活的创作、职场、学习、情感、绘画等多个应用场景;图片生成,文心一言就能一键生成专属于你的...……更多
商汤又“夺金”!SuperCLUE-V多模态大模型基准发布10月榜单
...度30个二级维度。报告称SenseChat-Vision 5.5在基础能力-数理逻辑推理任务如图表推理、场景推理方面具备领先优势。榜单显示,在数理逻辑分析能力中,SenseChat-Vision 5.5超越国内外所有参评模型包括GPT-4o的最新版本,位列第一。Super...……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...竞赛不仅是对人类(碳基智能)思维敏捷性、知识掌握和逻辑推理的极限挑战,更是AI(“硅基智能”)锻炼的绝佳练兵场,是衡量AI与“超级智能”距离的重要标尺。OlympicArena——一个真正意义上的AI奥运竞技场。在这里,AI不...……更多
Anthropic再反击!发布Claude 3.5吊打GPT-4o,视觉、逻辑推理等方面表现更强
...个版本Claude 3.5 Sonnet。从官方披露的测试数据来看,其在逻辑推理、编程、数学等方面中的表现性能均超越GPT-4o。网友直言,“太卷了,现在AI竞争是要以周为单位了吗?” 从官方介绍来看,Claude 3.5全家桶仍会有3款系列模型,...……更多
谷歌最新自然语言推理算法
...读理解和问答等任务中取得了极高的性能,但这些模型在逻辑推理方面的性能仍然十分滞后。去年5月「思维链」(ChainofThought,CoT)横空出世,有研究人员发现,只需要在prompt中加入「Let'sthinkstepbystep」就能让GPT-3的推理性能大幅...……更多
影响英伟达根本逻辑的大争论:OpenAI改变策略意味着什么?谁在撒谎?
大模型预训练“缩放定律”定律失效?模型推理成“解药”,英伟达一家独大格局要变天?“缩放定律”指导下,AI大模型预训练目前遭遇瓶颈。据路透12日报道,硅谷主要AI实验室的新模型训练计划目前普遍进展不顺,新模型...……更多
AI新时代揭幕!会“思考解题逻辑”的OpenAI推理大模型登场
...凌晨1时许,AI时代迎来崭新的起点——能够进行通用复杂推理的大模型终于走到台前。OpenAI在官网发布公告称,开始向全体订阅用户开始推送OpenAI o1预览模型——也就是此前被广泛期待的“草莓”大模型。OpenAI表示,对于复杂推...……更多
科大讯飞入局大模型混战,刘庆峰:10月底将赶超ChatGPT
...在七个维度,具体包括文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力以及多模态能力。“这将对整个人类的生产和生活方式带来巨大的颠覆,产生全新的机会。”“认知大模型成为通用人工智能的曙光,科大...……更多
百度文心一言发布会详细纪要
...和6只兔子。在这两轮提问当中展现出来的是文心一言的逻辑推理能力”。这方面它不仅知道题出的对不对,也不仅能够给出答案,也给出了解题的步骤。这很像是小学生在解应用题,它是有逻辑的,一步一步的推理出来的。我...……更多
科学家推出大模型数据集,涵盖奥赛数学题,有望让AI辅导数学课程
...23 年 2 月。当时,已经有一些研究团队开始使用大模型做逻辑推理和数学推理。赵子龙和合作者也认为这个方向很有前景。他表示让自己印象最深的例子就是 OpenAI 网站上的一道数学推理的题: Simplify tan100 + 4sin100。根据 OpenAI 自...……更多
理想汽车-W涨逾6%,理想同学App全面接入DeepSeekR1&V3 671B满血版,提供更好的复杂逻辑推理和深度思考能力
...后,理想同学App能够为用户在对话问答中提供更好的复杂逻辑推理和深度思考能力。理想同学App具备语音输入与播报能力;同时能够提供稳定的服务,支持流畅的连续对话;联网搜索使用理想同学智能体RAG3.0的能力,检索内容丰...……更多
权威榜单 | 网易易盾入选中国信通院生成式 AI 技术和应用优秀案例
...内容风控的场景理解与知识迁移能力,进行更深层次认知逻辑推理与综合防控;· 基于其提示上下文学习范式以及思维推理过程,内容风控将在不更新模型的基础上更加便捷的适应不同的标准,差异化分级分层精准防控。四、网...……更多
腾讯最强!混元自研深度思考模型T1正式发布:吐字快、能秒回
...还擅长超长文处理。通过大规模强化学习,并结合数学、逻辑推理、科学和代码等理科难题的专项优化,混元T1正式版进一步提升了推理能力。在体现推理模型基础能力的常见benchmark上,如大语言模型评估增强数据集MMLU-PRO中,...……更多
更多关于财经的资讯:
贵州服务业“双轮驱动”稳增长
9月19日晚,伴随贵阳咖啡队与醉美泸州队的揭幕战打响,贵阳“票根经济”再升级——以2025城市足球邀请赛等为载体,一张票根联动16座城
2025-09-24 05:43:00
超4000只个股飘绿,中位数下跌1.6%!盘中杀跌原因找到了!
今日,三大指数高开低走,盘中沪指回踩30日均线,深证成指与创业板指亦失守10日均线,全天一度放量下跌。尾盘,各大指数探底回升
2025-09-23 16:24:00
恒丰银行济南分行举办“恒学致远 丰梦未来”亲子助学经验分享活动
日前,恒丰银行济南分行举办“恒学致远 丰梦未来”亲子助学经验分享活动,邀请员工子女、家属代表分享学习成长与家庭教育经验
2025-09-23 17:46:00
建行东营胜华支行开展“把识假窍门送进千家万户”反假宣传活动
为切实守护群众财产安全,提升公众反假货币意识,建行东营胜华支行以 “普及防伪知识 共筑安全防线” 为主题,在网点厅堂及周边商圈
2025-09-23 20:57:00
贵州首台“云端建造工厂”投入使用
“开始顶升!”随着控制室顶升启动键按下,由中建四局自主研发的贵州省首套智能顶升集成建造平台——“云端建造工厂”近日在贵阳市云岩区鹿冲关城中村改造项目成功完成首次顶升作业
2025-09-24 01:02:00
黔东南施秉县开展青年求职能力实训营活动
9月19日,黔东南州施秉县人力资源和社会保障局以“施秉启航·职赢未来”为主题,举办2025年青年求职能力实训营活动。旨在破解青年求职难
2025-09-24 02:04:00
独山首例建设项目开工“一件事”3天办结
“3天就拿到了开工所需全部证件,出乎预料。”9月23日,通过线上平台完成建设项目开工审批的杨先生对独山县住建局的高效服务赞不绝口
2025-09-24 02:04:00
黔东南台江县2025年青年求职实训营正式开班
9月22日,黔东南州台江县人力资源和社会保障局以“青春筑梦·职引台江”为主题,举办2025年青年求职能力实训营。来自全县的30余名高校毕业生及青年学员齐聚一堂
2025-09-24 02:05:00
20cm涨停!盟科药业定增落地 海鲸药业10亿入主
《科创板日报》9月23日讯(记者 史士云)今日,盟科药业(688373.SH)高开高走,早盘一度20cm涨停,截至发稿涨18
2025-09-23 14:22:00
三年来最大单日流入!全球投资者竞相“扫货”黄金ETF 金价再创新高
财联社9月23日讯(编辑 潇湘)在国际金价连创新高的同时,全球投资者正竞相“扫货”黄金ETF……尽管美联储主席鲍威尔在上周三降息后的表态中抑制了市场对快速宽松的预期
2025-09-23 14:22:00
润建股份等新设新能源公司,含电池制造业务
近日,重庆润商新能源有限公司成立,法定代表人为余亮亮,注册资本为1000万元,经营范围包含:热力生产和供应;风力发电技术服务
2025-09-23 15:36:00
中信银行长春前进大街支行走进力旺广场舞蹈队开展金融宣教活动
为进一步提升公众金融素养,增强金融消费者的风险防范意识,9月16日,中信银行长春前进大街支行工作人员走进力旺广场舞蹈队
2025-09-23 15:48:00
中信银行长春西安大路支行成功举办“普及金融知识”宣传活动
为提升居民的金融素养和风险防范能力,2025年9月21日,中信银行长春西安大路支行联合国信物业,成功举办了“普及金融知识”宣传活动
2025-09-23 15:48:00
中信银行长春迅驰广场支行开展少儿财商课活动
为积极响应总行“秋季守护”金融教育宣传活动,中信银行长春迅驰广场支行深入践行金融为民的服务理念,走进了乔治丁丁幼儿园加州分园
2025-09-23 15:48:00
吉林银行机关第十二党支部成功举办“赓续红色血脉 共筑金融长城”主题党建活动
为深化党史学习教育,凝聚金融行业发展合力,9月20日,吉林银行机关第十二党支部(金融市场部)以“赓续红色血脉 共筑金融长城”为主题
2025-09-23 15:49:00