• 我的订阅
  • 头条热搜
云从科技发布从容大模型 可支持图文理解、文案写作、逻辑推理等功能 【云从科技发布从容大模型 可支持图文理解、文案写作、逻辑推理等功能】《科创板日报》18日讯,云从科技发布从容大模型。在现场演示中,从容大模型...……更多
蚂蚁自研知识增强大模型服务框架KAG,可显著提升知识推理准确率
...个错误的引导,但这种错误的引导,尤其是大模型生成的文案可能是几百字,甚至上千字的,这时候就很难从里面观察到这类细节问题。通过测评发现,大语言模型即便是加入 RAG 以后,依然有大概 30% 到 40% 的幻觉率。在真实业...……更多
真香!智谱大模型,有了首个免费的API
...性的同时增加多样性)。体验地址:https://open.bigmodel.cn/逻辑推理能力,从简单到复杂,包含一般逻辑推理和数学推理。测试 1:先来一道前段时间让很多大模型翻车的「9.11 和 9.9 哪个更大」问题,很容易就答对了。类似的数字...……更多
...个只有8%。研究人员根据答案是否正确以及答案所包含的逻辑推理是否有效,对大语言模型的答案进行了分类。实验的第一个结果是,在每个测试重复十次的情况下,答案是不一致的。例如,在同一个测试中,有的模型十次中答...……更多
重磅!OpenAI o1模型还没有实现真正的逻辑推理能力
...二、社会评测与同行水平社会评测普遍认可o1 系列模型的逻辑推理能力优于 GPT-4o,但也有很多人提出了不同看法。差评XPIN邀请了理综三科的博士测评,物理评价较高,而生物、化学评价较低,综合认为o1在认知上达到硕士水平...……更多
罗格斯大学团队提出思想链概念,提高大模型的算数推理能力
...概念,提高了大语言模型(LLM,large language models)在复杂推理任务上的性能,例如算术推理、常识推理和符号推理等。图 | 金明宇(来源:金明宇)CoT 的原理是通过提供推理过程的示例,来教会模型处理推理,详细说明导致最...……更多
人类和AI在推理任务中的表现相似,Google DeepMind研究揭示AI局限性
...,尽管这些模型在处理自然语言方面表现卓越,但在复杂逻辑推理任务中,人类和语言模型都会受到语义内容合理性和可信度的影响,表现出类似的错误倾向。研究背景人类在推理过程中存在两种系统:“直觉系统”和“理性系...……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...竞赛不仅是对人类(碳基智能)思维敏捷性、知识掌握和逻辑推理的极限挑战,更是AI(“硅基智能”)锻炼的绝佳练兵场,是衡量AI与“超级智能”距离的重要标尺。OlympicArena——一个真正意义上的AI奥运竞技场。在这里,AI不...……更多
Anthropic再反击!发布Claude 3.5吊打GPT-4o,视觉、逻辑推理等方面表现更强
...个版本Claude 3.5 Sonnet。从官方披露的测试数据来看,其在逻辑推理、编程、数学等方面中的表现性能均超越GPT-4o。网友直言,“太卷了,现在AI竞争是要以周为单位了吗?” 从官方介绍来看,Claude 3.5全家桶仍会有3款系列模型,...……更多
谷歌最新自然语言推理算法
...读理解和问答等任务中取得了极高的性能,但这些模型在逻辑推理方面的性能仍然十分滞后。去年5月「思维链」(ChainofThought,CoT)横空出世,有研究人员发现,只需要在prompt中加入「Let\'sthinkstepbystep」就能让GPT-3的推理性能大幅...……更多
AI新时代揭幕!会“思考解题逻辑”的OpenAI推理大模型登场
...凌晨1时许,AI时代迎来崭新的起点——能够进行通用复杂推理的大模型终于走到台前。OpenAI在官网发布公告称,开始向全体订阅用户开始推送OpenAI o1预览模型——也就是此前被广泛期待的“草莓”大模型。OpenAI表示,对于复杂推...……更多
科大讯飞入局大模型混战,刘庆峰:10月底将赶超ChatGPT
...在七个维度,具体包括文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力以及多模态能力。“这将对整个人类的生产和生活方式带来巨大的颠覆,产生全新的机会。”“认知大模型成为通用人工智能的曙光,科大...……更多
科学家推出大模型数据集,涵盖奥赛数学题,有望让AI辅导数学课程
...23 年 2 月。当时,已经有一些研究团队开始使用大模型做逻辑推理和数学推理。赵子龙和合作者也认为这个方向很有前景。他表示让自己印象最深的例子就是 OpenAI 网站上的一道数学推理的题: Simplify tan100 + 4sin100。根据 OpenAI 自...……更多
百度文心一言发布会详细纪要
...和6只兔子。在这两轮提问当中展现出来的是文心一言的逻辑推理能力”。这方面它不仅知道题出的对不对,也不仅能够给出答案,也给出了解题的步骤。这很像是小学生在解应用题,它是有逻辑的,一步一步的推理出来的。我...……更多
大模型降价背后,国产大模型的竞争逻辑变了
...市场拱手让人。另一方面,随着大模型产业的快速发展,推理成本飞速下降,也成为终端降价的基础。据百度官方透露,相比一年前,文心大模型的算法训练效率提升到了原来的5.1倍,周均训练有效率达到98.8%,推理性能提升了1...……更多
科大讯飞刘庆峰:讯飞星火大模型10月底整体赶超ChatGPT
...实时互动,无论是文本生成、语言理解,还是知识问答、逻辑推理,亦或是数学能力等,星火大模型都表现出色。现场真机实测的互动提问,大模型的精彩回答,引发掌声不断。刘庆峰表示,认知大模型成为通用人工智能的曙光...……更多
昆仑万维:“天工大模型3.0”将于4月17日正式发布 同步开源4000亿参数MoE超级模型
...一代“天工2.0”MoE大模型,“天工3.0”在模型语义理解、逻辑推理、以及通用性、泛化性、不确定性知识、学习能力等领域拥有惊人的性能提升,其模型技术知识能力提升超过20%,数学/推理/代码/文创能力提升超过30%。同时,“...……更多
...我们需要结合快思考的‘黑盒’预测和慢思考的‘白盒’逻辑推理,打造‘灰盒’可信大模型。具体而言,通过融合科学规律、观测数据和合成数据,开发理解物理世界的垂直领域科学大模型。”作为本届大赛评委会主席,上智...……更多
港中文团队提出大模型元推理范式,革新大模型的评价体系
...一定启示。日前,相关论文以《大型语言模型评价中的元推理革命》(MR-GSM8K: A Meta-Reasoning Revolution in Large Language Model Evaluation)为题发在 arXiv,曾忠燊是第一作者,香港中文大学教授贾佳亚担任通讯作者 [1]。图……更多
vivo蓝心大数据模型,为什么这么受欢迎?
...扮演、知识问答、自然对话的700亿蓝心大模型70B以及适合逻辑推理以及任务编排的1300亿蓝心大模型130B以及1750亿蓝心大模型175B。而700亿蓝心大模型70B在SuperCLUE、C-Eval、CMMLU等多个榜单中排名第一,并将70亿规模蓝心大模型7B开源...……更多
号称博士生水准!OpenAI最新模型仍分不出9.11和9.8哪个大
...出现的松鼠。这类游戏的逻辑相对复杂,更考验OpenAI o1的逻辑推理能力。官方还表示,相较于GPT-4o等现有的大模型,OpenAI o1能够解决更加困难的推理问题,同时改善过往模型中存在的机制性缺陷。比如在解答编程问题时也会更有...……更多
通义千问 再次“激活”阿里云
...意义。通义千问可提供文案创作、对话聊天、知识问答、逻辑推理、代码编写、文本摘要以及图像视频理解服务|阿里云会上,阿里云 CTO 周靖人用 2 分钟的时间,通过一张 PPT 的讲述简单介绍了通义千问的几个能力;紧接着放...……更多
“百模大战”,国产 GPT 大全
...的超大规模的语言模型,功能包括多轮对话、文案创作、逻辑推理、多语言支持。能够创作文案,续写小说,编写邮件等。通义千问的缺点是不支持多语言,只支持中文。通义千问入口:tongyi.aliyun.com小冰 小冰是一套完整的、...……更多
百度云升级模型服务,百度版GPTs即日开放 | 最前线
...用得都比较多。一些场景,比如说所谓的客户场景,生成文案广告营销等等,或者是像教育领域都是现在我们比较大的新的应用场景。现在我们的整个在千帆平台上使用量还是非常大。记者:客户很关注降成本的问题,提高吞吐...……更多
腾讯大模型混元Turbo:御气升昺云,梓桐金鼎开
...不足,腾讯还特别强化了模型在高质量文本创作、数学和逻辑推理等方面的能力。 文本创作能力的显著提升在文本创作领域,大多数大模型表现平平,尤其在专业写作方面,常常缺乏足够的灵活性和精准度。混元Turbo在这方面...……更多
百川智能发布baichuan3稳定语言模型
...语言处理和代码生成领域的强大实力。不仅如此,其在对逻辑推理能力及专业性要求极高的MCMLE、MedExam、CMExam等权威医疗评测上的中文效果同样超过了GPT-4,是中文医疗任务表现最佳的大模型。Baichuan3还突破“迭代式强化学习”...……更多
文心一言“点评”李彦宏发布会紧张原因:对AI掌握不充分,担心被误解作秀
...ChatGPT”文心一言,并展示了文心一言在文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的综合能力。百度方面称,从现场展示来看,文心一言某种程度上具有了对人类意图的理解能力,回答的准确...……更多
微软华人团队发布全新基准AGIEval,专为人类考试而生
...在衡量未来的法律学生的推理和分析能力,考试内容包括逻辑推理、阅读理解和分析推理等部分,需要应试者分析复杂信息和得出准确结论的能力,这些任务可以评估语言模型在法律推理和分析方面的能力。3.律师资格考试可以...……更多
菲尔兹奖得主亲测GPT-4o,经典过河难题破解失败!最强Claude 3.5回答离谱,LeCun嘲讽LLM
...水平(图中0.0边界)甚至超越,其中不乏非常有挑战性的逻辑推理任务,比如需要复杂多步骤推理的BBH(Big-Bench Hard)和数学应用题测试集GSK8k。其中的HellaSwag测试集,由华盛顿大学和Allen AI在2019年推出,专门针对人类擅长但LLM...……更多
杀疯了!1分钟完成100页PPT,天工AI人工智能速成法!
...2.数据清洗梳理,3.整合分析数据并绘制图表,4.撰写报告文案大纲,5.制作PPT。光听完这几步工作,打工人就已经开始犯拖延症...先不说各项工作需要投入的时间和精力,单从网站切换到excel表格,再到找图存图,word写文案,PPT...……更多
更多关于财经的资讯:
阿联酋土豪来中国楼市抄底,昔日广州千亿房企要易主,创始人郭梓文让位
Alobeidli在阿联酋拥有多年政府机构从业背景。 图源:图虫创意“头顶一块布,全球我最富”,一名中东的富豪,正在一家广州房企的身上施展他的“钞能力”
2024-09-24 19:26:00
美妆巨头也要降本增效,欧莱雅中国调整电商渠道,加码抖音
图片来源:Pexels美妆市场竞争加剧,效率成为行业“玩家们”最为看重的指标。近日,欧莱雅集团旗下日本护肤品牌TAKAMI正式关闭天猫海外旗舰店
2024-09-24 19:27:00
武汉当代集团被申请重整,曾多次入选民企500强
因未能清偿到期债务,武汉当代科技产业集团股份有限公司(下称“当代集团”)近日被债权人申请重整。业内人士认为,对于陷入债务困境的当代集团而言
2024-09-24 19:35:00
中国金融“组合拳”推动亚洲股市普涨,亚太股指创两年半新高
本周二,在中国一系列金融市场刺激政策消息的提振下,亚洲股市普遍上涨,MSCI亚太指数(除日本外)更是直接飙升至逾两年半高位
2024-09-24 19:35:00
茅台崩了,3亿中产拒绝买单
茅台的价格,是经济消费的一面镜子谁是中国人心中最顶级的奢侈品,最通用的社交货币?答案各有千秋,但茅台一定是绕不开的选项
2024-09-24 19:35:00
共谋中国家办业务标准建设 探寻提振企业家信心新途径——全国首部《家族办公室业务标准》制定工作正式启动
9月20日,中国投资协会金融业资产管理专业委员会(简称:资管委)成功举办首次“中国家族办公室业务标准”研讨会。吸引了来自香港
2024-09-24 20:05:00
英国央行行长:利率将会逐步降低
中新社伦敦9月24日电 (记者 欧阳开宇)英国央行行长安德鲁·贝利24日对媒体指出,随着英国央行对控制通胀的信心增强,利率将会逐步降低
2024-09-24 20:18:00
美东港口罢工“火药桶”即将引爆?航运公司加费应对,马士基股价暴涨
周二(9月24日)欧洲时段,在丹麦交易的马士基B类股一度涨近4.9%,股价创8月2日以来的最高水平,近两周已累涨近20%
2024-09-24 20:35:00
农行济南软件园支行:拾金不昧践初心、暖心服务获赞誉
“多亏了你们啊,要不是你们,我这趟出差都不知道该怎么办了,真是太感谢了!”客户李女士拉着农行济南软件园支行的工作人员连连道谢
2024-09-24 20:46:00
农行济南自贸区支行:纸笔传声 服务暖心
近日,农行济南自贸区支行营业室的大厅内,发生了温馨感人的一幕,通过纸和笔展开了心与心的交流。某天上午,一名年轻女客户走进营业网点
2024-09-24 20:46:00
香港贸发局:香港出口商料短期内出口业务持续增长
中新社香港9月24日电 (记者 魏华都)香港贸易发展局24日公布“2024年第三季度香港贸发局出口信心指数”显示,香港出口商对业务前景保持乐观
2024-09-24 20:48:00
@重庆市民 请查收邀请函 6大主题、10条线路带你“秋游扬州”
“艺彩纷呈满扬州”“万家灯火赏扬州”“千灯夜市游扬州”等6大主题200多项重点文旅活动等你来玩了!9月23日,“二分明月‘艺’扬州”2024金秋文旅消费推广季启动仪式在重庆举行
2024-09-24 20:57:00
“价格战”致车市8个月损失超1300亿,经销商资金链困局如何解开?
据中国汽车流通协会(下称“协会”)专家统计,以2023年1月的市场折扣和新车成交均价为基准进行计算,2024年1-8月
2024-09-24 20:58:00
BBA销量被理想全面反超,宝马销量垫底,价格战不打不行
根据理想汽车官方最新公布的销售数据,2024年第38周(9月16日至9月22日),理想汽车的销量已经全面超越了奥迪、奔驰和宝马这三大德国豪华品牌
2024-09-24 21:05:00
超豪华车销量暴跌,宾利和劳斯莱斯跌幅最深
根据桑之末的统计数据,今年1-8月,国内进口车售价超过40万元的车型销量下跌21.7%,共销售26.3万辆。其中,售价超过百万级的豪华车市场销量为9万辆
2024-09-24 21:05:00