知识,准确率,推理,蚂蚁,框架,模型头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...e given problem about geometric shapes.」可以看到，性能并不好，准确率只有 36%，应该有很大的改进空间。不过，在使用 APE 之前，让我们先尝试下一种提示技术：思路链（CoT）推理；这种技术虽然对原始提示词修改不多，但事实证明却...……更多

2024-09-10 13:39:00从头,人工,提示,指南,工程,提示

李飞飞空间智能之后，上交、智源、北大提出空间大模型Spati

...深度信息获取、远近关系比较的任务上，可以达到 99%+ 的准确率。2. 针对空间理解任务，作者公布了 SpatialBench 榜单。通过精心设计和标注 QA，测试模型深度理解能力。SpatialBot 在榜单上展示了和 GPT-4o 接近的能力。模型如何理解...……更多

2024-08-08 09:39:00空间,北大,模型,智能,深度,模型

北大推出全新机器人多模态大模型！面向通用和机器人场景的高效推

...理能力，并证实了我们的训练策略的有效性。除了更高的准确率外，我们的模型实现的推理速度比 LLaMA-AdapterV2 和 ManipLLM 快 7 倍，这可以归因于 Mamba 语言模型的内容感知推理能力和效率。图 4. RoboVQA 上与机器人相关的推理对比...……更多

2024-06-21 09:52:00机器,模态,人多,机器人,推理,北大

GPT-4o的识图能力有多牛？四大维度深度体验

...识别数据图上的信息，并按要求以图表的形式重新呈现，准确率高达100%。图片来源：GPT-4o四、手写指令和逻辑推理最后，记者上了点难度，用手写的逻辑推理题来测试了GPT-4o的识图和逻辑推理能力。GPT-4o的回答堪称完美，不仅...……更多

2024-05-19 14:21:00维度,深度,能力,体验,模型,训练

协同发展，生态聚合丨1024程序员节暨「源聚一堂」开源技术沙

...于开发者的节日里，开发者们在美食节、精彩节目、开源知识有奖问答、互动魔术与游戏，现场K歌等精彩互动中尽情狂欢。让开发者卸下代码和工作，参与线下的狂欢盛宴，领略开发者的多彩风格！广大开发者们以极客精神，...……更多

2023-10-25 13:02:00北京站,一堂,北京,程序员,沙龙,生态

中国财税GPT迎来最准确的大模型：小竹财税AI问世

...对高效解决财税问题的需求日益迫切。作为中国财税领域准确率领先的垂直大模型，小竹财税AI将不断提升其逻辑推理和上下文理解能力，以更好地满足用户的需求，努力实现“让天下没有难懂的财税”的目标。期待小竹财税在A...……更多

2024-03-14 13:30:00中国,模型,模型,领域,需求,正确率

AI搜索助手心流正式上线

...户的复杂问题。“心流在长文本评测实验中达到超过99%的准确率，具有非常优秀的长文本阅读能力。”据心流的技术人员介绍，在语义理解方面，心流的直接理解能力优于当前市场上的主流模型，间接理解能力（包含复杂推理）...……更多

2024-07-10 15:23:00手心,搜索,知识,能力,搜索,模型

百川智能发布baichuan3稳定语言模型

...助力医疗资源实现普惠和平权。并且医疗问题专业性强、知识更新速度快、准确性要求高、个体差异大，能充体现大模型的各项能力，被百川智能称为“大模型皇冠上的明珠”。因此，诸如OpenAI、谷歌等头部大模型企业都将医疗...……更多

2024-01-29 19:57:00百川,模型,语言,智能,模型,百川

类人神经网络再进一步！DeepMind最新50页论文提出Al

...校准自己的判断，即人类对某个问题的确定性往往与预测准确率成正比，而AI系统则过于自信，即使在预测错误时也表现出高度的确定性。所以说，在真正实现通用人工智能之前，深度学习模型和人类之间仍然存在诸多差异需要...……更多

2024-09-23 10:00:00神经网络,框架,层次,神经,视觉,人类

Bengio团队提出多模态新基准，直指Claude 3.5和

...）两部分作为上下文信息，模型能还原出被遮住的文字的准确率。蓝色框内表示仅包含图像中的文字（TEI）的作为上下文信息，并不包含图像（VI），模型能还原出的遮住文字的准确率。结果表明：绝大多数模型目前都不能胜...……更多

2024-06-29 09:37:00模态,基准,弱点,团队,模型,任务

英伟达开源NVLM 1.0屠榜多模态！纯文本性能不降反升

...LLM骨干模型，特别是在文本数学和编码基准测试中，平均准确率提高了4.3个百分点。文本大模型经过多年的发展，逐渐发展成了统一的纯解码器Transformer架构。反观现有的多模态大模型架构仍然处于混乱状态，开源模型在选择LLM...……更多

2024-09-24 13:36:00英伟,模态,文本,性能,模态,模型

2023内容科技应用典型案例：农业银行大模型ChatABC

...述农业银行大模型ChatABC，对于大模型精调、提示工程、知识增强、检索增强、人类反馈的强化学习（RLHF）等大模型相关新技术进行了深入探索和综合应用，结合农业银行研发支持知识库、内部问答数据以及人工标注数据等金融...……更多

2024-04-08 17:06:00农业银行,典型案例,模型,典型,案例,银行

全面透视豆包：功能、版本、价格、优势、应用

...。对客服团队进行培训后上线使用，同时持续监控回答的准确率和客户满意度，根据情况优化问题库和豆包的配置。六、使用豆包的潜在问题和注意事项 1. 潜在问题回答准确性：尽管豆包尽力提供准确的信息，但它的回答仍可...……更多

2024-07-24 14:44:00豆包,优势,版本,功能,应用,价格

蚂蚁数科发布新一代融合AI风控引擎

...智能化水平。蚁盾CTO张凯隆介绍道，生成式AI具有“理解推理+自主决策”的能力及特性，“AIR”引擎借助生成式AI，大幅简化了原有需要专业算法工程师深度参与的操作流程，在风险管理复杂度综合降低50%的前提下，将风险对抗...……更多

2024-06-26 09:51:00蚂蚁,新一代,引擎,风险,凯隆,智能

文心大模型4.0 Turbo来了！百度推出文心快码2.5，已

...平台创建，吸收了朱有勇院士的研究成果以及相关的农业知识，可以为农民解答生产生活中的问题。▲农民院士智能体百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜谈道，在过去半年，用户使用文心大模型...……更多

2024-07-01 09:21:00文心,快码,程序员,模型,程序,文心

开源大模型杀疯了！Mistral新模型三分之一参数卷爆Lla

...编程语言。特别在MMLU上，其预训练版本更是达到了84.0%的准确率。消息一出，Mistral AI联创兼首席科学家第一时间转发，直接cue Llama 3.1 405B的那种：Perplexity CEO Aravind Srinivas也开麦了：开源追赶闭源的趋势很明显，未来闭源模型只..……更多

2024-07-26 09:39:00模型,参数,模型,基准,问题,推理

统计学方法在人工智能中的应用与优化策略研究

...键步骤。统计学方法提供了各种性能指标，如均方误差、准确率、召回率和F1分数等，用于衡量模型的性能。这些指标允许我们量化模型的预测能力，并对不同模型进行比较。通过统计学方法，我们可以确定哪种模型在特定任务...……更多

2024-01-27 03:05:00人工智能,统计学,人工,策略,统计,智能

从架构、工艺到能效表现，全面了解LLM硬件加速，这篇综述就够

...的 Softmax 层，随着 Transformer 模型处理更长的序列以提高准确率，这项技术变得越来越重要。所提出的技术将 Softmax 层划分为多个子层，更改数据访问模式，然后将分解的 Softmax 子层与后续和前面的过程合并。该方法分别将 BERT、...……更多

2024-09-21 09:37:00能效,架构,工艺,硬件,加速器,能效

“AI考生”闯关高考，谁是最会做题大模型？

...巴巴Qwen2-72b等国产大模型在高考数学客观题中具有较高的准确率，令人眼前一亮。当然，LLMEVAL团队在评测后也指出，大模型在数学推理任务中的鲁棒性与准确性仍有很大的提升空间。语文、英语高考测试，作文见真章“AI考生”...……更多

2024-06-26 07:26:00考生,模型,高考,模型,评测,高考

精准狙击Llama 3.1？Mistral AI开源Larg

...的新标准。特别是在 MMLU 上，预训练版本实现了 84.0% 的准确率。代码与推理Mistral AI 基于此前 Codestral 22B 和 Codestral Mamba 的经验，在很大一部分代码上训练了 Mistral Large 2。Mistral Large 2 的表现远远优于上……更多

2024-07-26 09:36:00模型,基准,多语,测试,性能,生成