准确率,模型,评估,评估,模型,数据头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...的案例，在微调、打磨后，大模型在细分专业领域的回答准确率从60%提升至97%。安全性是大模型To-B企业应用的首要问题。合同、财务、业务数据等公司机密，难以作为数据集去训练通用大模型。而OpenAI发布GPTs，将大模型应用商...……更多

2024-01-22 09:27:00周鸿,握手言和,浪潮,模型,模型,周鸿

兴业银行首创“种植流模型”，覆盖银行贷款全生命周期

...项目面积大、位置偏远、银行网点和人员不足、人工观察准确率不高等客观情况，银行在贷前资产价值评估或者贷后定期风险监管环节存在痛点，进而导致介入力度受限。而空天数据，尤其是卫星遥感数据具有地理覆盖面广、客...……更多

2024-04-10 17:36:00银行,周期,模型,生命,数据,空天

新一代天气雷达报警识别和智能诊断系统服务杭州亚运会

...断”模型进行了阈值调整等针对性算法升级，模型的预警准确率提升至75%，并建立了基于模型的雷达预警流程，对出现显著健康度下降的台站进行预警，每日提供杭州亚运会气象观测装备运行质量雷达智能诊断情况。9月23日杭州...……更多

2023-10-16 17:28:00雷达,杭州,亚运会,新一代,报警,天气

菲尔兹奖得主亲测GPT-4o，经典过河难题破解失败！最强Cl

...推理问题。刚刚发布时，人类在HellaSwag上能达到超过95%的准确率，SOTA分数却始终难以超过48%。但这种情况并没有持续很久。各个维度的分数持续猛涨，2023年3月，GPT-4在HellaSwag上的各项得分就逼近，甚至超过了人类水平。 https://...……更多

2024-07-01 08:58:00菲尔,得主,难题,经典,农夫,模型

对话北大赵东岩：为啥DeepSeek幻觉率这么高？用户如何避

...问题，是否会导致其在行业应用面临较大的挑战？比如对准确率要求比较高的教育、医疗、金融等行业？赵东岩：是的，所以在这些关键领域，模型的对齐效果非常关键。实践中，可以通过多次校验，对齐，RAG来改善大模型的幻...……更多

2025-03-05 15:54:00东岩,幻觉,北大,对话,用户,模型

CMU清华教LLM练成数学高手，LeanSTaR训练模型边思

...增强），对比Lean-CoT和Lean-STaR的表现。仅用专家迭代时，准确率就达到了43.0%，低于Lean-STaR (45.5%)。这表明Lean-STaR的性能提升不仅仅来自于专家迭代的使用，思维增强也有不可忽略的效果。问题类型与难度MiniF2F-test中的问题有多个...……更多

2024-08-10 09:47:00顶新,成数,清华,模型,训练,高手

马立霜：运用人工智能技术提升产前诊断准确性护佑新生儿健康成

...现产前超声影像诊断领域的技术创新，最大程度提高诊断准确率。对此，马立霜有以下三方面建议。第一，科学普及推广生命至上的人文医学理念。胎儿期诊断出先天畸形并不可怕，及早诊断干预与治疗，可以最大限度改善患儿...……更多

2024-01-24 16:01:00马立,产前诊断,产前,人工智能,新生儿,人工

北京推动“生物多样性之都”建设率先建成生态综合感知模型库

...识别植物5800种、动物330种、鸟类1200余种、昆虫80多种，准确率达85%以上，有效解决生物监测数据“不全面、不准确、不及时”等难题，显著提升了首都野生动植物和病虫害智慧感知监测能力。5月21日，北京市生态保护新闻发布...……更多

2024-05-21 15:19:00多样性,北京,模型,生态,生物,建设

淳厚基金调研微光股份、华大基因

...法对传统生信分析整体进行优化，将显著提升数据分析的准确率和效率，并快速降低整体处理成本。从数据应用层面来看，数据的来源多样性保障了模型具备更强的泛化能力和对罕见病等复杂情况的处理能力。随着大模型相关技...……更多

2025-02-28 12:46:00微光,基因,调研,基金,股份,公司

多模态LLM视觉推理能力堪忧，浙大领衔用GPT-4合成数据构

...调模型。经过测试，人类在该基准上可以达到至少82.1%的准确率，但Claude 3.5 Sonnet和GPT-4o等顶流模型的成绩却远远落后于人类，分别只有64.7%和59.9%。目前全部数据已经上传至HuggingFace仓库。仓库地址：https://huggingface.co/da……更多

2024-08-08 16:23:00模态,领衔,基准,推理,视觉,能力

图结构转文本序列，大模型直接读懂！图推理性能大涨

...在节点计数任务中，所有方法都显示较低的平均误差，但准确率表现各异。基于度中心性和PageRank的方法表现最好，超过了基线方法。在最大度计算任务中，由于需要更复杂的计算过程，整体性能低于节点计数任务。使用默认节...……更多

2024-12-03 13:33:00序列,推理,模型,文本,性能,结构

春节流量给支付宝留下了什么？

...是能做的。”陈亮认为，当下AI技术的挑战主要在于提高准确率。以往依赖复杂且可行性不高的模板来调用功能，不仅难以保持高准确率，而且维护困难，导致项目难以持续，大模型技术的引入给LUI提供了更多的可能。基于大模...……更多

2024-02-16 12:00:00流量,支付,五福,支付,模型,蚂蚁

大模型是否有推理能力？DeepMind数月前的论文让AI社区

...消失。结果还表明，随着数据集大小的增加，模型的最终准确率会提高（在模型大小之间保持一致）。同样，作者观察到架构大小增加的总体趋势是无论数据集大小如何，整体性能都会提高。通过下表 2 可以得出以下几点：动作...……更多

2024-10-23 12:05:00推理,模型,能力,论文,社区,模型

【2025数博会】无相智研科研大模型AI平台：以数据要素重塑

...Agent深度融合：基于开源模型的微调，提升科研成果产出准确率显著；联邦学习确保数据合规流通；轻量化部署降低推理延迟至毫秒级。平台已与上海交通大学、成都电子科技大学共建联合实验室，验证了在科研实验设计场景的...……更多

2025-08-30 04:58:00科研,基础设施,要素,模型,设施,基础

网安周开幕｜绿盟大模型能力再获权威肯定，持续推动AI与网络安

...击链，并提出处置方案。综合指标包括检测与关联分析的准确率、漏报率及处置正确性。绿盟科技凭借智能体驱动的自动化分析与响应能力，实现了从“检测—分析—研判—处置”的智能化闭环，能够精准识别复杂攻击链并生成...……更多

2025-09-16 13:11:00深度,模型,肯定,能力,权威,安全

LLM仍然不能规划，刷屏的OpenAI o1远未达到饱和

...模型中，LLaMA 3.1 405B 在常规 Blocksworld 测试中表现最佳，准确率达到 62.6%。然而模型在 Mystery Blocksworld 的表现却远远落后——没有一个 LLM 在测试集上达到 5%，并且在一个领域上的性能并不能清楚地预测另一个领域的性能。这种结...……更多

2024-09-25 09:48:00饱和,规划,模型,测试,规划,能力

错误率从10%降至0.01%，领英全面分享LLM应用落地经验

...了提示，针对其中一些常见错误注入提示，以提高修补的准确率。我们最终能够将这些错误的发生率减少到约 0.01%。我们目前正在构建一个统一的技能注册表，用于在我们的生成式人工智能产品中，动态发现和调用打包为 LLM 友...……更多

2024-08-07 09:33:00错误率,落地,错误,经验,应用,智能

顾容霆|多维度协同推进银行审计效能提升

...计资源动态配置。通过智能风控模型，提升异常交易识别准确率。深化管理履职审计机制。推行“任中审计+离任审计”双轨制，建立管理人员“三维度”评价体系：财务维度设置资产质量、盈利水平等指标；合规维度涵盖监管...……更多

2025-03-27 22:18:00多维度,多维,效能,审计,银行,审计

无表情人脸预测政治信仰，AI准确率惊人！斯坦福研究登国际顶刊

...以从毫无表情的面部中，识别出一个人的政治倾向，而且准确率惊人。现在，科学家们已经证明，AI能够以惊人的准确度从面部，预测一个人的政治取向。不仅如此，即便是一个毫不「露怯」的面孔，也能精准识别。这么说来，...……更多

2024-07-25 09:33:00斯坦,斯坦福,人脸,准确率,信仰,表情

OpenAI掀小模型血战！苹果DCLM强势登场，碾压Mist

...时，除了MMLU分数，作者还自定义了两个指标——「核心准确率」（core）和「扩展准确率」（extended）。前者是包括HellaSwag和ARC-E在内的22个任务中心准确率的均值，后者则涵盖全部53个任务。与虽然使用的数据不是最多，但与其...……更多

2024-07-22 09:41:00血战,强势,模型,苹果,模型,数据

“上天”“入地”“下海” AI驱动中国科学创新加速前行

...了卓越的性能，尤其是在X级耀斑的预测上，达到了95%的准确率和100%的真实阳性率。“入地”对中国科学院的科研人员来说，做学问、做研究是他们的本分，分担国家重大任务是责任，为国民经济服务是目标。在追日问天的同时...……更多

2025-03-21 16:54:00中国科学,中国,驱动,科学,模型,珊瑚礁

医渡科技大模型首次赋能医美,携手广附院推出“美易智能体”

...案。依托专病库与智能体的协同，科室近半年的手术方案准确率提升23%，患者满意度达98.6%，这正是“数据+智能”赋能临床的生动实践。医渡科技硬核实力，让技术突破真正扎根临床医渡科技的核心竞争力，源于“数据治理+AI模...……更多

2025-08-12 19:07:00模型,智能,科技,数据,智能,专病

科学实施心理评估加强心理健康预警

...可能影响心理健康评分。已知的许多因素可能会对调查的准确率产生影响，包括数据收集模式（基于线上网络或纸笔问卷）、评估时间（期中或期末）等。最后，应积极使用可穿戴设备进行辅助评估，收集学生在日常生活中的客...……更多

2024-01-24 01:05:00心理,预警,心理健康,评估,科学,健康

开发人工智能软件、地铁轨道预警系统……河南这所高校大学生创业

...轮的退化特征，实现对车轮情况实时分析，故障分析结果准确率高达95%，评估结果更具工程物理意义和实用价值。结合优秀的故障检验机制，项目能够极大范围内减少轨道车轮日常运维检修的巨额花费，实现故障问题精准定位，...……更多

2024-05-28 19:59:00人工智能,河南,预警,轨道,人工,地铁

微软论文一张截图，曝出GPT-3.5仅有200亿参数？AI圈

...模型——CodeFusion。性能方面，7500万参数的CodeFusion在top-1准确率指标上，可以与最先进的350M-175B模型相媲美。论文地址：https://arxiv.org/abs/2310.17680这篇论文的工作很有意义，但引起大家格外注意的却是——作者在对比ChatGP……更多

2023-11-04 14:46:00微软,截图,参数,网友,论文,模型