准确率,实测,模型,能力,规划,模型头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

AI科学家太多，谁靠谱一试便知！普林斯顿新基准CORE-Be

...评估AI智能体在计算可重复性方面的表现，最简单任务的准确率可以达到60%，最难任务准确率仅有21%大模型的能力越来越强，用户在一些重要的任务中也可以依赖大模型，比如说辅助做科研。不过现有科研辅助相关的基准测试都...……更多

2024-09-26 13:38:00普林,普林斯顿,斯顿,准确率,基准,科学家

最新迭代人工智能模型生物结构预测准确率显著提升将助力药物研

... Labs团队研发的最新迭代人工智能模型AlphaFold3，能以较高准确率预测蛋白质与其他生物分子相互作用的结构，其准确率比之前的专用工具显著提升。AlphaFold3能预测含有蛋白质数据银行(Protein Data Bank)内几乎所有分子类型的复合物...……更多

2024-05-09 11:54:00迭代,准确率,人工智能,药物,人工,模型

每周分析3000＋篇医药文档　生成病历仅需15秒

...科研人员一遍又一遍地认识到大模型的能量。从分析结果准确率低、需人工二次确认到分析准确率提高至95%，从每月分析600余篇到每周3000＋篇医药相关信息文档，在海若大模型的加持下，齐鲁制药实现了效率和质量的双重飞跃...……更多

2024-05-22 13:59:00病历,仅需,生成,文档,医药,分析

多模态模型免微调接入互联网，即插即用新框架，效果超闭源方案

...ini 1.5 Pro、InternVL-1.5、LLaVA-1.6等。在UDK-VQA数据集上的回答准确率，则配备了SearchLVLMs的SOTA LVLMs超过了自带互联网检索增强的GPT-4o模型35%。开源框架SearchLVLMsSearchLVLMs框架主要由三部分组成：查询生成……更多

2024-11-11 13:34:00模态,接入,框架,模型,效果,互联网

广西电网发布全国首个电力生产应用场景大模型

...的缺陷隐患样本极少，传统小模型难以识别；且平均识别准确率低于80%，无法做到智能辅助、精确分析。南方电网广西电网公司机巡与不停电作业中心有关负责人介绍，以往依靠小模型对线路巡检图像查缺，可能会把铁塔上的树...……更多

2024-01-19 18:35:00电力生产,广西,电网,模型,场景,电力

武汉专家开发AI模型助力胰腺癌诊断

...内部、外部和前瞻性数据集中，测试了该模型，结果显示准确率达98%。团队还进行了一项前瞻交叉试验，以进一步评估AI模型的性能和辅助能力。结果显示，该模型的准确率相较于专家内镜医师、资深内镜医师与新手内镜医师均...……更多

2024-08-07 13:45:00胰腺癌,胰腺,武汉,模型,专家,开发

为AI加速而生英特尔第五代至强CPU带来AI新表现

...用,也被第四代至强® 可扩展处理器赋予了新的“灵魂”,准确率飙升、响应延迟更低。同样,就在不久之前,借助第四代至强®️ 可扩展处理器在NLP上的优化,专攻医疗行业的大语言模型也成功以较低成本在医疗机构部署落地。在AI...……更多

2023-12-25 19:02:00英特,英特尔,英特,英特尔,处理器,处理

奥林匹克竞赛里选最聪明的AI：Claude-3.5-Sonn

...过基于规则的匹配进行评估，研究团队对非编程任务使用准确率，并对编程任务使用公正的pass@k指标，定义如下：本次评估中设定k = 1且n = 5，c表示通过所有测试用例的正确样本数量。奥林匹克竞技场奖牌榜：与奥运会使用的...……更多

2024-06-25 09:45:00奥林,奥林匹克,竞赛,模型,推理,能力

京东2024年四季度收入增长13.4%，产业场景成为AI应用

...经营问题、执行快捷操作，利用多智能体协同技术，决策准确率超过90%。在医疗健康场景，2025年以来，依托“京医千询”医疗大模型技术底座，京东健康发布了基于线上全域场景的大模型全系产品“AI京医”，以及业内第一个面...……更多

2025-03-07 16:23:00京东,沃土,场景,四季,收入,增长

机器学习助力预测全球变暖趋势：30秒完成22天大气模拟

...依次向前推进系统。图片来自谷歌研究NeuralGCM的气候模拟准确率与最好的机器学习和物理方法相当。该模型对1-15天预报的准确率能媲美欧洲中期天气预报中心（ECMWF，最好的传统物理天气模型之一）的预测结果。对于最多提前10...……更多

2024-07-24 21:07:00天大,机器,趋势,学习,全球,气候

中国财税GPT迎来最准确的大模型：小竹财税AI问世

...对高效解决财税问题的需求日益迫切。作为中国财税领域准确率领先的垂直大模型，小竹财税AI将不断提升其逻辑推理和上下文理解能力，以更好地满足用户的需求，努力实现“让天下没有难懂的财税”的目标。期待小竹财税在A...……更多

2024-03-14 13:30:00中国,模型,模型,领域,需求,正确率

云鼎科技：基于DeepSeek，打造垂域矿山大模型

...山能知识助手中，经测试，安全生产知识场景中对话问答准确率达96%以上。NLP 应用智能体，打通应用落地“最后一公里”只有垂域矿山大模型还不够，真正深入核心业务环节还需要链接应用，基于这个需求，云鼎科技打造了NLP...……更多

2025-02-26 22:55:00矿山,模型,科技,模型,应用,数据

酷开超级智能体获国内首张AI硬件智能体应用成熟度证书

...障内容检索效率与速度。在用户交互感知层面，情感识别准确率达95%，并能动态调整交互策略；情景记忆实现“永久存储+关键信息零丢失”，复杂场景下仍保持高准确率；执行能力覆盖多模态操作，任务成功率与响应速度均达...……更多

2025-07-31 14:59:00智能,成熟度,证书,成熟,硬件,应用

讯飞星火X1全面升级领跑教育、医疗、司法行业应用

...性和准确性。代码能力上，星火X1不仅提高了代码生成的准确率，对生成代码逻辑理解也进一步提升，能够应对更复杂的编程需求，思考问题的多种可能性，帮助开发者快速实现功能。在语言理解方面，模型输出内容、格式更加...……更多

2025-04-22 16:50:00讯飞,星火,行业应用,司法,升级,医疗

临沭县审计局：构建AI赋能智慧审计体系

...政审计、投资审计等专项分析子系统，实现审计疑点识别准确率提升40%以上。场景创新激发应用活力。建立“场景实验室”工作机制，各业务科室结合经济责任审计、专项资金审计等不同监督场景开展沙盘推演。重点探索私有化...……更多

2025-07-11 17:10:00临沭县,临沭,审计局,审计,体系,智慧

“奇点”临近，产业应用与人工智能怎样“共同进化”

...、机动车、非机动车等复杂道路环境时，会出现交互识别准确率下降等问题。”省智能网联汽车产业创新联盟理事长、江苏智行未来汽车研究院院长华国栋举例说，比如，如何将10米以内的目标障碍物识别误差控制在5厘米以内，...……更多

2024-06-17 04:55:00奇点,人工智能,进化,人工,智能,产业

海信重磅发布“云信·通途交通大模型”：以AI之力，解锁智

...报数据，系统通过“大小模型协同+RAG检索”技术，实现准确率超98%的舆情精准定位，并能够超前预警潜在舆情风险；在自动化指挥调度环节，系统基于众多城市交通保障经验与专家经验，融合实时路况与三级预测体系，能够实...……更多

2025-04-24 16:17:00海信,交通,通途,智能交通,重磅,模型

游戏bug帮大模型学物理！准确率超GPT4o近4个百分点

...GPT-4o和Gemini-1.5-pro表现最佳，分别达到了56.1%和55.2%的平均准确率。在所有细分领域中，GPT-4o在摩擦和加速度方面表现优越。相比之下，Gemini-1.5-pro在理解与重力、弹性、反射、吸收与透射、颜色和刚性相关的物理常识方面表现更...……更多

2024-12-07 09:53:00准确率,百分点,百分,模型,物理,视频

空间智能版ImageNet来了！李飞飞吴佳俊团队出品

...验评估方面，HourVideo采用五选多任务问答（MCQ）任务，以准确率作为评估指标，分别报告每个任务以及整个数据集的准确率。由于防止信息泄露是评估长视频中的MCQ时的一个重要挑战——理想情况下，每个MCQ应独立评估，但这种...……更多

2024-11-11 13:31:00团队,智能,空间,视频,模态,模型

常见电子邮件分类算法的性能分析

...贝叶斯算法学习曲线，红色线代表测试集(学习过程中)的准确率(Score)，绿色线代表该模型在测试集上的准确率，线两侧的半透明带的宽度代表方差(方差越小，模型稳定性越好，泛化性能越好)。从图1可看出，随着训练量(Train examp...……更多

2024-08-26 09:59:00性能分析,算法,电子邮件,性能,常见,邮件

浙里有AI，电信服务更有爱

...，提升工单处理效率，并搭建自学习训练流程，稳步提升准确率，工单结案时长也由原来的4-5分钟压缩至1-2分钟。话后—智能分析短板，提升服务能效面向后台支撑人员，如质检人员，为快速提升质检效率与质量，上线了服务质...……更多

2024-11-14 18:18:00电信服务,电信,服务,服务,模型,用户

媲美OpenAI事实性基准，这个中文评测集让o1-previ

...T-4o mini 仅 37.6 分，ChatGLM3-6B 和 Qwen2.5-1.5B 仅 11.2 和 11.1 的准确率。基于中文 SimpleQA，我们对现有 LLM 的事实性能力进行了全面的评估。并维护一个全面的 leaderboard 榜单。同时我们也在评测集上实验分析了推理 s……更多

2024-11-21 09:43:00事实性,基准,中文,评测,事实,模型

无一大模型及格！北大/通研院提出超难基准，评估长文本理解生

...T4-8k、GPT3.5-turbo-6k、LlamaIndex这种商业模型，平均只有40%的准确率。而像开源模型表现就更不理想了…ChatGLM2-6B、LongLLaMa-3B、RWKV-4-14B-pile、LLaMA-7B-32K平均只有10%的准确率。目前该论文已被ACL 2024接……更多

2024-08-08 09:39:00基准,北大,生成,模型,文本,评估