• 我的订阅
  • 头条热搜
大模型浪潮不能使鬼推磨,但可以让周鸿祎、傅盛握手言和
...的案例,在微调、打磨后,大模型在细分专业领域的回答准确率从60%提升至97%。安全性是大模型To-B企业应用的首要问题。合同、财务、业务数据等公司机密,难以作为数据集去训练通用大模型。而OpenAI发布GPTs,将大模型应用商...……更多
...项目面积大、位置偏远、银行网点和人员不足、人工观察准确率不高等客观情况,银行在贷前资产价值评估或者贷后定期风险监管环节存在痛点,进而导致介入力度受限。而空天数据,尤其是卫星遥感数据具有地理覆盖面广、客...……更多
...断”模型进行了阈值调整等针对性算法升级,模型的预警准确率提升至75%,并建立了基于模型的雷达预警流程,对出现显著健康度下降的台站进行预警,每日提供杭州亚运会气象观测装备运行质量雷达智能诊断情况。9月23日杭州...……更多
菲尔兹奖得主亲测GPT-4o,经典过河难题破解失败!最强Claude 3.5回答离谱,LeCun嘲讽LLM
...推理问题。刚刚发布时,人类在HellaSwag上能达到超过95%的准确率,SOTA分数却始终难以超过48%。但这种情况并没有持续很久。各个维度的分数持续猛涨,2023年3月,GPT-4在HellaSwag上的各项得分就逼近,甚至超过了人类水平。 https://...……更多
对话北大赵东岩:为啥DeepSeek幻觉率这么高?用户如何避免被AI“欺骗”?
...问题,是否会导致其在行业应用面临较大的挑战?比如对准确率要求比较高的教育、医疗、金融等行业?赵东岩:是的,所以在这些关键领域,模型的对齐效果非常关键。实践中,可以通过多次校验,对齐,RAG来改善大模型的幻...……更多
CMU清华教LLM练成数学高手,LeanSTaR训练模型边思考边证明,登顶新SOTA
...增强),对比Lean-CoT和Lean-STaR的表现。仅用专家迭代时,准确率就达到了43.0%,低于Lean-STaR (45.5%)。这表明Lean-STaR的性能提升不仅仅来自于专家迭代的使用,思维增强也有不可忽略的效果。问题类型与难度MiniF2F-test中的问题有多个...……更多
马立霜:运用人工智能技术提升产前诊断准确性 护佑新生儿健康成长
...现产前超声影像诊断领域的技术创新,最大程度提高诊断准确率。对此,马立霜有以下三方面建议。第一,科学普及推广生命至上的人文医学理念。胎儿期诊断出先天畸形并不可怕,及早诊断干预与治疗,可以最大限度改善患儿...……更多
北京推动“生物多样性之都”建设 率先建成生态综合感知模型库
...识别植物5800种、动物330种、鸟类1200余种、昆虫80多种,准确率达85%以上,有效解决生物监测数据“不全面、不准确、不及时”等难题,显著提升了首都野生动植物和病虫害智慧感知监测能力。5月21日,北京市生态保护新闻发布...……更多
淳厚基金调研微光股份、华大基因
...法对传统生信分析整体进行优化,将显著提升数据分析的准确率和效率,并快速降低整体处理成本。从数据应用层面来看,数据的来源多样性保障了模型具备更强的泛化能力和对罕见病等复杂情况的处理能力。随着大模型相关技...……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
...调模型。经过测试,人类在该基准上可以达到至少82.1%的准确率,但Claude 3.5 Sonnet和GPT-4o等顶流模型的成绩却远远落后于人类,分别只有64.7%和59.9%。 目前全部数据已经上传至HuggingFace仓库。仓库地址:https://huggingface.co/da……更多
图结构转文本序列,大模型直接读懂!图推理性能大涨
...在节点计数任务中,所有方法都显示较低的平均误差,但准确率表现各异。基于度中心性和PageRank的方法表现最好,超过了基线方法。在最大度计算任务中,由于需要更复杂的计算过程,整体性能低于节点计数任务。使用默认节...……更多
春节流量给支付宝留下了什么?
...是能做的。”陈亮认为,当下AI技术的挑战主要在于提高准确率。以往依赖复杂且可行性不高的模板来调用功能,不仅难以保持高准确率,而且维护困难,导致项目难以持续,大模型技术的引入给LUI提供了更多的可能。基于大模...……更多
大模型是否有推理能力?DeepMind数月前的论文让AI社区吵起来了
...消失。结果还表明,随着数据集大小的增加,模型的最终准确率会提高(在模型大小之间保持一致)。同样,作者观察到架构大小增加的总体趋势是无论数据集大小如何,整体性能都会提高。通过下表 2 可以得出以下几点:动作...……更多
【2025数博会】无相智研科研大模型AI平台:以数据要素重塑科研基础设施
...Agent深度融合:基于开源模型的微调,提升科研成果产出准确率显著;联邦学习确保数据合规流通;轻量化部署降低推理延迟至毫秒级。平台已与上海交通大学、成都电子科技大学共建联合实验室,验证了在科研实验设计场景的...……更多
网安周开幕|绿盟大模型能力再获权威肯定,持续推动AI与网络安全深度融合
...击链,并提出处置方案。综合指标包括检测与关联分析的准确率、漏报率及处置正确性。绿盟科技凭借智能体驱动的自动化分析与响应能力,实现了从“检测—分析—研判—处置”的智能化闭环,能够精准识别复杂攻击链并生成...……更多
LLM仍然不能规划,刷屏的OpenAI o1远未达到饱和
...模型中,LLaMA 3.1 405B 在常规 Blocksworld 测试中表现最佳,准确率达到 62.6%。然而模型在 Mystery Blocksworld 的表现却远远落后——没有一个 LLM 在测试集上达到 5%,并且在一个领域上的性能并不能清楚地预测另一个领域的性能。这种结...……更多
错误率从10%降至0.01%,领英全面分享LLM应用落地经验
...了提示,针对其中一些常见错误注入提示,以提高修补的准确率。我们最终能够将这些错误的发生率减少到约 0.01%。我们目前正在构建一个统一的技能注册表,用于在我们的生成式人工智能产品中,动态发现和调用打包为 LLM 友...……更多
...计资源动态配置。通过智能风控模型,提升异常交易识别准确率。深化管理履职审计机制。推行“任中审计+离任审计”双轨制,建立管理人员“三维度”评价体系:财务维度设置资产质量、盈利水平等指标;合规维度涵盖监管...……更多
无表情人脸预测政治信仰,AI准确率惊人!斯坦福研究登国际顶刊
...以从毫无表情的面部中,识别出一个人的政治倾向,而且准确率惊人。现在,科学家们已经证明,AI能够以惊人的准确度从面部,预测一个人的政治取向。不仅如此,即便是一个毫不「露怯」的面孔,也能精准识别。这么说来,...……更多
OpenAI掀小模型血战!苹果DCLM强势登场,碾压Mistral 7B全开源
...时,除了MMLU分数,作者还自定义了两个指标——「核心准确率」(core)和「扩展准确率」(extended)。前者是包括HellaSwag和ARC-E在内的22个任务中心准确率的均值,后者则涵盖全部53个任务。与虽然使用的数据不是最多,但与其...……更多
“上天”“入地”“下海” AI驱动中国科学创新加速前行
...了卓越的性能,尤其是在X级耀斑的预测上,达到了95%的准确率和100%的真实阳性率。“入地”对中国科学院的科研人员来说,做学问、做研究是他们的本分,分担国家重大任务是责任,为国民经济服务是目标。在追日问天的同时...……更多
医渡科技大模型首次赋能医美,携手广附院推出“美易智能体”
...案。依托专病库与智能体的协同,科室近半年的手术方案准确率提升23%,患者满意度达98.6%,这正是“数据+智能”赋能临床的生动实践。医渡科技硬核实力,让技术突破真正扎根临床医渡科技的核心竞争力,源于“数据治理+AI模...……更多
科学实施心理评估 加强心理健康预警
...可能影响心理健康评分。已知的许多因素可能会对调查的准确率产生影响,包括数据收集模式(基于线上网络或纸笔问卷)、评估时间(期中或期末)等。最后,应积极使用可穿戴设备进行辅助评估,收集学生在日常生活中的客...……更多
开发人工智能软件、地铁轨道预警系统……河南这所高校大学生创业团队厉害了!
...轮的退化特征,实现对车轮情况实时分析,故障分析结果准确率高达95%,评估结果更具工程物理意义和实用价值。结合优秀的故障检验机制,项目能够极大范围内减少轨道车轮日常运维检修的巨额花费,实现故障问题精准定位,...……更多
微软论文一张截图,曝出GPT-3.5仅有200亿参数?AI圈巨震,网友大呼太离谱!
...模型——CodeFusion。性能方面,7500万参数的CodeFusion在top-1准确率指标上,可以与最先进的350M-175B模型相媲美。论文地址:https://arxiv.org/abs/2310.17680这篇论文的工作很有意义,但引起大家格外注意的却是——作者在对比ChatGP……更多
百度文心大模型4.0技术进展
...确知识,最后把这些找到的知识组装进Prompt送入大模型,准确率好,效率也高;另一方面,对大模型的输出进行反思,从生成结果中拆解出知识点,然后再利用搜索引擎、知识图谱、数据库,以及大模型本身进行确认,进而对有...……更多
揭秘:如何寻找、设计大模型产品并落地发布?
...本;人工 QA 成本(AI 一般少不了这部分,不然你无法做准确率的验证);研发开发成本。四、如何评价 AI 的工作,响应速度、准确率、稳定性? 通过以上实验,你已经可以知道 AI 的能力。但是怎么去评估 AI 的工作,响应速度...……更多
2025年,智能人才招聘系统将全面颠覆企业招聘生态!
...。据用友大易测试,大易招聘云的AI简历解析技术的解析准确率高达95%以上,即便是格式混乱、信息缺失的非标准简历,也可达到80%以上的解析准确率。 不仅如此,大易招聘云还可根据企业招聘需求,自动对候选人简历进行初步...……更多
汇付天下AI应用丨LLM在投诉风险管控中的应用实践
...明确、有备选答案且可选项有限,追求可控、可解释、高准确率为目标的业务方案。 开放式方案:通常应用于探索未知领域,无预设答案,无既定流程,目标也可以不用提前明确,需要进行发散思考,在反复试错、验证后最终...……更多
平安“鹰眼”上线15周年,中国风险减量经验何以输出全球?
...业。行业首创的“多源数据+大模型理解+县域预警”模型准确率达87.1%,显著提升防灾减灾效能。 如今这一技术能力与解决方案正加速出海,作为国内直保公司首个对外的全球风险管理平台,平安产险打造全球版风险减量服务统...……更多
更多关于科技的资讯:
潮聚湾区 创玩未来——《广州潮玩产业招商研究报告》发布会暨行业主题研讨会在荔湾成功举办
为精准把握潮玩产业蓬勃发展的时代脉搏,助力广州建设具有全球影响力的潮玩产业高地,12月11日,由广州市投资发展委员会办公室主办
2025-12-13 16:43:00
12日晚,第十届中国设计智造大奖(DIA)颁奖盛典在中国美术学院良渚校区举行。第十届中国设计智造大奖征集自2024年12月12日启动
2025-12-13 07:36:00
全球首个甲骨文智能体“殷契行止” 上线 最懂甲骨文的AI来了
小程序“了不起的甲骨文”,展示甲骨文“其”的不同字形。(本组图/小程序截图)甲骨拓本甲骨文“门”字 甲骨文摹本甲骨文“马”字扫码看视频 厦门网讯 (厦门日报教育工作室首席专家 佘峥 通讯员 王志鹏)你只需往电脑上传一张甲骨图片
2025-12-12 08:28:00
厦门网讯(厦门日报记者 曾嫣艳 通讯员 曾焕滨)昨日,厦门临空经济片区场景创新平台推广暨供需对接与企业路演活动在翔安创新实验室举办
2025-12-12 08:28:00
从流程到质量:制片人为短剧工业化提供的“52集样本”
在短剧行业从 “流量争夺” 转向 “品质与流程双竞争” 的关键阶段,如何在有限周期内平衡效率、成本与成片质量,成为所有制作机构必须破解的难题
2025-12-12 08:29:00
剧想天开,造梦未来|一场关于“儿童剧人物造型”的想象力实验
儿童戏剧,是投射在少年儿童心灵舞台上的第一束光。人物造型,作为这束光中最具象、最绚烂的色彩,不仅定义角色的灵魂,更深刻影响着儿童认知世界的方式与审美情感的塑造
2025-12-12 08:29:00
聚焦“中文+职业”融合:星禾星穗在世界中文大会展示校企合作新范式
在近期举办的2025世界中文大会上,教育企业星禾星穗多维度参与,展现了其在“中文+专业/职业”领域的系统思考与实践成果
2025-12-12 08:30:00
会打拳的机器人带你触摸未来 走进国家“芯火”双创基地象屿园区孵化加速器
元启创新的人形机器人正在打拳。(元启创新 供图)厦门网讯 (厦门日报记者 吴晓菁) “灵犀,灵犀,表演一段佛山醒狮。”昨日
2025-12-12 08:59:00
“数字丝路”赋能文化出海,中国数字文化扬帆全球新蓝海
2025年12月9日下午,一场聚焦数字文化出海与青年文化交流的“共建数字丝绸之路”研讨会在上海举行。中国传媒大学经济与管理学院教授方英
2025-12-12 09:00:00
AI 眼镜似乎成了AI具身智能行业中最“靓”的仔,无论是苹果、谷歌这些大厂,还是国内的科技巨头,纷纷下场。本周二,谷歌在The Android Show活动上宣布
2025-12-12 09:10:00
近日,中国人民银行苏州市分行反洗钱科公布2025年苏州市反洗钱征文比赛评审结果,苏州人保财险撰写的《破局与重构:保险公司在反洗钱履职的实践困境与创新路径研究》一文凭借深刻的问题剖析
2025-12-12 10:46:00
为提升员工职场软实力,优化内部沟通效能,12月7日,常熟人保财险琴川学府组织开展了“赋能职场进阶,高情商沟通与协作”专题培训
2025-12-12 10:56:00
长白时评评论员 刘颂寒声称“下载App必得大额红包”,旁边又用小字解释“仅限新人或以实际情况为准”;宣称“全场5折”,又在大大的“5折”后面跟个极小的“起”字……在日常的消费中
2025-12-12 10:56:00
在当前行业竞争加剧与市场环境多变的背景下,虎丘支公司持续推动降本增效工作,这既是应对挑战的必要举措,也是实现长期稳健经营的重要保障
2025-12-12 10:58:00
劳利近日“水银体温计明年起禁产”的话题引发热议。根据国家药监局此前发布的通知,自2026年1月1日起全面禁止生产含汞体温计产品
2025-12-12 11:01:00