• 我的订阅
  • 头条热搜
大模型浪潮不能使鬼推磨,但可以让周鸿祎、傅盛握手言和
...的案例,在微调、打磨后,大模型在细分专业领域的回答准确率从60%提升至97%。安全性是大模型To-B企业应用的首要问题。合同、财务、业务数据等公司机密,难以作为数据集去训练通用大模型。而OpenAI发布GPTs,将大模型应用商...……更多
...项目面积大、位置偏远、银行网点和人员不足、人工观察准确率不高等客观情况,银行在贷前资产价值评估或者贷后定期风险监管环节存在痛点,进而导致介入力度受限。而空天数据,尤其是卫星遥感数据具有地理覆盖面广、客...……更多
...断”模型进行了阈值调整等针对性算法升级,模型的预警准确率提升至75%,并建立了基于模型的雷达预警流程,对出现显著健康度下降的台站进行预警,每日提供杭州亚运会气象观测装备运行质量雷达智能诊断情况。9月23日杭州...……更多
菲尔兹奖得主亲测GPT-4o,经典过河难题破解失败!最强Claude 3.5回答离谱,LeCun嘲讽LLM
...推理问题。刚刚发布时,人类在HellaSwag上能达到超过95%的准确率,SOTA分数却始终难以超过48%。但这种情况并没有持续很久。各个维度的分数持续猛涨,2023年3月,GPT-4在HellaSwag上的各项得分就逼近,甚至超过了人类水平。 https://...……更多
对话北大赵东岩:为啥DeepSeek幻觉率这么高?用户如何避免被AI“欺骗”?
...问题,是否会导致其在行业应用面临较大的挑战?比如对准确率要求比较高的教育、医疗、金融等行业?赵东岩:是的,所以在这些关键领域,模型的对齐效果非常关键。实践中,可以通过多次校验,对齐,RAG来改善大模型的幻...……更多
CMU清华教LLM练成数学高手,LeanSTaR训练模型边思考边证明,登顶新SOTA
...增强),对比Lean-CoT和Lean-STaR的表现。仅用专家迭代时,准确率就达到了43.0%,低于Lean-STaR (45.5%)。这表明Lean-STaR的性能提升不仅仅来自于专家迭代的使用,思维增强也有不可忽略的效果。问题类型与难度MiniF2F-test中的问题有多个...……更多
马立霜:运用人工智能技术提升产前诊断准确性 护佑新生儿健康成长
...现产前超声影像诊断领域的技术创新,最大程度提高诊断准确率。对此,马立霜有以下三方面建议。第一,科学普及推广生命至上的人文医学理念。胎儿期诊断出先天畸形并不可怕,及早诊断干预与治疗,可以最大限度改善患儿...……更多
北京推动“生物多样性之都”建设 率先建成生态综合感知模型库
...识别植物5800种、动物330种、鸟类1200余种、昆虫80多种,准确率达85%以上,有效解决生物监测数据“不全面、不准确、不及时”等难题,显著提升了首都野生动植物和病虫害智慧感知监测能力。5月21日,北京市生态保护新闻发布...……更多
淳厚基金调研微光股份、华大基因
...法对传统生信分析整体进行优化,将显著提升数据分析的准确率和效率,并快速降低整体处理成本。从数据应用层面来看,数据的来源多样性保障了模型具备更强的泛化能力和对罕见病等复杂情况的处理能力。随着大模型相关技...……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
...调模型。经过测试,人类在该基准上可以达到至少82.1%的准确率,但Claude 3.5 Sonnet和GPT-4o等顶流模型的成绩却远远落后于人类,分别只有64.7%和59.9%。 目前全部数据已经上传至HuggingFace仓库。仓库地址:https://huggingface.co/da……更多
图结构转文本序列,大模型直接读懂!图推理性能大涨
...在节点计数任务中,所有方法都显示较低的平均误差,但准确率表现各异。基于度中心性和PageRank的方法表现最好,超过了基线方法。在最大度计算任务中,由于需要更复杂的计算过程,整体性能低于节点计数任务。使用默认节...……更多
春节流量给支付宝留下了什么?
...是能做的。”陈亮认为,当下AI技术的挑战主要在于提高准确率。以往依赖复杂且可行性不高的模板来调用功能,不仅难以保持高准确率,而且维护困难,导致项目难以持续,大模型技术的引入给LUI提供了更多的可能。基于大模...……更多
大模型是否有推理能力?DeepMind数月前的论文让AI社区吵起来了
...消失。结果还表明,随着数据集大小的增加,模型的最终准确率会提高(在模型大小之间保持一致)。同样,作者观察到架构大小增加的总体趋势是无论数据集大小如何,整体性能都会提高。通过下表 2 可以得出以下几点:动作...……更多
【2025数博会】无相智研科研大模型AI平台:以数据要素重塑科研基础设施
...Agent深度融合:基于开源模型的微调,提升科研成果产出准确率显著;联邦学习确保数据合规流通;轻量化部署降低推理延迟至毫秒级。平台已与上海交通大学、成都电子科技大学共建联合实验室,验证了在科研实验设计场景的...……更多
网安周开幕|绿盟大模型能力再获权威肯定,持续推动AI与网络安全深度融合
...击链,并提出处置方案。综合指标包括检测与关联分析的准确率、漏报率及处置正确性。绿盟科技凭借智能体驱动的自动化分析与响应能力,实现了从“检测—分析—研判—处置”的智能化闭环,能够精准识别复杂攻击链并生成...……更多
LLM仍然不能规划,刷屏的OpenAI o1远未达到饱和
...模型中,LLaMA 3.1 405B 在常规 Blocksworld 测试中表现最佳,准确率达到 62.6%。然而模型在 Mystery Blocksworld 的表现却远远落后——没有一个 LLM 在测试集上达到 5%,并且在一个领域上的性能并不能清楚地预测另一个领域的性能。这种结...……更多
错误率从10%降至0.01%,领英全面分享LLM应用落地经验
...了提示,针对其中一些常见错误注入提示,以提高修补的准确率。我们最终能够将这些错误的发生率减少到约 0.01%。我们目前正在构建一个统一的技能注册表,用于在我们的生成式人工智能产品中,动态发现和调用打包为 LLM 友...……更多
...计资源动态配置。通过智能风控模型,提升异常交易识别准确率。深化管理履职审计机制。推行“任中审计+离任审计”双轨制,建立管理人员“三维度”评价体系:财务维度设置资产质量、盈利水平等指标;合规维度涵盖监管...……更多
无表情人脸预测政治信仰,AI准确率惊人!斯坦福研究登国际顶刊
...以从毫无表情的面部中,识别出一个人的政治倾向,而且准确率惊人。现在,科学家们已经证明,AI能够以惊人的准确度从面部,预测一个人的政治取向。不仅如此,即便是一个毫不「露怯」的面孔,也能精准识别。这么说来,...……更多
OpenAI掀小模型血战!苹果DCLM强势登场,碾压Mistral 7B全开源
...时,除了MMLU分数,作者还自定义了两个指标——「核心准确率」(core)和「扩展准确率」(extended)。前者是包括HellaSwag和ARC-E在内的22个任务中心准确率的均值,后者则涵盖全部53个任务。与虽然使用的数据不是最多,但与其...……更多
“上天”“入地”“下海” AI驱动中国科学创新加速前行
...了卓越的性能,尤其是在X级耀斑的预测上,达到了95%的准确率和100%的真实阳性率。“入地”对中国科学院的科研人员来说,做学问、做研究是他们的本分,分担国家重大任务是责任,为国民经济服务是目标。在追日问天的同时...……更多
医渡科技大模型首次赋能医美,携手广附院推出“美易智能体”
...案。依托专病库与智能体的协同,科室近半年的手术方案准确率提升23%,患者满意度达98.6%,这正是“数据+智能”赋能临床的生动实践。医渡科技硬核实力,让技术突破真正扎根临床医渡科技的核心竞争力,源于“数据治理+AI模...……更多
科学实施心理评估 加强心理健康预警
...可能影响心理健康评分。已知的许多因素可能会对调查的准确率产生影响,包括数据收集模式(基于线上网络或纸笔问卷)、评估时间(期中或期末)等。最后,应积极使用可穿戴设备进行辅助评估,收集学生在日常生活中的客...……更多
开发人工智能软件、地铁轨道预警系统……河南这所高校大学生创业团队厉害了!
...轮的退化特征,实现对车轮情况实时分析,故障分析结果准确率高达95%,评估结果更具工程物理意义和实用价值。结合优秀的故障检验机制,项目能够极大范围内减少轨道车轮日常运维检修的巨额花费,实现故障问题精准定位,...……更多
微软论文一张截图,曝出GPT-3.5仅有200亿参数?AI圈巨震,网友大呼太离谱!
...模型——CodeFusion。性能方面,7500万参数的CodeFusion在top-1准确率指标上,可以与最先进的350M-175B模型相媲美。论文地址:https://arxiv.org/abs/2310.17680这篇论文的工作很有意义,但引起大家格外注意的却是——作者在对比ChatGP……更多
百度文心大模型4.0技术进展
...确知识,最后把这些找到的知识组装进Prompt送入大模型,准确率好,效率也高;另一方面,对大模型的输出进行反思,从生成结果中拆解出知识点,然后再利用搜索引擎、知识图谱、数据库,以及大模型本身进行确认,进而对有...……更多
揭秘:如何寻找、设计大模型产品并落地发布?
...本;人工 QA 成本(AI 一般少不了这部分,不然你无法做准确率的验证);研发开发成本。四、如何评价 AI 的工作,响应速度、准确率、稳定性? 通过以上实验,你已经可以知道 AI 的能力。但是怎么去评估 AI 的工作,响应速度...……更多
2025年,智能人才招聘系统将全面颠覆企业招聘生态!
...。据用友大易测试,大易招聘云的AI简历解析技术的解析准确率高达95%以上,即便是格式混乱、信息缺失的非标准简历,也可达到80%以上的解析准确率。 不仅如此,大易招聘云还可根据企业招聘需求,自动对候选人简历进行初步...……更多
汇付天下AI应用丨LLM在投诉风险管控中的应用实践
...明确、有备选答案且可选项有限,追求可控、可解释、高准确率为目标的业务方案。 开放式方案:通常应用于探索未知领域,无预设答案,无既定流程,目标也可以不用提前明确,需要进行发散思考,在反复试错、验证后最终...……更多
平安“鹰眼”上线15周年,中国风险减量经验何以输出全球?
...业。行业首创的“多源数据+大模型理解+县域预警”模型准确率达87.1%,显著提升防灾减灾效能。 如今这一技术能力与解决方案正加速出海,作为国内直保公司首个对外的全球风险管理平台,平安产险打造全球版风险减量服务统...……更多
更多关于科技的资讯:
蚂蚁集团大动作!“阿福”APP来了:新增健康陪伴功能 问答能力升级
12月15日消息,蚂蚁集团宣布旗下AI健康应用AQ品牌升级为“蚂蚁阿福”,并发布APP新版本,升级健康问答、健康陪伴、健康服务三大功能
2025-12-17 10:18:00
项目卡壳90%是资源管理“掉链子” ?易趋教你四步破局
“张总,研发部李工被临时抽去支持紧急项目,咱们的核心模块开发得延期了”,“设备组反馈,原定下周到位的测试服务器,现在还在另一个项目组占用着”
2025-12-17 11:10:00
远见协同:解码米连科技稳健发展的深层动能
在互联网行业潮起潮落、监管环境持续完善的背景下,一家企业如何锚定航向,实现可持续的稳健增长?这不仅考验着创始团队的初心
2025-12-17 11:10:00
赋能印度农业现代化丨潍柴雷沃亮相第33届印度浦那国际农业展
鲁网12月17日讯日前,第33届印度浦那国际农业展KISAN在浦那国际展览中心举办。作为印度西部规模最大、最具影响力的农业展会
2025-12-17 11:18:00
面对“哪些中国企业全球化做的不错?”这一问题,联想集团无疑是具有代表性的答案之一。作为出海时间早、全球化程度深的中国企业
2025-12-17 11:52:00
京东产发与日日顺达成全球战略合作 共建超级供应链新生态
近日,京东产发与日日顺供应链正式达成全球战略合作,建立共创共赢的生态战略合作关系。 双方在物流基础设施、仓配网络、供应链管理等良好的合作基础上
2025-12-17 10:11:00
【宅男财经|专家面对面】当前许多年轻人热衷于“谷子”、棉花娃娃等小众二次元文化产品。针对年轻人为何更偏爱此类小众消费,中国广告协会会长
2025-12-17 10:12:00
“我喜欢我”:vivo S50系列携“告白”美学与长焦Live,开启自我表达新旅程
2025年12月15日,vivo正式发布全新 vivo S50系列,包括 vivo S50 与 vivo S50 Pro mini 两款新品
2025-12-17 10:18:00
聚焦企业福祉与跨境管理 百年人寿协办德国商会专题论坛共话创新解决方案
2025年12月5日,一场聚焦于在华企业福利创新与人力资源挑战的高端论坛于北京成功举行。本次活动由中国德国商会与安顾方胜联合主办
2025-12-17 10:18:00
为积极响应全民消费热潮,充分发挥金融服务实体经济的重要作用,江苏银行围绕 “双十二” 消费节点,精心部署多项线上促消费举措
2025-12-17 10:18:00
王志顺最近,社交平台被一批“装修博主”刷屏了——清一色的夫妻站在新家门口微笑合影,有的怀里还抱着婴儿,配文都是“装修已定”“聊聊感受”
2025-12-17 10:40:00
新闻纵深|“十四五 ”微记忆③:“丝网二代”的智造突围
阅读提示数智浪潮,奔涌而至。过去五年,人工智能等前沿科技,以不可逆转之势重塑千行百业。在安平,年轻的“丝网二代”逯千里
2025-12-17 08:09:00
国潮服饰消费热度 仍在上升
近期,在多地举行的时装周秀场上,马面裙等国潮服饰一经亮相就成为全场焦点;森马等传统服装品牌于近期宣布将推出国潮系列产品
2025-12-17 07:18:00
12月11日,我国自主研发的高空长航时多用途重型“九天苍穹”无人航空通用平台在陕西圆满完成首飞任务。这款性能位居全球前列的大型通用无人机横空出世
2025-12-17 07:35:00
记者走基层|手机没电没网 也能“硬核”付款
12月9日,雄安新区商务服务中心雄礼记商店内,市民孟令双(左)在手机关机的情况下,通过“碰一碰”完成购物付款。河北日报见习记者 康晓博摄“嘀”一声
2025-12-17 08:03:00