• 我的订阅
  • 头条热搜
360智脑7b参数模型采用3.4万亿tokens训练
...本能力的一种方法)中,360Zhinao-7B-Chat-360K达到98%以上的准确率。360仿照SuperCLUE-200K测评基准构造了中文大海捞针测试,同样做到了98%以上的准确率。除模型权重外,该模型的微调训练代码,推理代码等全套工具集也被一并开源,...……更多
不仅仅是「GPTs」,支付宝在做一种很新的智能体
...」之处远不止于此,更大的优势在于蚂蚁背后多年技术、知识、经验积累,水到渠成地走向专业智能体路线。以医疗领域为例,支付宝和上海市第一医院联合打造 了Al 就医助理「公济小壹」。为应对医疗领域的业知识的短板,...……更多
Meta祭出三篇最详尽Llama微调指南!千字长文,0基础小白必备
...的可靠性。以下是两个案例:- Phi-2对金融数据情绪分析准确率,从34%提高到85%。- 仅用100个示例,ChatGPT对Reddit评论情绪分析的准确率从48%提高到73%。通常来说,对于较小的初始精度(<50%),微调是一个巨大的障碍,需要用几...……更多
致敬浪潮“她”力量丨成功秘诀?不过是把“我能行”,用代码写了千万遍
...,最终给出合理的答案。“最开始的测试中,我们的模型准确率只能达到89%左右,而且还存在知识文档检索召回效果差,通过模型检索召回知识文档但选择正确答案的效果差,无论如何调试,还是无法达到预期的效果。”“面对...……更多
荣耀Magic V5发布,一文看懂YOYO到底有多强大
...息和自动执行任务方面表现出色,例如,MagicGUI模型操作准确率高达91.5%,MagicVL-Nano端侧模型可在保护用户隐私安全基础上实现低功耗图像理解;此外,荣耀构建的三款云端大语言模型,可实现个性化推理、精准理解用户意图;...……更多
石油巨头牵手DeepSeek
...行业的数学公式、化学结构式、专业图表等专业内容时,准确率较高,能够有效支撑行业数据集建设和行业模型训练。 下一步,将进一步完善集团人工智能技术体系,提升石油化工行业大模型的训练质量,实现深度推理与行业...……更多
大模型是否有推理能力?DeepMind数月前的论文让AI社区吵起来了
...消失。结果还表明,随着数据集大小的增加,模型的最终准确率会提高(在模型大小之间保持一致)。同样,作者观察到架构大小增加的总体趋势是无论数据集大小如何,整体性能都会提高。通过下表 2 可以得出以下几点:动作...……更多
思维链让大模型推理更准确?谷歌早于OpenAI押中o1模型核心原理
...。根据结果,二者差异显著,其中,前者正确解决问题的准确率是 13.4%,而 o1 的准确率则能够达到 83.3%。这种推理能力的重要意义在于,有望在更广泛的领域应用,例如,药物发现、材料科学、编程、高等数学和物理等。o1 实...……更多
京东:推动大模型加快落地应用  助力培育发展新质生产力
... 2024年07月30日 第 16 版)生成图片采纳率达65%、营销文案准确率超95%,生成式人工智能(AIGC)营销工具“京点点”已经服务20多万户商家,助力商家提升运营效率;快递员只需语音录入,就能给用户发去送货短信,还能通过提问...……更多
联发科天玑9400+拿下最强AI手机芯片:端侧推理准确率反超云端大模型
...玑9400的1.25倍,支持最高8B规模的DeepSeek-R1端测部署,推理准确率反超云端大模型。天玑9400+行业首发增强型推理解码技术(SpD+),推理解码能力提升20%,同时集成天玑AI智能体化引擎,可将传统A应用程序升级为更先进的智能体化...……更多
英伟达发布Llama-3.1-Nemotron-51B AI 模型
...保持了几乎相同的精度情况下,推理速度提高了 2.2 倍。准确率能效MT BenchMMLUText generation(128/1024)Summarization/ RAG (2048/128)Llama-3.1- Nemotron-51B- Instruct8……更多
以图灵机为师:通过微调训练让大语言模型懂执行计算过程
...EF 可在 7 种经典数学算术运算的测试中实现了近乎 100% 的准确率,且能够支撑 100 位操作数的计算,而同等难度下, GPT-4o 在一些算术问题测试中无法正确给出计算结果。 论文标题:Executing Arithmetic: Fine-Tuning Large Language ……更多
CMU清华教LLM练成数学高手,LeanSTaR训练模型边思考边证明,登顶新SOTA
...增强),对比Lean-CoT和Lean-STaR的表现。仅用专家迭代时,准确率就达到了43.0%,低于Lean-STaR (45.5%)。这表明Lean-STaR的性能提升不仅仅来自于专家迭代的使用,思维增强也有不可忽略的效果。问题类型与难度MiniF2F-test中的问题有多个...……更多
智慧家庭重磅文件,征求意见稿来了!事关千亿市场、8大应用场景
...拟现实交互以及多模态交互的交互终端、交互流程、响应准确率与响应时间要求等标准;互联互通针对跨品牌、跨平台智慧家庭设备的识别、访问、控制,包括总体要求、云云互联、端云互联、端端互联、注册入网、设备模型等...……更多
OceanBase发布首款AI数据库seekdb,探索数据库AI范式的跃迁
...seekdb(简称seekdb)。开发者仅需三行代码,即可快速构建知识库、智能体等AI应用,轻松应对百亿级多模数据检索,真正实现“开箱即用”的AI数据基座。该产品支持向量、全文、标量及空间地理数据的统一混合搜索,深度融合AI...……更多
...重要线索,如果模型拥有更长的“思考时间”,它的解题准确率就会显著提高。为什么“长”如此关键?胡倞成解释,Transformer 计算深度有限,只能做有限步的计算,复杂问题如果不能拆分,就超出了模型的处理能力。只有当模...……更多
无一大模型及格! 北大/通研院提出超难基准,评估长文本理解生成
...T4-8k、GPT3.5-turbo-6k、LlamaIndex这种商业模型,平均只有40%的准确率。而像开源模型表现就更不理想了…ChatGLM2-6B、LongLLaMa-3B、RWKV-4-14B-pile、LLaMA-7B-32K平均只有10%的准确率。目前该论文已被ACL 2024接……更多
2023年度“星河产业应用创新奖”揭晓,国网智研院、宝马等10家企业项目获奖
...司数百人的 IT 核心团队及庞大的供应商团队,解决问题准确率大幅提升的同时,降低约 30%的推理费用和时间。上海南洋万邦软件技术有限公司基于⻜桨和文心大模型打造一站式节能减碳方案,立足产业需求,从碳感知、碳计算...……更多
OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性
...其专门用于评估模型在化学、物理和生物学等领域的专业知识水平,并邀请了拥有相关领域博士学位的专家参与测试。测试结果显示,o1不仅成功完成了测试,更是超越了博士表现,成为首个在GPQA diamond 基准上击败人类专家的AI...……更多
...款 2 亿日元,并计划在 2024 财年将拨款提升至 3 亿日元。准确率可达 70%,科学家利用 AI 解读狗的叫声:研究发现,用于训练人类语音的 AI 模型可以作为训练动物交流模型的起点。这一模型的主要障碍是缺乏公开可用的数据。研...……更多
​海信重磅发布“云信·通途交通大模型”: 以AI之力,解锁智能交通无限可能
...报数据,系统通过“大小模型协同+RAG检索”技术,实现准确率超98%的舆情精准定位,并能够超前预警潜在舆情风险;在自动化指挥调度环节,系统基于众多城市交通保障经验与专家经验,融合实时路况与三级预测体系,能够实...……更多
重磅!TeleAI 完成首个全国产化万卡万参大模型训练
...rompt 设计、多模型的投票机制等手段,进一步提高了模型准确率和鲁棒性,最终以领先第二名将近 3 分的绝对优势排名第一。开源共享,引领创新TeleChat2-115B 的开源标志着大模型国产化迈进了又一个新征程。作为最早布局并首先...……更多
港中文团队提出大模型元推理范式,革新大模型的评价体系
...:在教育领域,如果 GPT4 在小学级别的数学题目上的评测准确率只有四成,那么我们难免会对 GPT4 的实用性产生怀疑。在咨询领域,大模型的应用场景高度依赖于对不同方案的推演、整体步骤的拆分、解析等能力。而当今大模型...……更多
清华开源混合精度推理系统MixQ:大模型近无损量化并提升推理吞吐
...合精度量化的LlaMA模型在MMLU 20个领域上的数据集进行推理准确率测试表明,采用8bit混合精度量化后的准确率下降不到0.1%:△图6 混合精度量化分类准确率不过,此前已有的混合精度量化的系统的性能普遍不高,主要瓶颈在针对...……更多
腾讯推出PDF识别神器:复杂文档解析准确率超98%
...能推理并对表格数据和结构进行正确复原,极大提高识别准确率。每次复制表格都数据错位的人有福了!不仅中英文,它还支持20+语言,以及繁体字、生僻字等多种类字体。更惊喜的是,它还支持将识别后的图片、PDF文档转换为...……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
...调模型。经过测试,人类在该基准上可以达到至少82.1%的准确率,但Claude 3.5 Sonnet和GPT-4o等顶流模型的成绩却远远落后于人类,分别只有64.7%和59.9%。 目前全部数据已经上传至HuggingFace仓库。仓库地址:https://huggingface.co/da……更多
OpenAI直播第二弹!奥特曼2024年最大惊喜竟来自字节?强化微调让o1-mini逆袭o1
...今最强的基础模型o1。其中,强化微调版的o1 mini,在Top-1准确率上直接跃升180%达到了31%,远超o1的25%。 对此,奥特曼激动地表示:「这项工作效果出奇得好,是我2024年最大的惊喜之一!非常期待大家会用它去构建什么。」目前...……更多
HDC2025开发者主题演讲精彩回顾:HarmonyOS体验再升级 开发效率跃升
...带来全新开发体验;AI辅助编程工具DevEco CodeGenie持续提升准确率,带来问题修复、UI生成等核心功能,使能更多高频场景;多设备高效开发解决方案,实现一次开发、多端部署,把复杂留给系统,把方便留给开发者。此外,为精...……更多
实力蝉联!中能拾贝再获IDC工业大模型权威认证,持续领跑能源电力智能化赛道
...,集成海量行业语料与专业知识,显著提升专业内容理解准确率与应用可用性。拾贝缘起&拾贝聚能:?专业模型构建框架与大模型推理平台,提供数据预处理、模型训练、管理、云边协同等全生命周期管理能力。拾贝智源:?...……更多
京东云:智能体大规模“上岗”,企业深度应用正当时
...识别模板,进行指标试算、验证,自动生成新报告,识别准确率超98%,已深度应用在北京亦庄、上海普陀等政务平台上。技术栈迎来全面重构 AI基础设施走向标准化随着大模型应用的深入,以CPU为中心的架构在支持AI原生应用上...……更多
更多关于科技的资讯:
专利技术遭盗用,创新成果被侵犯,专利权人该如何维权?11月24日,市知识产权纠纷调委会通过一起实用新型专利侵权的调解案例释法
2025-11-26 08:11:00
感恩节“心”守护:灵动生活集团全链条心理服务破局,让3000万用户听见温暖的回响
当感恩节的暖意在街头巷尾流转,“守护”与“感恩”成为叩击人心的关键词。在心理健康已从“小众需求”转变为“全民刚需”的今天
2025-11-26 08:35:00
省发展改革委近日批复了山西省教育科技人才一体化服务产业云平台项目可行性研究报告,建设地址位于中北大学校内。作为山西聚焦“产学研用深度融合”的关键信息化基建项目
2025-11-26 08:41:00
为推动智能建造落地应用,搭建行业交流平台,近日,“晋塔”智能装备观摩活动在太原市多个施工项目同步启动。“晋塔”智能施工升降机
2025-11-26 08:42:00
经济热力站|绿色转型为基 金融创新为翼 科技赋能为核——助推首都经济高质量发展再上新台阶
11月19日,“京彩不设限・经济热力站”月度主题走访活动再度启程,记者跟随采访团先后走进北京绿色交易所、中国邮政储蓄银行北京分行及北京银行顺义科技研发中心
2025-11-26 10:06:00
赞皇县:AI赋能“一网通办” 业务办理效率提升70%
河北新闻网讯(次柳静)近日,石家庄市赞皇县数据和政务服务局依托DeepSeek大模型与智能算法,创新打造AI“智能填报”平台
2025-11-26 10:07:00
河北师范大学金融学院举行“产品经理人才共创培养体系”主题培训
河北新闻网讯 近日,河北师范大学金融学院邀请北京来学吧信息技术有限公司相关负责人到校,开展了主题为“产品经理人才共创培养体系”主题培训
2025-11-26 10:09:00
南京生物医药:研发“拔节孕穗”,产业新星闪耀
第91届全国药交会在宁落幕南京生物医药:研发“拔节孕穗”,产业新星闪耀□南京日报/紫金山新闻记者张甜甜连续3天,南京国际博览中心人流如织
2025-11-26 10:26:00
2025年两院院士增选结果揭晓 南京地区7人入选 在宁院士总数达102人
南报网讯(记者何洁张安琪)11月21日,2025年两院院士增选结果正式揭晓,选举产生中国科学院院士73人、中国工程院院士71人
2025-11-26 10:27:00
隐风文化:锚定四大理念,以精品力穿越短剧周期
由北京隐风文化科技有限公司出品的奇幻爱情短剧《岁岁怀安》延续预约150万的热度,上线后迅速跃居红果站内热播榜高位,这也是今年团队继《咬清梨》《怎敌她动人》之后
2025-11-26 11:06:00
视源股份荣获2024年度广东省科技进步一等奖
2025年11月20日,广东省人民政府正式发布《2024年度广东省科学技术奖通报》(粤府〔2025〕50号)。视源股份牵头完成的“高自然度智能交互显示终端关键技术及产业化”项目
2025-11-26 11:06:00
视源股份成为英特尔首批尊享级合作伙伴 合作再升级
近日,英特尔合作伙伴联盟完成战略升级,联盟最高等级“钛金级”正式更迭为“尊享级”。视源股份凭借其在计算机领域的深厚积累
2025-11-26 11:06:00
鲁网11月26日讯近日,莱商银行郓城西城小微支行迎来了一位熟悉的客户李大爷。他手持莱商银行新换发的金融IC卡,脸上却写满了困惑与焦虑
2025-11-26 11:13:00
鲁网11月26日讯近年来,莱芜农商银行雪野旅游区公司业务营销中心认真贯彻落实“五篇大文章”,聚焦科技型企业发展,创新“转型全周期”服务模式
2025-11-26 11:17:00
摘下体外诊断“皇冠上的明珠” 一个国产医疗器械企业的逆袭之路
大河网讯(记者 申华 赵檬)十多年前,国内医学实验室流水线市场70%以上都被国际大公司垄断,我国连一台能自主生产的流水线设备都没有
2025-11-26 11:34:00