• 我的订阅
  • 头条热搜
腾讯企点智能客服、营销分析全新升级,助力企业实现智慧客户管理和营销分析
...统的启动时间从原本的7天以上缩短至分钟级或小时级,准确率也提升了30%,提供更智能的用户互动体验;而全新的企点分析AI助手依托腾讯云行业大模型实现"对话式分析",让业务人员通过“对话”快速获取海量数据中的数据结...……更多
MMMU华人团队更新Pro版!多模态基准升至史诗级难度:过滤纯文本问题、引入纯视觉问答
...多学科多模态理解和推理(MMMU)基准测试中取得了69.1%的准确率。不过,基准测试结果是否真的能反映模型对多样化主题的深入理解,仍然有争议,或者说模型是否只是利用了统计模式,而非依靠理解和推理的情况下就能得出正...……更多
OpenAI发布最新技术研究,AI“黑盒”不再是难题!
...小模型来验证、监督,GPT-4大模型的输出,从而提升输出准确率以及可控性。PVG技术概念早在2021年8月的一篇论文中就被提出来,OpenAI也正是受此灵感启发。这是一种基于博弈论的训练方法,通过模拟证明者和验证者之间的互动...……更多
...等技术,实现了农业知识有问必答的同时,提高了回答的准确率,缓解了大模型普遍存在的“幻觉”诟病问题。模型由海量高质量农业知识数据训练而成,数据涵盖农学、园艺学、栽培学、生物信息学、动物科学、动物医学、设...……更多
迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测试
...学场景。 所有数据和代码、模型均已开源。MMedBench 上的准确率,图 d 展⽰了在 MMedC 上进⼀步预训练使模型性能相⽐于基线显著提升。大规模多语医疗语料(MMedC)构建在构建数据集方面,研究团队收集了一份多语言医疗语料库...……更多
360智脑7b参数模型采用3.4万亿tokens训练
...本能力的一种方法)中,360Zhinao-7B-Chat-360K达到98%以上的准确率。360仿照SuperCLUE-200K测评基准构造了中文大海捞针测试,同样做到了98%以上的准确率。除模型权重外,该模型的微调训练代码,推理代码等全套工具集也被一并开源,...……更多
Meta祭出三篇最详尽Llama微调指南!千字长文,0基础小白必备
...的可靠性。以下是两个案例:- Phi-2对金融数据情绪分析准确率,从34%提高到85%。- 仅用100个示例,ChatGPT对Reddit评论情绪分析的准确率从48%提高到73%。通常来说,对于较小的初始精度(<50%),微调是一个巨大的障碍,需要用几...……更多
不仅仅是「GPTs」,支付宝在做一种很新的智能体
...」之处远不止于此,更大的优势在于蚂蚁背后多年技术、知识、经验积累,水到渠成地走向专业智能体路线。以医疗领域为例,支付宝和上海市第一医院联合打造 了Al 就医助理「公济小壹」。为应对医疗领域的业知识的短板,...……更多
致敬浪潮“她”力量丨成功秘诀?不过是把“我能行”,用代码写了千万遍
...,最终给出合理的答案。“最开始的测试中,我们的模型准确率只能达到89%左右,而且还存在知识文档检索召回效果差,通过模型检索召回知识文档但选择正确答案的效果差,无论如何调试,还是无法达到预期的效果。”“面对...……更多
荣耀Magic V5发布,一文看懂YOYO到底有多强大
...息和自动执行任务方面表现出色,例如,MagicGUI模型操作准确率高达91.5%,MagicVL-Nano端侧模型可在保护用户隐私安全基础上实现低功耗图像理解;此外,荣耀构建的三款云端大语言模型,可实现个性化推理、精准理解用户意图;...……更多
蚂蚁金融大模型来了!智能金融助理支小宝2.0亮相,有啥特色
...是金融服务对错误的容忍度很低,金融大模型要确保领域知识和专业逻辑的严谨性,才能真正落地带来产业价值。知识力、专业力、语言力以及安全力,保障四大能力是前提条件,也是金融大模型要解的产业真命题。对此,王晓...……更多
石油巨头牵手DeepSeek
...行业的数学公式、化学结构式、专业图表等专业内容时,准确率较高,能够有效支撑行业数据集建设和行业模型训练。 下一步,将进一步完善集团人工智能技术体系,提升石油化工行业大模型的训练质量,实现深度推理与行业...……更多
大模型是否有推理能力?DeepMind数月前的论文让AI社区吵起来了
...消失。结果还表明,随着数据集大小的增加,模型的最终准确率会提高(在模型大小之间保持一致)。同样,作者观察到架构大小增加的总体趋势是无论数据集大小如何,整体性能都会提高。通过下表 2 可以得出以下几点:动作...……更多
思维链让大模型推理更准确?谷歌早于OpenAI押中o1模型核心原理
...。根据结果,二者差异显著,其中,前者正确解决问题的准确率是 13.4%,而 o1 的准确率则能够达到 83.3%。这种推理能力的重要意义在于,有望在更广泛的领域应用,例如,药物发现、材料科学、编程、高等数学和物理等。o1 实...……更多
京东:推动大模型加快落地应用  助力培育发展新质生产力
... 2024年07月30日 第 16 版)生成图片采纳率达65%、营销文案准确率超95%,生成式人工智能(AIGC)营销工具“京点点”已经服务20多万户商家,助力商家提升运营效率;快递员只需语音录入,就能给用户发去送货短信,还能通过提问...……更多
联发科天玑9400+拿下最强AI手机芯片:端侧推理准确率反超云端大模型
...玑9400的1.25倍,支持最高8B规模的DeepSeek-R1端测部署,推理准确率反超云端大模型。天玑9400+行业首发增强型推理解码技术(SpD+),推理解码能力提升20%,同时集成天玑AI智能体化引擎,可将传统A应用程序升级为更先进的智能体化...……更多
英伟达发布Llama-3.1-Nemotron-51B AI 模型
...保持了几乎相同的精度情况下,推理速度提高了 2.2 倍。准确率能效MT BenchMMLUText generation(128/1024)Summarization/ RAG (2048/128)Llama-3.1- Nemotron-51B- Instruct8……更多
以图灵机为师:通过微调训练让大语言模型懂执行计算过程
...EF 可在 7 种经典数学算术运算的测试中实现了近乎 100% 的准确率,且能够支撑 100 位操作数的计算,而同等难度下, GPT-4o 在一些算术问题测试中无法正确给出计算结果。 论文标题:Executing Arithmetic: Fine-Tuning Large Language ……更多
CMU清华教LLM练成数学高手,LeanSTaR训练模型边思考边证明,登顶新SOTA
...增强),对比Lean-CoT和Lean-STaR的表现。仅用专家迭代时,准确率就达到了43.0%,低于Lean-STaR (45.5%)。这表明Lean-STaR的性能提升不仅仅来自于专家迭代的使用,思维增强也有不可忽略的效果。问题类型与难度MiniF2F-test中的问题有多个...……更多
智慧家庭重磅文件,征求意见稿来了!事关千亿市场、8大应用场景
...拟现实交互以及多模态交互的交互终端、交互流程、响应准确率与响应时间要求等标准;互联互通针对跨品牌、跨平台智慧家庭设备的识别、访问、控制,包括总体要求、云云互联、端云互联、端端互联、注册入网、设备模型等...……更多
...重要线索,如果模型拥有更长的“思考时间”,它的解题准确率就会显著提高。为什么“长”如此关键?胡倞成解释,Transformer 计算深度有限,只能做有限步的计算,复杂问题如果不能拆分,就超出了模型的处理能力。只有当模...……更多
无一大模型及格! 北大/通研院提出超难基准,评估长文本理解生成
...T4-8k、GPT3.5-turbo-6k、LlamaIndex这种商业模型,平均只有40%的准确率。而像开源模型表现就更不理想了…ChatGLM2-6B、LongLLaMa-3B、RWKV-4-14B-pile、LLaMA-7B-32K平均只有10%的准确率。目前该论文已被ACL 2024接……更多
2023年度“星河产业应用创新奖”揭晓,国网智研院、宝马等10家企业项目获奖
...司数百人的 IT 核心团队及庞大的供应商团队,解决问题准确率大幅提升的同时,降低约 30%的推理费用和时间。上海南洋万邦软件技术有限公司基于⻜桨和文心大模型打造一站式节能减碳方案,立足产业需求,从碳感知、碳计算...……更多
OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性
...其专门用于评估模型在化学、物理和生物学等领域的专业知识水平,并邀请了拥有相关领域博士学位的专家参与测试。测试结果显示,o1不仅成功完成了测试,更是超越了博士表现,成为首个在GPQA diamond 基准上击败人类专家的AI...……更多
​海信重磅发布“云信·通途交通大模型”: 以AI之力,解锁智能交通无限可能
...报数据,系统通过“大小模型协同+RAG检索”技术,实现准确率超98%的舆情精准定位,并能够超前预警潜在舆情风险;在自动化指挥调度环节,系统基于众多城市交通保障经验与专家经验,融合实时路况与三级预测体系,能够实...……更多
...款 2 亿日元,并计划在 2024 财年将拨款提升至 3 亿日元。准确率可达 70%,科学家利用 AI 解读狗的叫声:研究发现,用于训练人类语音的 AI 模型可以作为训练动物交流模型的起点。这一模型的主要障碍是缺乏公开可用的数据。研...……更多
重磅!TeleAI 完成首个全国产化万卡万参大模型训练
...rompt 设计、多模型的投票机制等手段,进一步提高了模型准确率和鲁棒性,最终以领先第二名将近 3 分的绝对优势排名第一。开源共享,引领创新TeleChat2-115B 的开源标志着大模型国产化迈进了又一个新征程。作为最早布局并首先...……更多
港中文团队提出大模型元推理范式,革新大模型的评价体系
...:在教育领域,如果 GPT4 在小学级别的数学题目上的评测准确率只有四成,那么我们难免会对 GPT4 的实用性产生怀疑。在咨询领域,大模型的应用场景高度依赖于对不同方案的推演、整体步骤的拆分、解析等能力。而当今大模型...……更多
腾讯推出PDF识别神器:复杂文档解析准确率超98%
...能推理并对表格数据和结构进行正确复原,极大提高识别准确率。每次复制表格都数据错位的人有福了!不仅中英文,它还支持20+语言,以及繁体字、生僻字等多种类字体。更惊喜的是,它还支持将识别后的图片、PDF文档转换为...……更多
清华开源混合精度推理系统MixQ:大模型近无损量化并提升推理吞吐
...合精度量化的LlaMA模型在MMLU 20个领域上的数据集进行推理准确率测试表明,采用8bit混合精度量化后的准确率下降不到0.1%:△图6 混合精度量化分类准确率不过,此前已有的混合精度量化的系统的性能普遍不高,主要瓶颈在针对...……更多
更多关于科技的资讯:
南报网讯(通讯员毛欣悦记者张希)近日,2025年度南京市新核定的外资研发中心名单公布,江宁开发区5家外资研发中心核定入选
2025-08-25 07:38:00
从清北退学的年轻人,当月入五千的CEO
与其浪费时间,不如直接退学还有一年就要从北大医学院毕业的大三学生阿布,决定从北大退学了。阿布提交了退学申请后,学校的老师并没有立刻批准
2025-08-24 19:17:00
京东建材超品日全渠道大幅增长 卫浴、灯饰照明品类成交额增长超7倍
8月20日晚8点开启的京东建材超级品类日,掀起了今秋第一场家装消费热潮。开售仅1小时,全品类成交额同比增长超2倍;截至8月21日23:59
2025-08-24 20:52:00
烈日炎炎!防晒美白需注意哪些关键因素?近日,护肤品牌谷雨研发负责人李安章从专业角度支招,向中新经纬产业一线栏目讲述防晒美白背后的研发与创新。来源:中新经纬编辑:熊思怡广告等商务合
2025-08-24 17:25:00
能感知环境,还能响应用户需求!全球首款人形机器人头部模组在贵安新区诞生
日前,贵安新区威迈尔科技有限公司(以下简称:威迈尔)正式推出全球首款人形机器人头部模组OmniHead(奥视知脑),为具身智能领域带来关键技术突破
2025-08-24 22:22:00
流量经济赋能长春农博会成果显著,线上销售额突破5200万元
第24届中国长春国际农业食品博览(交易)会胜利闭幕,在为期十天的展会上,流量经济赋能专区成为亮点。通过多平台联动、达人矩阵直播
2025-08-24 21:36:00
“车BA” 南京争霸
8月23日,“车BA”小米集团汽车部跨区域篮球争霸赛决赛在南京举行,来自北京、上海、武汉等地的7支参赛队伍齐聚古都南京,角逐冠军。 南京日报/紫金山新闻记者 段仁虎 摄
2025-08-24 09:50:00
“关不掉”的免密支付,肥了平台的钱包?
原标题| “关不掉”的免密支付,肥了平台的钱包?近日,话题“一定要关闭免密支付和自动扣款”冲上社交平台热搜,关于免密支付功能相关的讨论再次进入大众视野
2025-08-24 05:43:00
美国医疗巨头瞄准聚焦超声无创治疗赛道
近日,由美国医疗巨头强生等十余家机构组成财团,以22.5亿美元(约人民币161亿元)闪电收购了一家专注于“无创”超声波组织碎化技术(Histotripsy)的美国医疗科技公司HistoSonics多数股权
2025-08-24 07:02:00
家电业均价下滑!三翼鸟上海体验中心九成用户选高端
中国家电市场正经历均价下行的趋势。奥维云网数据显示,2025年第1周到第11周,空调、冰箱、洗衣机线上渠道均价同比分别下滑3
2025-08-23 08:20:00
在意大利:海尔空调销量TOP1
今夏,欧洲人经历了严酷“烤”验。八月初,受罕见热浪侵袭,意大利、法国等多国发布高温红色预警,西班牙南部气候飙升至46℃
2025-08-23 08:21:00
2025年,中国新材料产业总产值预计突破10万亿元,但在被列为“卡脖子”的多项关键材料中,国产化率不足30%。铝,作为全球产量第一
2025-08-23 08:22:00
单店年入过亿!三翼鸟上海体验中心是如何做到的?
当前,实体零售业正面临着变革与挑战,一方面,线上浪潮带来的冲击清晰可见:传统卖场客流锐减、部分门店面临关停挑战,《2025到店零售3
2025-08-23 08:22:00
省心比省钱重要!三翼鸟上海体验中心8成用户定制场景
当前,消费者在居家领域的决策逻辑正经历深刻变革。过往,性价比常是左右消费者选购家电、家居产品的核心要素,而如今,“省心”已逐渐攀升至决策考量的优先位置
2025-08-23 08:23:00
8月23日19:00,“河北五超”承德vs保定,最硬核的主场,承德“硬核宠粉”现场抽奖送钻石!
2025-08-23 08:53:00