• 我的订阅
  • 头条热搜
国产大模型首发中文逻辑推理,「天工大模型4.0」o1版来了
...。在 MATH 数据集上,Q * 帮助 DeepSeek-Math-7b 提升至 55.4% 的准确率,超越了 Gemini Ultra。Q * 算法论文地址:https://arxiv.org/abs/2406.14283可以看出,昆仑万维的技术已经达到了业界的领先水平,在竞争激烈的生成式 ……更多
类人神经网络再进一步!DeepMind最新50页论文提出AligNet框架:用层次化视觉概念「对齐」人类
...校准自己的判断,即人类对某个问题的确定性往往与预测准确率成正比,而AI系统则过于自信,即使在预测错误时也表现出高度的确定性。所以说,在真正实现通用人工智能之前,深度学习模型和人类之间仍然存在诸多差异需要...……更多
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...)两部分作为上下文信息,模型能还原出被遮住的文字的准确率。蓝色框内表示仅包含图像中的文字(TEI)的作为上下文信息,并不包含图像(VI),模型能还原出的遮住文字的准确率。 结果表明:绝大多数模型目前都不能胜...……更多
...种类的目标物体和异常状态的精准识别与过滤,可将事件准确率提升30%,同时将新任务的训练综合成本降低近80%,大大延展了各种长尾场景应用能力。此外,新版本产品的基础软硬件已全面实现国产化,让企事业用户在使用AI产...……更多
百融云创高级副总裁陈立宇:大模型AI将在财富管理生态中产生巨大的价值
...速搭建一些简单的场景,但复杂专业的场景就力不从心,准确率不高。它需要很深入地理解金融专业术语和业务,需要深度打磨业务场景,搭建业务流程的SOP,持续对进行模型微调,把工作流,Work flow, 去做详细的拆分,只有这...……更多
英伟达开源NVLM 1.0屠榜多模态!纯文本性能不降反升
...LLM骨干模型,特别是在文本数学和编码基准测试中,平均准确率提高了4.3个百分点。文本大模型经过多年的发展,逐渐发展成了统一的纯解码器Transformer架构。反观现有的多模态大模型架构仍然处于混乱状态,开源模型在选择LLM...……更多
搜题更精准、难题都有解 夸克“AI搜题”提升用户学习能力与效率
...加详细的内容解析和学习引导。夸克AI可以围绕题目中的知识点与考点进行深度讲解,精准定位关键步骤。同时以 “启发式” 学习的独特体验,夸克AI搜题让用户不仅学会这一道难题,还能举一反三学会一类题。夸克“AI搜题” ...……更多
“深思熟虑”的 AI:OpenAI 提出全新安全对齐方法
...可以减少误拒,在 XSTest 数据集的良性提示中,o1 模型的准确率高达 93%。“深思熟虑的对齐”通过训练模型明确推理安全策略,它为复杂的伦理挑战提供了可扩展且可解释的解决方案。 ……更多
2023内容科技应用典型案例:农业银行大模型ChatABC
...述农业银行大模型ChatABC,对于大模型精调、提示工程、知识增强、检索增强、人类反馈的强化学习(RLHF) 等大模型相关新技术进行了深入探索和综合应用,结合农业银行研发支持知识库、内部问答数据以及人工标注数据等金融...……更多
全面透视豆包:功能、版本、价格、优势、应用
...。对客服团队进行培训后上线使用,同时持续监控回答的准确率和客户满意度,根据情况优化问题库和豆包的配置。六、使用豆包的潜在问题和注意事项 1. 潜在问题回答准确性:尽管豆包尽力提供准确的信息,但它的回答仍可...……更多
清华UCSD提出全新微调方法,8B小模型媲美GPT-4o!科学问题正确率提高28%
...行业巨头如GPT-4——便在测试数据集上实现了28.18%的答案准确率提升和13.89%的工具使用精度提高。这挑战了AI开发中的一个惯有想法:更大的模型必然能带来更好的结果。教会AI在使用外部工具和依赖内部知识之间进行判断——就...……更多
...智能化水平。蚁盾CTO张凯隆介绍道,生成式AI具有“理解推理+自主决策”的能力及特性,“AIR”引擎借助生成式AI,大幅简化了原有需要专业算法工程师深度参与的操作流程,在风险管理复杂度综合降低50%的前提下,将风险对抗...……更多
文心大模型4.0 Turbo来了!百度推出文心快码2.5,已覆盖内部80%程序员
...平台创建,吸收了朱有勇院士的研究成果以及相关的农业知识,可以为农民解答生产生活中的问题。▲农民院士智能体百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜谈道,在过去半年,用户使用文心大模型...……更多
开源大模型杀疯了!Mistral新模型三分之一参数卷爆Llama 3.1
...编程语言。特别在MMLU上,其预训练版本更是达到了84.0%的准确率。消息一出,Mistral AI联创兼首席科学家第一时间转发,直接cue Llama 3.1 405B的那种:Perplexity CEO Aravind Srinivas也开麦了:开源追赶闭源的趋势很明显,未来闭源模型只..……更多
...表示,借助多模态的思考能力,VLM-R1将显著提升图像识别准确率,并生成相应的解决方案,“目前版本还处于1.0阶段,仍需更多实验来完善。” ……更多
华为NCE-数据通信领域总裁王辉:AI落地应用的新阶段
...这个0.01的误差是很难消除的,你认为如果想要真正使AI的准确率达到100%的话,行业还需要付出怎么样的努力?王辉:我个人认为,现在的数据可能还有很多水分,实际上达到99%也很难,达到90%以上,甚至95%以上是可接受的,因...……更多
头部企业为何纷纷接入DeepSeek模型?现象级合作背后蕴藏发展新趋势→
...核心场景。通过人工智能算法优化输气量预测,调控计划准确率提升10%,助力冬季能源保供。国家管网集团智网数科公司副总经理胥锟:随着DeepSeek及一系列人工智能大模型的部署应用,国家管网集团AI场景落地初见成效。油气...……更多
创新,是从积累到突破的过程
...进行精准预测等,通过接入Agent平台,智能调控计划编制准确率提升了10%,助力冬季保供和能源调度。AI+管理场景,实现智能招采、合同智能评审、智能撰写等,全面提升企业管理水平。目前,国家管网集团相关行业平台、统建...……更多
京东率先推出行业首批高商业可用数字人,618向商家免费开放
...推演,在长文本1280K“大海捞针”评测中,实现接近100%的准确率。在大模型开发计算技术层面,京东探索研究院相关论文近期发表于Nature旗下期刊,在国内首次系统性地解决了“开放环境下大模型开发效率”的难题。该研究提出...……更多
...键步骤。统计学方法提供了各种性能指标,如均方误差、准确率、召回率和F1分数等,用于衡量模型的性能。这些指标允许我们量化模型的预测能力,并对不同模型进行比较。通过统计学方法,我们可以确定哪种模型在特定任务...……更多
从架构、工艺到能效表现,全面了解LLM硬件加速,这篇综述就够了
...的 Softmax 层,随着 Transformer 模型处理更长的序列以提高准确率,这项技术变得越来越重要。所提出的技术将 Softmax 层划分为多个子层,更改数据访问模式,然后将分解的 Softmax 子层与后续和前面的过程合并。该方法分别将 BERT、...……更多
...巴巴Qwen2-72b等国产大模型在高考数学客观题中具有较高的准确率,令人眼前一亮。当然,LLMEVAL团队在评测后也指出,大模型在数学推理任务中的鲁棒性与准确性仍有很大的提升空间。语文、英语高考测试,作文见真章“AI考生”...……更多
图结构转文本序列,大模型直接读懂!图推理性能大涨
...在节点计数任务中,所有方法都显示较低的平均误差,但准确率表现各异。基于度中心性和PageRank的方法表现最好,超过了基线方法。在最大度计算任务中,由于需要更复杂的计算过程,整体性能低于节点计数任务。使用默认节...……更多
精准狙击Llama 3.1?Mistral AI开源Large 2,123B媲美Llama 405B
...的新标准。特别是在 MMLU 上,预训练版本实现了 84.0% 的准确率。代码与推理Mistral AI 基于此前 Codestral 22B 和 Codestral Mamba 的经验,在很大一部分代码上训练了 Mistral Large 2。Mistral Large 2 的表现远远优于上……更多
OpenAI迄今最大、最贵模型!GPT-4.5正式发布
...大的规模也带来了出众的性能,GPT-4.5在SimpleQA基准测试中准确率达62.5%,幻觉率37.1%,超越前代模型。对人类意图理解的能力更强,“情商”更高,响应更自然,能在改进写作、编程以及解决实际问题方面发挥更大作用,并且模...……更多
将偏好学习引入模型训练,北大李戈团队提出代码生成优化新框架
...提升测试结果显示,经过CodeDPO优化后,代码模型的生成准确率和效率,都获得了一定提升。★代码准确性实验研究团队在HumanEval(+),MBPP(+)和DS-1000三个数据集上进行了广泛实验,涵盖8种主流代码生成模型,包含Base模型和SF...……更多
技术最前沿|瞄准行业痛点, AI验布机赋能传统行业技术焕新
...模型AI视觉算法应用于针织生产环节,帮助企业提升验布准确率及速度,增强产品品质把控度,大幅度实现降本增效。并通过ERP重构升级,统一部署针织、经编和染整系统,助力企业实现生产、销售、采购、库存等各个环节的数...……更多
探索终端操作系统领域AI大模型创新趋势 OpenHarmony技术大会OS原生智能分论坛召开
...与实现,分享了如何通过对移动应用的自动分析和大模型知识嵌入,将应用内部的领域知识与大模型的常识知识有机结合,实现更准确高效的任务自动化。李元春指出,智能个人代理一直是终端系统研究人员和开发者关注的关键技术...……更多
【2025数博会】无相智研科研大模型AI平台:以数据要素重塑科研基础设施
...Agent深度融合:基于开源模型的微调,提升科研成果产出准确率显著;联邦学习确保数据合规流通;轻量化部署降低推理延迟至毫秒级。平台已与上海交通大学、成都电子科技大学共建联合实验室,验证了在科研实验设计场景的...……更多
“上天”“入地”“下海” AI驱动中国科学创新加速前行
...了卓越的性能,尤其是在X级耀斑的预测上,达到了95%的准确率和100%的真实阳性率。“入地”对中国科学院的科研人员来说,做学问、做研究是他们的本分,分担国家重大任务是责任,为国民经济服务是目标。在追日问天的同时...……更多
更多关于科技的资讯:
每集2分钟、一共28集,短剧《昭世录》在美国、英国、泰国等地的短视频平台上线后爆火,海外播放量近2亿。这部短剧由位于嘉兴经开区的嘉兴九州文化传媒有限公司出品
2025-12-15 07:32:00
12月11日,金华市蓝海光电技术有限公司激光雷达事业部总经理刘崇求向记者展示了一款新型机器人导航激光雷达。该雷达除了能360度平面扫描探测
2025-12-15 07:32:00
12月14日,首届全国独角兽企业大赛总决赛在宁波高新区收官。本次总决赛由工业和信息化部火炬高技术产业开发中心、中国电子学会
2025-12-15 07:32:00
12月12日下午,“2025浙江省新消费创新大赛资源对接活动”在杭州余杭未来科技城举办。活动以“潮起新消费 智汇浙未来”为主题
2025-12-15 07:32:00
“亲,这个问题难倒我了”“对不起,我理解不了您的意思”……这些出自AI客服的经典“名言”你熟悉吗?你是不是也被AI客服“逼疯”过呢?随着年终消费季的到来
2025-12-15 07:50:00
杭州故事,叩开世界的“心门”
在中国美术学院举办的“黑神话:悟空”艺术展。记者 步恩撒 摄踏上取经路,比抵达灵山更重要——黑神话:悟空。来西游神话当一回“天命人”
2025-12-15 08:03:00
巨头入局,珠海面向全球打造中国RISC-V生态之城
日前,一则重磅消息惊动全球半导体产业圈。当地时间12月10日晚,全球半导体巨头高通公司宣布完成对 Ventana Micro Systems的收购
2025-12-14 15:35:00
近日,上城区发布第四批“人工智能+”机会场景清单,25个场景聚焦产业升级、金融服务、智慧教育、智能医疗等重点领域。据悉
2025-12-13 08:06:00
“甩一甩”就能测温的水银体温计,即将在2026年1月1日全面禁产的政策下退出历史舞台。这则消息引发的全网热议,恰是怀旧情感与环保理性
2025-12-13 08:16:00
厦门网讯(厦门日报记者 应洁)昨日,“新质设计——红点产品设计大奖·中国获奖作品精选展”在红点厦门设计博物馆开展,来自70多家中国企业的百余件“红点奖”获奖作品呈现出国际一流设计的“中国力量”
2025-12-13 08:39:00
第六届中国人工智能大赛配套论坛在厦成功举办
厦门网讯(厦门日报记者 翁华鸿 通讯员 张晶晶 王艳红)12日,第六届中国人工智能大赛配套论坛在厦门成功举办。论坛以“融新汇智
2025-12-13 08:39:00
中新经纬12月13日电 据“网信中国”微信号13日消息,2025年12月2日,中央网信办提出并归口的《数据安全技术 电子产品信息清除技术要求》强制性国家标准由国家市场监督管理总局
2025-12-13 10:42:00
中国科大利用磁力系统实现宽带磁声混合频率梳
大皖新闻讯 12月13日,大皖新闻记者从中国科学技术大学获悉,该校郭光灿院士团队在磁力系统研究中取得新进展。该团队董春华教授研究组通过磁振子与高频声子相互作用
2025-12-13 14:35:00
京东宠物百千万爆品计划启动:联合pidan打造确定性产品 单款猫砂月销1500万
猫砂是猫用品购买频率最高的产品,其潜力被外界看好。不过,因行业门槛低,这两年入局者多、竞争加剧,猫砂利润像纸一样薄,最低仅1%
2025-12-13 14:56:00