• 我的订阅
  • 头条热搜
还在人工炼丹?自动提示工程指南来了,还带从头实现
...e given problem about geometric shapes.」可以看到,性能并不好,准确率只有 36%,应该有很大的改进空间。不过,在使用 APE 之前,让我们先尝试下一种提示技术:思路链(CoT)推理;这种技术虽然对原始提示词修改不多,但事实证明却...……更多
李飞飞空间智能之后,上交、智源、北大提出空间大模型SpatialBot
...深度信息获取、远近关系比较的任务上,可以达到 99%+ 的准确率。2. 针对空间理解任务,作者公布了 SpatialBench 榜单。通过精心设计和标注 QA,测试模型深度理解能力。SpatialBot 在榜单上展示了和 GPT-4o 接近的能力。模型如何理解...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...理能力,并证实了我们的训练策略的有效性。除了更高的准确率外,我们的模型实现的推理速度比 LLaMA-AdapterV2 和 ManipLLM 快 7 倍,这可以归因于 Mamba 语言模型的内容感知推理能力和效率。图 4. RoboVQA 上与机器人相关的推理对比...……更多
GPT-4o的识图能力有多牛?四大维度深度体验
...识别数据图上的信息,并按要求以图表的形式重新呈现,准确率高达100%。图片来源:GPT-4o四、手写指令和逻辑推理最后,记者上了点难度,用手写的逻辑推理题来测试了GPT-4o的识图和逻辑推理能力。GPT-4o的回答堪称完美,不仅...……更多
协同发展,生态聚合丨1024程序员节暨「源聚一堂」开源技术沙龙(北京站)成功举办
...于开发者的节日里,开发者们在美食节、精彩节目、开源知识有奖问答、互动魔术与游戏,现场K歌等精彩互动中尽情狂欢。让开发者卸下代码和工作,参与线下的狂欢盛宴,领略开发者的多彩风格!广大开发者们以极客精神,...……更多
中国财税GPT迎来最准确的大模型:小竹财税AI问世
...对高效解决财税问题的需求日益迫切。作为中国财税领域准确率领先的垂直大模型,小竹财税AI将不断提升其逻辑推理和上下文理解能力,以更好地满足用户的需求,努力实现“让天下没有难懂的财税”的目标。期待小竹财税在A...……更多
AI搜索助手心流正式上线
...户的复杂问题。“心流在长文本评测实验中达到超过99%的准确率,具有非常优秀的长文本阅读能力。”据心流的技术人员介绍,在语义理解方面,心流的直接理解能力优于当前市场上的主流模型,间接理解能力(包含复杂推理)...……更多
百川智能发布baichuan3稳定语言模型
...助力医疗资源实现普惠和平权。并且医疗问题专业性强、知识更新速度快、准确性要求高、个体差异大,能充体现大模型的各项能力,被百川智能称为“大模型皇冠上的明珠”。因此,诸如OpenAI、谷歌等头部大模型企业都将医疗...……更多
类人神经网络再进一步!DeepMind最新50页论文提出AligNet框架:用层次化视觉概念「对齐」人类
...校准自己的判断,即人类对某个问题的确定性往往与预测准确率成正比,而AI系统则过于自信,即使在预测错误时也表现出高度的确定性。所以说,在真正实现通用人工智能之前,深度学习模型和人类之间仍然存在诸多差异需要...……更多
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...)两部分作为上下文信息,模型能还原出被遮住的文字的准确率。蓝色框内表示仅包含图像中的文字(TEI)的作为上下文信息,并不包含图像(VI),模型能还原出的遮住文字的准确率。 结果表明:绝大多数模型目前都不能胜...……更多
英伟达开源NVLM 1.0屠榜多模态!纯文本性能不降反升
...LLM骨干模型,特别是在文本数学和编码基准测试中,平均准确率提高了4.3个百分点。文本大模型经过多年的发展,逐渐发展成了统一的纯解码器Transformer架构。反观现有的多模态大模型架构仍然处于混乱状态,开源模型在选择LLM...……更多
2023内容科技应用典型案例:农业银行大模型ChatABC
...述农业银行大模型ChatABC,对于大模型精调、提示工程、知识增强、检索增强、人类反馈的强化学习(RLHF) 等大模型相关新技术进行了深入探索和综合应用,结合农业银行研发支持知识库、内部问答数据以及人工标注数据等金融...……更多
全面透视豆包:功能、版本、价格、优势、应用
...。对客服团队进行培训后上线使用,同时持续监控回答的准确率和客户满意度,根据情况优化问题库和豆包的配置。六、使用豆包的潜在问题和注意事项 1. 潜在问题回答准确性:尽管豆包尽力提供准确的信息,但它的回答仍可...……更多
...智能化水平。蚁盾CTO张凯隆介绍道,生成式AI具有“理解推理+自主决策”的能力及特性,“AIR”引擎借助生成式AI,大幅简化了原有需要专业算法工程师深度参与的操作流程,在风险管理复杂度综合降低50%的前提下,将风险对抗...……更多
文心大模型4.0 Turbo来了!百度推出文心快码2.5,已覆盖内部80%程序员
...平台创建,吸收了朱有勇院士的研究成果以及相关的农业知识,可以为农民解答生产生活中的问题。▲农民院士智能体百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜谈道,在过去半年,用户使用文心大模型...……更多
开源大模型杀疯了!Mistral新模型三分之一参数卷爆Llama 3.1
...编程语言。特别在MMLU上,其预训练版本更是达到了84.0%的准确率。消息一出,Mistral AI联创兼首席科学家第一时间转发,直接cue Llama 3.1 405B的那种:Perplexity CEO Aravind Srinivas也开麦了:开源追赶闭源的趋势很明显,未来闭源模型只..……更多
...键步骤。统计学方法提供了各种性能指标,如均方误差、准确率、召回率和F1分数等,用于衡量模型的性能。这些指标允许我们量化模型的预测能力,并对不同模型进行比较。通过统计学方法,我们可以确定哪种模型在特定任务...……更多
从架构、工艺到能效表现,全面了解LLM硬件加速,这篇综述就够了
...的 Softmax 层,随着 Transformer 模型处理更长的序列以提高准确率,这项技术变得越来越重要。所提出的技术将 Softmax 层划分为多个子层,更改数据访问模式,然后将分解的 Softmax 子层与后续和前面的过程合并。该方法分别将 BERT、...……更多
...巴巴Qwen2-72b等国产大模型在高考数学客观题中具有较高的准确率,令人眼前一亮。当然,LLMEVAL团队在评测后也指出,大模型在数学推理任务中的鲁棒性与准确性仍有很大的提升空间。语文、英语高考测试,作文见真章“AI考生”...……更多
精准狙击Llama 3.1?Mistral AI开源Large 2,123B媲美Llama 405B
...的新标准。特别是在 MMLU 上,预训练版本实现了 84.0% 的准确率。代码与推理Mistral AI 基于此前 Codestral 22B 和 Codestral Mamba 的经验,在很大一部分代码上训练了 Mistral Large 2。Mistral Large 2 的表现远远优于上……更多
技术最前沿|瞄准行业痛点, AI验布机赋能传统行业技术焕新
...模型AI视觉算法应用于针织生产环节,帮助企业提升验布准确率及速度,增强产品品质把控度,大幅度实现降本增效。并通过ERP重构升级,统一部署针织、经编和染整系统,助力企业实现生产、销售、采购、库存等各个环节的数...……更多
探索终端操作系统领域AI大模型创新趋势 OpenHarmony技术大会OS原生智能分论坛召开
...与实现,分享了如何通过对移动应用的自动分析和大模型知识嵌入,将应用内部的领域知识与大模型的常识知识有机结合,实现更准确高效的任务自动化。李元春指出,智能个人代理一直是终端系统研究人员和开发者关注的关键技术...……更多
科学家竞相破解大型语言模型背后的谜团
...验证:对比标准提示,新方法在一系列算术推理任务上的准确率都有了显著提高。但美国纽约大学研究人员的一项最新研究表明:LLM并没有利用思维链的推理能力,它只是偷偷加了计算。美国东北大学计算机科学家戴维·鲍表示...……更多
百融云创荣获“2024大模型创新应用奖”
...实际需求的答案。在第三方测评机构的测评中,CybotStar的准确率和精准性取得了行业领先的成绩。随着业务规模的不断壮大,各个产业的业务流程往往变得过于庞大和复杂。面对复杂的业务场景,百融云创大模型打造了对话流系...……更多
中国科学院地化所发布国际首个月球专业大模型,基于通义大模型及阿里云百炼专属版打造
...目前在月球撞击坑年代和形态判别上,月球专业大模型的准确率已达到80%以上。中国科学院院士、中国月球探测工程首任首席科学家欧阳自远表示,随着人类深空探测活动的快速推进,探测数据呈井喷式增长。科学大数据已然成...……更多
大模型追不上了?不妨尝试把主战场放在垂直模型
...有模型能够在不到1/3秒内识别和转录语音,最佳条件下的准确率高达98%。另一方面,国内真正的大模型目前还没卷起来,留给初创公司一部分空间和时间;此外,大模型不是产品,能落地到具体应用场景才算数。有媒体报道:一...……更多
...的自主心脏超声扫查,能够解决心脏B超医生紧缺、诊断准确率不高等难题。基于超声影像和机械臂的受力信息,智能心脏超声机器人能够在高速动态环境下快速计算、提取心脏特征,实现相当于自动驾驶L2、L3级的智能化水平。...……更多
...是一家技术起家的公司。从讯飞输入法开始,我们的转写准确率和翻译准确率都是行业领先的。但技术也需要看得见摸得着的产品去体现。因此从产品打磨上,我们非常用力。举两个例子,智能办公本的屏幕用了0.1毫米悬空技术...……更多
o1规划能力首测!已超越语言模型范畴,preview终于赢mini一回
...。相比于传统模型的优势更是碾压级别,在超难任务上的准确率比Llama3.1-405B高了11倍。要知道之前,OpenAI自己人也发了一张图,显示preview论性能比不过满血版,论经济性又不如mini,处于一个十分尴尬的地位。作者在推文中表示...……更多
GPT-4批评GPT-4实现「自我提升」!OpenAI前超级对齐团队又一力作被公开
...的批评意见更长时,也更容易出现幻觉。这有点类似于「准确率」和「召回率」之间的权衡。FSBS能够激励CriticGPT在产生更长、更全面的批评时,减少「无中生有」或者「鸡蛋里挑骨头」的发生率。之后进行的消融实验也证明了FS...……更多
更多关于科技的资讯:
从乡村直播间的农特产品,到城市商场的促销热潮,再到物流行业的高效运转……记者从太原市税务局获悉,随着“双11”将下半年消费市场带入旺季
2025-11-21 08:12:00
天阳科技发布“量子增强计划”,多方聚力共筑“量子金融”新生态
近日,以 “量子计算+AI:重塑金融科技新范式” 为主题的前沿科技研讨会在北京召开,本次研讨会由天阳宏业科技股份有限公司(以下简称 “天阳科技”)主办
2025-11-21 08:29:00
奋进的河北·“十四五”答卷丨身边的“十四五”(四):车间里的“智变”
向智而行,新型工业化加速跑——河钢集团唐钢公司构建全流程一体化生产计划排程系统,实现订单与产能高效匹配;石家庄四药集团应用生产执行系统
2025-11-21 08:36:00
“看见”,是新闻工作的起点。守护新闻工作者的清晰视野,就是守护社会公器的明亮窗口。11月18日,在厦门市新闻工作者协会指导下
2025-11-21 09:40:00
网易 UU 远程 Mac 被控功能上线,提升 macOS高效办公体验
网易 UU 远程全新版本上线,在已有 Mac 控制 PC 功能的基础上,正式开放 Mac 设备被控功能,自此 Mac 实现控制与被控的双向协作
2025-11-21 09:47:00
中新经纬11月21日电 “小米公司发言人”微博21日发布关于Xiaomi Watch S4 Sport潜水功能的说明。小米公司表示
2025-11-21 11:11:00
阿里巴巴承办COP30中国角边会 展示AI驱动气候治理新成果
第30届联合国气候变化大会(COP30)于11月10日至21日在巴西帕拉州首府贝伦市举办,这是2015年《巴黎协定》签署以来最受瞩目的气候大会
2025-11-21 11:36:00
数绘星云与腾讯云达成战略合作,共同推动AI出海电商智能化升级
11月18日,数绘星云(深圳)科技有限责任公司与腾讯云正式签订战略合作协议,双方将在云计算、大数据、AIGC等核心领域开展深度合作
2025-11-21 11:48:00
中新经纬11月21日电 据彭博社报道,当地时间20日,谷歌宣布了一款名为Nano Banana Pro的新型图像生成和编辑模型
2025-11-21 11:53:00
回望“十四五”,西安交通大学方涛教授说,他们团队倍感振奋。“在国家能源结构转型关键期,我们扎根国家‘双碳’战略,依托西安交大强大科研平台
2025-11-21 13:29:00
舒朗秋11月19日,工业和信息化部举行新闻发布会,介绍GB6675《玩具安全》系列强制性国家标准修订情况。据介绍,我国建成了全球最为完善的玩具产业链
2025-11-21 14:19:00
向长河英国剑桥大学出版社近日宣布,与追星相关的词语“准社交”(parasocial)成为2025年《剑桥词典》年度词汇
2025-11-21 14:19:00
2025世界计算大会发布全球计算十大创新成就
20日,2025世界计算大会在湖南长沙开幕。大会发布了2025全球计算十大创新成就及2026十大发展趋势。此次发布的全球计算十大创新成就包括
2025-11-21 15:35:00
系统创业 自由人生|首届雨大王大健康私域 IP 创业峰会在深圆满落幕
2025年11月1日-2日,为期两天一夜的首届雨大王大健康私域IP创业峰会在深圳成功举办。本次峰会以"系统创业,自由人生"为主题
2025-11-21 15:41:00
《保险AI智能体应用白皮书》发布,四层架构+七大场景定义行业智能新范式
随着人工智能技术加速重塑千行百业,以AI智能体为代表的AI技术正成为推动产业智能化转型的核心引擎。在保险行业,伴随数字化进程的深入推进
2025-11-21 15:42:00