知识,准确率,推理,蚂蚁,框架,模型头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性

...其专门用于评估模型在化学、物理和生物学等领域的专业知识水平，并邀请了拥有相关领域博士学位的专家参与测试。测试结果显示，o1不仅成功完成了测试，更是超越了博士表现，成为首个在GPQA diamond 基准上击败人类专家的AI...……更多

2024-09-13 16:44:00复旦,相关性,概率,推理,模型,教授

苹果AI登场，与OpenAI合作，Siri将采用GPT-4o

...款 2 亿日元，并计划在 2024 财年将拨款提升至 3 亿日元。准确率可达 70%，科学家利用 AI 解读狗的叫声：研究发现，用于训练人类语音的 AI 模型可以作为训练动物交流模型的起点。这一模型的主要障碍是缺乏公开可用的数据。研...……更多

2024-06-11 09:00:00情报局,独角兽,情报,芯片,进展,苹果

重磅！TeleAI 完成首个全国产化万卡万参大模型训练

...rompt 设计、多模型的投票机制等手段，进一步提高了模型准确率和鲁棒性，最终以领先第二名将近 3 分的绝对优势排名第一。开源共享，引领创新TeleChat2-115B 的开源标志着大模型国产化迈进了又一个新征程。作为最早布局并首先...……更多

2024-09-30 09:50:00万卡,重磅,模型,国产,训练,模型

腾讯推出PDF识别神器：复杂文档解析准确率超98%

...能推理并对表格数据和结构进行正确复原，极大提高识别准确率。每次复制表格都数据错位的人有福了！不仅中英文，它还支持20+语言，以及繁体字、生僻字等多种类字体。更惊喜的是，它还支持将识别后的图片、PDF文档转换为...……更多

2024-06-21 19:35:00腾讯,准确率,神器,文档,文档,腾讯

OpenAI直播第二弹！奥特曼2024年最大惊喜竟来自字节？

...今最强的基础模型o1。其中，强化微调版的o1 mini，在Top-1准确率上直接跃升180%达到了31%，远超o1的25%。对此，奥特曼激动地表示：「这项工作效果出奇得好，是我2024年最大的惊喜之一！非常期待大家会用它去构建什么。」目前...……更多

2024-12-09 09:53:00奥特,奥特曼,字节,直播,惊喜,模型

港中文团队提出大模型元推理范式，革新大模型的评价体系

...：在教育领域，如果 GPT4 在小学级别的数学题目上的评测准确率只有四成，那么我们难免会对 GPT4 的实用性产生怀疑。在咨询领域，大模型的应用场景高度依赖于对不同方案的推演、整体步骤的拆分、解析等能力。而当今大模型...……更多

2024-03-04 10:23:00革新,模型,范式,中文,推理,团队

清华开源混合精度推理系统MixQ：大模型近无损量化并提升推理

...合精度量化的LlaMA模型在MMLU 20个领域上的数据集进行推理准确率测试表明，采用8bit混合精度量化后的准确率下降不到0.1%：△图6 混合精度量化分类准确率不过，此前已有的混合精度量化的系统的性能普遍不高，主要瓶颈在针对...……更多

2024-10-22 09:57:00推理,清华,吞吐,精度,混合,模型

多模态LLM视觉推理能力堪忧，浙大领衔用GPT-4合成数据构

...调模型。经过测试，人类在该基准上可以达到至少82.1%的准确率，但Claude 3.5 Sonnet和GPT-4o等顶流模型的成绩却远远落后于人类，分别只有64.7%和59.9%。目前全部数据已经上传至HuggingFace仓库。仓库地址：https://huggingface.co/da……更多

2024-08-08 16:23:00模态,领衔,基准,推理,视觉,能力

文心一言发布百度市值蒸发200亿，外界称缺乏亮点，应用前景难

...出来高时效的信息和内容，从而大幅度提升事实性问题的准确率。此外，李彦宏表示文心一言能够连续三次内容创作生成，这是基于庞大数据规模而发生的“智能涌现”。据介绍，文心一言大模型的训练数据包括万亿级网页数据...……更多

2023-03-17 10:00:00文心,市值,蒸发,外界,前景,亮点

AI新时代揭幕！会“思考解题逻辑”的OpenAI推理大模型登

...中，AI会不断试错并打磨答案，从而显著提高生成结果的准确率和质量。有趣的是，点开AI思考的过程，还会出现AI表示“我在思考这个事情这么做行不行”、“啊时间不够了得尽快给出答案”等。OpenAI确认，这里展示的并不是原...……更多

2024-09-13 13:34:00新时代,推理,逻辑,模型,模型,问题

春节流量给支付宝留下了什么？

...是能做的。”陈亮认为，当下AI技术的挑战主要在于提高准确率。以往依赖复杂且可行性不高的模板来调用功能，不仅难以保持高准确率，而且维护困难，导致项目难以持续，大模型技术的引入给LUI提供了更多的可能。基于大模...……更多

2024-02-16 12:00:00流量,支付,五福,支付,模型,蚂蚁

一克商评 | 随着小冰“数字克隆人”不断发展进化，将为未来直

...实践相结合。得益于互联网技术的赋能，越来越多的科学知识传授方式进入校园。科学知识的互动教学课，是培养孩子们科学思维、探索未知兴趣和创新意识的有效方式。在“科技创新、强国有我”的期许下，从当小科学家，到...……更多

2023-06-02 07:50:00电商,一克,克隆人,进化,直播,不断

5年投资超1000亿，北京公布一系列AI重磅成果，北大清华百

...可能会掣肘大模型落地应用；需求尽快找到大模型落地与知识产权保护、数据隐私保护之间的平衡点；大模型幻觉问题仍未得到“根治”；大模型从“可用”到“好用”，需要供需双方协同发力，联合研发；部分领域应用积极响...……更多

2024-04-28 11:00:00大佬,清华,微软,重磅,北京,蚂蚁

蚂蚁数科SOFAStack发布全栈AI服务，助力企业用好大模

...站式模型工作台，并实现可视化研发、管理多种具备行业知识库的Agent（智能体）应用，助力企业跑完企业AI应用业务落地的最后一公里。“大模型的高速发展使得AI不得不面临算力管理复杂、训练推理成本高、任务调度难等多方...……更多

2024-06-28 18:10:00蚂蚁,模型,服务,企业,模型,训练

多模态模型评测框架lmms-eval发布！全面覆盖，低成本，

... 作为备选。最终的报告结果将基于得分转换为 0 到 100 的准确率指标。未来也可以在我们动态更新的榜单里查看多模态模型在每个月动态更新的最新评测数据，以及在榜单上的最新评测的结果。 ……更多

2024-08-22 09:50:00模态,框架,模型,评测,污染,成本

用AI自动设计智能体，数学提分25.9%，远超手工设计

...分数提高了 13.6/100（与基线比），在 MGSM 的数学任务中将准确率提高了 14.4%。此外，在跨域迁移后，它们在 GSM8K 和 GSM-Hard 数学任务上的准确率分别比基线提高了 25.9% 和 13.2%。与手工设计的解决方案相比，本文算法表现出色，这...……更多

2024-08-24 09:36:00设计,手工,数学,智能,智能,元智

人工智能已经可以解决复杂的数学问题了，还有哪些工作无法被取代

...高中比赛的近4000道数学题目的自然语言陈述。起初，Codex准确率略低于30%。当它失败时，它创造了一些术语来填补翻译词典的空白。在此研究之前，Codex从未尝试在自然语言和形式数学代码之间进行翻译。但Codex通过在GitHub上的...……更多

2023-02-24 18:22:00人工智能,人工,数学,智能,问题,工作

支付宝进军大模型医疗应用，技术一号位：我们有4个切入点

...准等方面都建立了很深度的链接。目前我们在北上杭这块准确率，基本上能做到百分之八九十，还在继续优化中。第二个是全科医生。医疗领域面临一个主要问题是，AI目前还无法替代专业医生进行诊断。因此我们更多地将AI定...……更多

2024-09-29 09:55:00军大,切入点,模型,支付,医疗,应用

中兴通讯携手上海移动开展业界首个基于大模型的短信反诈治理探索

...、语义等根源维度上进行治理，有效提升诈骗短信的识别准确率、拦截率和召回率。自该系统上线后，境外涉诈案件数量明显降低，为减少人们财产损失、维护社会和谐做出贡献。基于大模型的短信反诈治理主要包括AI实时推理...……更多

2023-10-12 17:21:00中兴通讯,上海,模型,业界,通讯,短信

大模型观察｜从训练到落地金融业，大模型“升级之路”面临哪些挑

...效率提升了25%。在智能办公领域，大模型目前的意图识别准确率已达到97%。奇富科技则透露，通过AIGC的强大赋能，在电销系统中，语义分析和线索挖掘帮助提升电销线索识别准确率高达98%，同时将转化率提高超过5%。在智能营销...……更多

2024-01-29 21:36:00模型,之路,金融业,落地,观察,训练

本周硅谷发生了什么？｜苹果Vision Pro正式开售；Ne

...于 Python、C++、J等多种语言。在HumanEval基准测试中，它的准确率为53% ，接近于GPT-4的67% 。Mistral CEO确认新模型性能接近GPT-42月1日，Mistral联合创始人兼CEO Arthur Mensch在X上表示，引发众多猜测的“miqu-1-70b”是……更多

2024-02-05 11:37:00硅谷,字节,接口,人类,苹果,模型

GPT-4劲敌，谷歌进入高能+高产模式

...中，Gemini 1.5 Pro能够在长达100万token的文本块中，以99%的准确率找出隐藏有特定信息的文本片段。图源：Gemini 1.5 Pro官方测试数据这个上下文长度使Gemini 1.5 Pro可以自如地处理22小时的录音、超过十倍的完整的1440页的书（587,287字..……更多

2024-02-21 14:05:00劲敌,高产,模式,模型,上下文,处理