边界,推理,模型,训练,推理,模型头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

面壁智能发布开源大模型eurux-8x22b

...大模型Eurux-8x22B，包括 Eurux-8x22B-NCA 与 Eurux-8x22B-KTO，主打推理能力。官方测试中，Eurux-8x22B 在 LeetCode（180道LeetCode编程真题）与 TheoremQA（IT之家注：美国大学水准的STEM题目）测试上超越了 Llama3-70B……更多

2024-05-04 08:57:00模型,智能,测试,数据,模型,推理

OpenAI新功能 “深度研究” 登场，人类终极考试的表现超

...过专门优化，适配网页浏览和数据分析场景。它能够运用推理能力，在互联网上搜索、解读和分析海量的文本、图像和PDF文件，并能根据所遇到的信息灵活调整研究方向。值得注意的是，在对这个智能体的能力评测中，OpenAI特...……更多

2025-02-04 04:25:00新功能,终极,深度,人类,考试,研究

语言≠思维，大模型学不了推理：一篇Nature让AI社区炸锅

...到，人类大脑生成和解析语言的神经网络并不负责形式化推理，而且提出推理并不需要语言作为媒介。这篇论文声称「语言主要是用于交流的工具，而不是思考的工具，对于任何经过测试的思维形式都不是必需的」，引发了科技...……更多

2024-06-25 09:45:00推理,模型,思维,语言,社区,语言

科大讯飞：在智能汽车领域将持续融合集成行业最新相关技术

...信息的真实性与可靠性。投资者：你好，请问公司的深度推理X1什么时候能升级一个版本，支持所有问题的推理，而不仅仅是数学题。科大讯飞董秘：您好，2025年1月15日，科大讯飞首发国内首个基于全国产算力平台训练的具备深...……更多

2025-02-15 15:58:00讯飞,领域,智能,汽车,行业,技术

万字技术干货！LLM工程师必读量化指南，可视化图解揭秘大模型

...型的参数可能超过数十亿，通常需要显存较大的GPU来加速推理过程。因此，越来越多的研究开始关注如何缩小模型，比如改进训练方法或使用适配器。该领域的一项主要技术被称为量化（quantization）。ML工程师Maarten Grootendorst撰...……更多

2024-08-01 09:38:00干货,可视化,模型,工程师,指南,工程

小红书技术副总裁王晓博：大模型让AI越来越像人，更懂小红书的

...数据对用户和内容进行建模，会导致新笔记分发难，缺乏推理能力导致信息茧房等问题。在小红书的推荐系统中，率先将大模型作为笔记的语义编码器来使用，通过语义压缩提示词（prompt）结合对比学习技术，让大模型能够把笔...……更多

2024-07-08 14:43:00小红,越来,副总,模型,越来越,内容

李开复AI公司首发大模型，阿里云领投 | 36氪独家

...SIQA、HellaSwag、WinoGrande等多个数据集，来评估Yi的“常识推理能力”“阅读理解能力”“数学与代码能力”等多维度能力。Yi能力。结果显示，Yi-6B在常识推理能力和阅读理解能力上达到了国内外开源模型的平均水平，但在数学与...……更多

2023-11-06 12:13:00李开复,万物,模型,能力,训练,阿里

研究人员给了人工智能一个“内心独白”，结果大大提高了其性能

...工智能系统，让它在说话前先思考。内心独白提高了常识推理能力，并使其数学成绩翻了一番。一项新的研究表明，给人工智能系统一个“内心独白”会大大提高它们的推理能力。这种方法训练的人工智能系统，会在对提示做出...……更多

2024-03-21 16:13:00人工智能,研究人员,独白,人工,内心,性能

大模型“免费”送，厂商们图什么？

...，零一万物CEO李开复接受采访时表示：“未来整个行业的推理成本每年降低10倍是可以期待的，而且这个趋势是必然的。”未来，大模型的成本将呈阶梯状下探，但目前大模型的价格却断崖式下探，甚至部分企业免费送，降价幅...……更多

2024-06-05 10:57:00模型,厂商,模型,企业,成本,商业

苹果开源7B模型，训练过程数据集一口气全给了，网友：很不像苹

...CLM-Baseline取得了更高的平均分，且在ARC（小学生科学问题推理）、HellaSwag（常识推理）、MMLU等任务上表现更好。 “小”模型成新趋势回到开头，“小”模型最近已成新趋势。先是HuggingFace推出了小模型家族“SmolLM”，其中包含1...……更多

2024-07-23 09:33:00苹果,一口,模型,一口气,训练,过程

Meta首款多模态Llama 3.2开源！1B羊驼宝宝，跑在

...I正在壮大。能力一览11B和90B这两款模型，不仅支持图像推理场景，包括图表和图形在内的文档级理解、图像描述以及视觉定位任务，而且还能基于现有图表进行推理并快速给出回答。比如，你可以问「去年哪个月销售业绩最好...……更多

2024-09-27 13:39:00模态,宝宝,模型,图像,训练,文本

优刻得助力智谱AI解锁智能生活

...强结合，GLM-4稳定、高效运行于云端，并具备大规模实时推理能力，成功实现了成本效益和服务质量的平衡。这一创新使得智谱大模型能够深入理解用户需求，快速作出响应，为用户提供智能化生活的便利与高效。自2022年起，优...……更多

2024-02-29 22:25:00智能,生活,模型,推理,规模,能力

媲美OpenAI事实性基准，这个中文评测集让o1-previ

...样本，提升数据集的难度，以发现 LLM 的普遍存在的知识边界。具体来说，如果一个问题四个模型都能正确回答，则认为该问题过于简单并予以舍弃。2. 质量控制阶段，我们引入了严格的人工验证流程：（1）每条数据在隐藏答案...……更多

2024-11-21 09:43:00事实性,基准,中文,评测,事实,模型

AI行业深度研究：乘大模型之风，AI芯片元老寒武纪再度起航

... 的 AI 服务器收入也大幅增加。我们预计未来针对训练和推理的 AI 算力需求有望长时间高景气，据 IDC 及 TheNextPlatform 统计，2023 年全球 AI 服务器市场规模预计将超 500 亿美元，2027 年预计将超 946 亿美元。在这一场科技盛宴...……更多

2024-07-09 13:50:00之风,元老,深度,芯片,模型,研究

OpenAI o1太贵？那就自己做一个！纯提示方法让普通LL

...爆火，利用纯提示方法让普通LLM摇身一变，成为具备复杂推理能力的OpenAI o1。九月份，OpenAI o1正式登场。作为新一代的老大哥，o1系列专注于复杂的推理任务，一经推出也是直接屠榜了大模型竞技场。在下面这些难度较大的数学...……更多

2024-11-08 09:43:00太贵,推理,进化,提示,能力,方法

ChatGPT o1满血版上线！实测中它竟然败给了国产AI？

...特曼用一个简单的柱状图给出了对比：可以看到o1在数学推理和编程领域的表现要明显优于o1-preview，提升幅度在50%左右，而在科研领域的测试里，o1相对于o1-preview的表现就提升有限了。图源：OpenAI考虑到o1模型不需要额外加钱就...……更多

2024-12-11 20:12:00实测,国产,模型,推理,文心,答案

方寸之间算力无边，华硕隆重推出Ascent GX 10

...达1000AITOPS处理能力和128GB统一内存，实现无缝模型开发和推理先进架构：NVIDIA?GB10GraceBlackwell超级芯片配备BlackwellGPU、20核ArmCPU和NVLink-C2C?技术，可有效提升AI工作负载扩展互联：配置为独立或私有云系统，以在桌面上驱动AI……更多

2025-03-31 08:42:00华硕,方寸,隆重推出,之间,计算机,模型