巅峰,推理,模型,风云,模型,测试头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...1.0亮点主要包括五个方面：最先进的性能测试结果，新的推理以及创意功能，性能强大且高效的 AI 超算系统，责任与安全，以及可用性。首先，性能测试方面，在32个性能基准测试中的30个中，Gemini Ultra模型超越了现有最先进的G...……更多

2023-12-07 13:02:00美国,人类,疯狂,焦点,媒体,英伟

IDC最新报告：2024中国AI基础设施市场份额，阿里云第一

...；在生成式AI基础设施领域，阿里云取得模型训练和模型推理市场的双项冠军。AI IaaS 是以GPU等AI专用芯片为算力支撑的基础设施，包括以大模型为核心的生成式AI IaaS（GenAI IaaS）和传统的非生成式AI IaaS。随着大模型加速发展，生...……更多

2025-07-01 11:53:00阿里,中国,基础设施,份额,设施,基础

首个AI高考全卷评测结果发布：最高分303，数学全不及格

...。在数学方面大模型还有很大的提升空间。数学关乎复杂推理相关能力，这是大模型普遍面临的难题，也是大模型在金融、工业等要求可靠的场景落地需要的关键能力。上海人工智能实验室领军科学家林达华此前在采访中对第一...……更多

2024-06-24 09:22:00评测结果,最高分,评测,数学,高考,结果

OpenAI发布GPT-4.5：情商高、更擅长骗其他AI打钱

...在GPT‑4.5的系统卡/说明书中，OpenAI表示，相比于之前的推理模型，GPT‑4.5并未引入7个全新的前沿能力，并且在大多数准备度能力评估中，其表现低于o1、o3-mini和深度研究模型。OpenAI也承认，相信推理会成为未来AI模型和核心能...……更多

2025-02-28 06:23:00情商,模型,推理,公司,方面,能力

智能体首达Kaggle Grandmaster,华为结构化推

...中的表现，研究者们提出了各种提示策略来提升大模型的推理和规划能力，比如思维链、思维树和思维图谱。这些进步与工具集成一起，推动着通用 AI 智能体的发展，让它们现在已经能够用 LLM 输出的决策策略来解决序列决策问...……更多

2024-11-09 09:53:00华为,结构化,推理,思维,结构,智能

完美运行DeepSeek-R1 671B：摩尔线程MTT S

...院检测，摩尔线程自主研发的训推一体计算卡MTT S4000，在推理场景下与DeepSeek-R1 671B大模型的适配结果，符合“AI芯片和大模型通过性适配要求”，成功通过中国信通院《AI芯片和大模型适配能力通过性评测软硬件环境及测试细则...……更多

2025-05-07 20:11:00信通,摩尔,适配,线程,中国,芯片

空间智能版ImageNet来了！李飞飞吴佳俊团队出品

...的任务对应套件，包含总结、感知（回忆、跟踪）、视觉推理（空间、时间、预测、因果、反事实）和导航（房间到房间、对象检索）任务，共18个子任务。其中，总结任务要求模型对视频中的关键事件、主要交互等进行概括性...……更多

2024-11-11 13:31:00团队,智能,空间,视频,模态,模型

能看风水夸我有情趣 Kimi现在都这么野了吗

...何题，多少差了点意思。但这次的 k1 就有说法了，既有推理能力又有视觉能力，意思就是可以直接拍照上传解题，还号称能在数理化上打平甚至超越 Open AI 的 o1 。那要是这么比的话，咱可就来劲了。正好， k1 新模型现在也不...……更多

2024-12-19 00:21:00看风水,情趣,模型,能力,推理,更多

抽卡效率提升4.8倍！东北大学等开源优化版Stable-Di

...需外部依赖的情况下在CPU（以及可能配置GPU）上实现高效推理。Sdcpp作为一个高效的推理框架，不仅能够显著加速模型的运行，还能大幅减少内存占用。 Sdcpp的实现中，计算密集型的2D卷积运算是图像生成的主要瓶颈，虽然功能...……更多

2024-12-21 09:14:00东北大学,生成,分辨率,效率,质量,大学

突破数据墙！27岁华裔MIT辍学创业8年，年化收入逼近10亿

...的合同工进行人工标注。他强调，来自专家的、包含复杂推理的数据是未来人工智能的必备条件。传统的数据来源，比如从Reddit等社区的评论中抓取数据存在局限性。Scale AI构建了一些流程，模型先输出一些内容，例如撰写研...……更多

2024-09-26 13:37:00华裔,收入,突破,创业,数据,数据

DeepSeek，大消息

...伟达开源了首个在Blackwell架构上优化的DeepSeek-R1，实现了推理速度提升25倍，并且每token成本降低20倍的惊人成果。这一新模型的推出，标志着英伟达在人工智能领域的又一次重大进展。开源周第三天，DeepSeek宣布开源Optimized Paralle...……更多

2025-02-27 15:51:00消息,英伟,模型,推理,训练,通信

亚马逊连甩6款大模型！推出3nm AI训练芯片，最强AI服务

...比，苹果已用Amazon Graviton、Inferentia等AWS芯片在机器学习推理工作负载方面实现了40%以上的效率提升，并预计在Trainium 2上预训练模型时，效率将提高50%。被亚马逊豪掷80亿美元投资的Anthropic，宣布与AWS共同构建面向机器学习训练...……更多

2024-12-05 09:47:00亚马,亚马逊,芯片,模型,训练,服务器

LLM群体智能崛起，数学性能暴增11.6%！谷歌DeepMi

...认知，数学最考验元认知，原本是指，人类对自己思维、推理过程的直观认识。那么，大模型也具备「元认知」的能力吗？研究人员对此，提出了一种假设，并设想是否可以通过知识引导，进一步提高LLM的能力。其实，此前的...……更多

2024-09-23 09:50:00新作,群体,性能,数学,机构,智能

全面开源浪潮信息发布千亿参数基础大模型“源2.0”

...51B（518亿）、2B（21亿）三种参数规模的模型，在编程、推理、逻辑等方面展示出了先进的能力。基础大模型的关键能力是大模型行业和应用落地能力表现的核心支撑。在算法、数据和算力等方面，“源2.0”提出了新的改进方法...……更多

2023-11-28 07:46:00浪潮信息,浪潮,模型,参数,基础,信息

苹果开源7B模型，训练过程数据集一口气全给了，网友：很不像苹

...CLM-Baseline取得了更高的平均分，且在ARC（小学生科学问题推理）、HellaSwag（常识推理）、MMLU等任务上表现更好。 “小”模型成新趋势回到开头，“小”模型最近已成新趋势。先是HuggingFace推出了小模型家族“SmolLM”，其中包含1...……更多

2024-07-23 09:33:00苹果,一口,模型,一口气,训练,过程

00后华裔小哥哈佛辍学组团挑战英伟达，史上最快AI芯片Soh

...元导读】史上最快Transformer芯片诞生了！用Sohu跑Llama 70B，推理性能已超B200十倍，超H100二十倍！刚刚，几位00后小哥从哈佛辍学后成立的公司Etached，宣布再融资1.2亿美元。有史以来最快的Transformer芯片，刚刚诞生了？去年21岁哈佛...……更多

2024-06-27 09:25:00小哥,英伟,哈佛,华裔,推理,芯片

9.11比9.9大？多个大模型翻车！业内人士：就是偏科，文科

...文认为，模型产生幻觉的三大来源：数据源、训练过程和推理。大模型可能会过度依赖训练数据中的一些模式，如位置接近性、共现统计数据和相关文档计数，从而导致幻觉。此外，大模型还可能会出现长尾知识回忆不足、难以...……更多

2024-07-17 20:56:00理科,文科,业内人士,模型,业内,多个

科大讯飞联手华为首次攻克全国产算力下推理模型训练难关

...15日，科大讯飞发布了当前全国产算力平台上唯一的深度推理大模型——讯飞星火X1。该模型中文数学能力国内第一，并率先应用于教育、医疗等刚需场景。同时，讯飞星火4.0 Turbo底座能力再次迎来全新升级，图文、数学和长文...……更多

2025-01-15 15:07:00讯飞,华为,难关,模型,训练,全国

苹果m2ultra芯片测试：内存带宽800gb/s

...nov开发者日前使用苹果M2Ultra芯片，进行了一系列LLaMA模型推理测试，测试显示该芯片在并行运行128个Llama27B流时，效果较佳。▲图源GeorgiGerganov在GitHub披露的测试表现据悉，LLaMA模型推理测试强调内存带宽，而非计算能力，而苹果...……更多

2023-10-14 04:44:00芯片,带宽,内存,苹果,测试,芯片

腾讯推出 Hunyuan-Large 开源大模型

...2B-Instruct和Hunyuan-A52B-Instruct-FP8。并发布了技术报告和训练推理操作手册，详细介绍了模型能力和训练与推理的操作。其中模型技术优势如下：高质量合成数据：通过合成数据增强训练，Hunyuan-Large能够学习到更丰富的表示，处理...……更多

2024-11-05 18:56:00腾讯,模型,模型,长上,腾讯,训练

DeepSeek赋能企业研发：DevOps+AI新时代再升级

...力，借助DeepSeek高效的文本挖掘与信息提取能力、高效的推理和智能推荐系统以及跨模态数据分析能力和高效的深度学习推理加速能力，在需求、任务、测试、持续集成、数据洞察等领域为团队提供多样化的解决方案与创意灵感...……更多

2025-02-27 14:45:00新时代,升级,企业,小嘉,需求,模型

海信星海大模型接入DeepSeek

...矩阵，将通过模型蒸馏、强化学习等技术提升深度思考与推理能力，使得海信AI电视能够更准确地理解用户深层的意图和需求，为用户提供更流畅、更简单、更自然的交互与服务体验。海信电视正在进行用户终端的升级发布，预...……更多

2025-02-13 16:06:00海信,星海,接入,模型,海信,模型

AI正加速迈进应用落地关键期

...V3.1通过软件定义与更多芯片适配，能让超低精度训练、推理在中国自研芯片上更容易实现。业内人士指出，DeepSeek—V3.1的UE8M0FP8Scale助力国产AI软硬协同，AI正加速迈进应用落地的关键期，在政企示范引领、软硬协同创新、AI基建...……更多

2025-08-27 09:14:00关键期,落地,关键,应用,国产,精度

Llama 4训练已开启！Meta科学家最新采访，揭秘Lla

...很多不同的GPU型号和显存大小。再加上，目前广泛应用于推理阶段的量化技术，比如可以用FP16或FP8精度，这会改变推理和训练/微调成本的比重。以上这些限制因素，都让模型规模的选择成为一个非常具有挑战性的问题。总体而...……更多

2024-07-29 09:33:00科学家,训练,科学,模型,训练,基准

全国高校首个！东南大学上线阿里QwQ-32B 消费级显卡可本

...wQ-32B虽仅有32B参数，但通过大规模强化学习训练，在数学推理（AIME24评测）、代码生成（LiveCodeBench）、工具调用（BFCL测试）等任务中表现媲美671B参数的DeepSeek-R1，甚至部分指标实现超越。在测试中，QwQ-32B表现远胜于o1-mini及相...……更多

2025-03-10 15:47:00东南大学,阿里,显卡,消费,全国,大学

本科生这样“攻克”世界级难题

...科学与工程应用，如国际通行基准测试HPL&HPCG、大模型推理优化、渗流数值模拟、火星大气模拟、新型材料结构计算等，并参加英文答辩。此外，参赛队伍还通过跨团队、跨地域合作，共同挑战地震波模拟赛题。赛题有多难？...……更多

2024-04-18 07:36:00本科生,难题,本科,世界,福州大学,福州