新论,推理,符号,性能,任务,数据头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

Meta首款多模态Llama 3.2开源！1B羊驼宝宝，跑在

...I正在壮大。能力一览11B和90B这两款模型，不仅支持图像推理场景，包括图表和图形在内的文档级理解、图像描述以及视觉定位任务，而且还能基于现有图表进行推理并快速给出回答。比如，你可以问「去年哪个月销售业绩最好...……更多

2024-09-27 13:39:00模态,宝宝,模型,图像,训练,文本

打乱/跳过Transformer层会怎样？最新研究揭开其信息

...被展示过了，但我喜欢你添加的新细节，特别是强调了“推理”类任务比其他任务受影响更大！还有不少学者、工程师也表示强烈推荐。敢打赌，其中一些见解最终将会用于改进Transformer。其中的实验再次证实了：复制层对创...……更多

2024-07-27 09:29:00流动,机制,研究,信息,中间层,顺序

PyTorch官宣：告别CUDA，GPU推理迎来Triton

...PyTorch官宣，借助OpenAI开发的Triton语言编写内核来加速LLM推理，可以实现和CUDA类似甚至更佳的性能。试问，有多少机器学习小白曾被深度学习框架和CUDA的兼容问题所困扰？又有多少开发者曾因为频频闪烁的警报「CUDA版本必须与...……更多

2024-09-07 09:48:00新时代,推理,内核,矩阵,乘法,英伟

收入占比40%、电话会议点名16次，英伟达：推理端的需求被低

...让人印象深刻的是，英伟达在财报电话会议的一个观点：推理端的爆发，可能很多人还是低估了。据英伟达电话会议披露，公司全年数据中心里已经有40%的收入来自推理业务，超出了绝大部分人预期。而在这次财报电话会议里，...……更多

2024-03-02 13:38:00英伟,电话会议,推理,收入,需求,端的

系统级玩家微软、苹果先后出牌，端侧大模型路径清晰了？

...MGSM（跨语言数学能力）提升 2.3%，而DROP（文本段落分析推理）则下降了 3%。但与此同时，杀手级应用仍未出现。根据第三方网站SimilarWeb的监测数据，早在去年6月，ChatGPT流量即已见顶，当月其网站与移动客户端的全球流量（PV）...……更多

2024-06-21 09:16:00微软,路径,模型,先后,苹果,玩家

腾讯Angel获世界互联网大会领先科技奖：让通信成本降低70

...评腾讯Angel机器学习平台：突破万亿级模型分布式训练和推理以及大规模应用部署等难题。据了解，突破主要在通信、效率、规模三方面实现。通信：从网卡到交换机，再到路由协议，腾讯自研的RDMA网络实现了集群高速互联，单...……更多

2024-11-21 09:55:00科技奖,腾讯,成本,领先,大会,互联网

LeCun 的世界模型初步实现！基于预训练视觉特征，零样本规

...常有限…… 无法理解物理世界，没有持续性记忆，不能推理（只要推理的定义是合理的）、不能规划。」Yann LeCun 批评 LLM 的推文之一相反，他更注重所谓的世界模型（World Model），也就是根据世界数据拟合的一个动态模型。比...……更多

2024-11-19 09:48:00样本,模型,特征,视觉,训练,规划

从专用量子计算到实用化：解读郭光灿院士的量子计算最新论断

...塑未来：构建科技创新开放环境”为主题的2024年浦江创新论坛主论坛上，2023年度国家最高科学技术奖获得者薛其坤院士指出，在研制量子计算机方面，从物理学上至少还有5道难关，包括错误率、相干时间、制冷机、硬件方案不...……更多

2024-11-25 17:45:00量子,光灿,论断,院士,专用,量子

阿里云CTO周靖人：全面投入升级AI大基建

...级从服务器到计算、存储、网络、数据处理、模型训练和推理平台的技术架构体系，让数据中心成为一台超级计算机，为每个AI和应用提供高性能、高效的算力服务。大会现场，通义大模型迎来了年度重磅发布，基础模型升级，...……更多

2024-09-19 15:53:00阿里,基建,投入,升级,模型,通义

Llama版o1来了，来自上海AI Lab，强化学习代码已开

...问题，作为OpenAI草莓项目的开源版本。10月初，团队上传新论文，使用成对优化（不直接给出绝对分数，而是比较两个答案的相对优劣）提高Llama模型数学奥赛能力。在最难的AIME2024基准测试30道题中，原版LLaMA-3.1-8B-Instruct做对2道...……更多

2024-11-06 09:49:00上海,代码,学习,训练,模型,蒙特卡洛

比GPU性价比高百倍！Cerebras推出新AI推理服务，号

...28日消息，AI芯片独角兽Cerebras Systems于8月27日宣布推出AI推理服务Cerebras Inference，号称“全球最快”。该服务已经在云端上线。据官网介绍，该推理服务在保证精度的同时，速度比英伟达的服务快20倍；其处理器内存带宽是英伟达...……更多

2024-08-29 09:49:00性价比高,推理,性价比,全球,服务,推理

苹果推出DeepPCR 神经网络训练和推理速度提升7倍

...该算法通过并行处理常规顺序操作，可以加速神经网络的推理和训练过程。尽管神经网络已能处理文本或图片合成、分割和分类等复杂任务，但由于计算需求过大，神经网络训练和反馈结果的时间可能需要数天或者数周。目前广...……更多

2023-12-16 21:06:00神经网络,推理,神经,速度,苹果,训练

腾讯Angel机器学习平台获世界互联网大会领先科技奖

...腾讯Angel 机器学习平台，突破了万亿级模型分布式训练和推理以及大规模应用部署等难题，率先实现大模型技术从底层硬件到关键软件技术的自主研发，在业务场景广泛应用，显著推动实体产业和数字经济发展，提升社会效率。...……更多

2024-11-21 14:04:00科技奖,腾讯,机器,领先,大会,互联网

OpenAI o1模型到博士水平了?复旦教授:没有真正推理能

...小尺寸版o1-mini。OpenAI官方发文称，新模型旨在解决复杂推理问题，训练模型在响应之前花更多时间思考，类似于人类的思考方式。“新模型在推理能力上代表了AI能力的新水平。”OpenAI称，该模型可以解决科学、编程和数学等更...……更多

2024-09-13 16:44:00复旦,相关性,概率,推理,模型,教授

杨元庆谈AI PC：支持运行个人大模型

...能设备或家庭服务器上，使用存储在本地的个人数据进行推理和学习的人工智能基础模型。它不仅可以像公共大模型那样通过对话提供答案、创作内容，而且更精准、贴切，甚至根据用户的思维模式预测任务，并自主寻找解决方...……更多

2023-11-22 19:04:00杨元庆,模型,运行,支持,个人,模型

全球首次！时序大模型突破十亿参数，华人团队发布Time-Mo

...精度，还显著降低了计算负担，完美解决了时序大模型在推理阶段的计算瓶颈。2. 灵活的预测范围：Time-MoE支持任意长度的输入和输出范围，能够处理从短期到长期的各种时序预测任务，实现了真正的全域时序预测。3. 全球最大...……更多

2024-10-23 09:55:00时序,模型,团队,训练,参数,突破

阿里推出AI数据科学家，全流程自动化，科研小白也能用

...这可能会导致任务的轨迹更加不可控，因为它不会被迫“推理”整个任务。而DS Assistant使用了plan-and-excute框架，这是一种新兴的Agent框架，通过明确计划和执行步骤高效完成复杂任务。langchain官网对Plan-and-execute Agent的描述：https:.……更多

2024-08-08 09:40:00小白,阿里,科学家,流程,自动化,科研