推理,架构,混合,人类,能力,语言头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...成为一名称职的LLM研究者和从业人员，利用归纳偏差进行推理的能力都是必不可少的。而了解不同模型架构之间基本的细微差别有助于未来的不断创新。Yi Tay分享了他的主要收获：encoder-decoder和decoder-only模型都是自回归模型，但...……更多

2024-07-22 09:39:00科学家,江湖,科学,博客,模型,目标

无一大模型及格！北大/通研院提出超难基准，评估长文本理解生

...的长依赖任务中的多信息检索、时间重排序、计算、理解推理能力表现均不乐观。比如像Claude3-200k，GPT4-32k、GPT4-8k、GPT3.5-turbo-6k、LlamaIndex这种商业模型，平均只有40%的准确率。而像开源模型表现就更不理想了…ChatGLM2-6B、LongLL……更多

2024-08-08 09:39:00基准,北大,生成,模型,文本,评估

苹果300亿参数大模型首亮相，还买了家AI公司｜焦点分析

...模有30亿、70亿、300亿三种大小，有图像识别和自然语言推理能力。其中，参与该论文的作者有30人，一半以上都是华人。 MM1测试效果不如Gemini和GPT4V和市面上其他大模型相比，MM1亮点并不在惊艳的效果上，也没有提出特别的技...……更多

2024-03-16 18:14:00模型,苹果,参数,焦点,分析,公司

理想的智能驾驶，到底「City 不 City」？

...人过去的经验和习惯所形成的直觉；系统 2 则代表了思维推理能力，人们需要借助思考和推理来处理复杂的问题和应对未知的场景。端到端模型主要用于处理常规的驾驶行为，从传感器的感知数据输入到行驶轨迹的决策输出只经...……更多

2024-07-17 10:49:00驾驶,理想,智能,理想,模型,系统

OpenAI没有放弃的机器人梦想

...人团队，理由是缺乏训练机器人使用人工智能进行移动和推理所需的数据，研发受到了阻碍。当时，在美国创业孵化器Y Combinator的论坛上，BuzzFeed数据科学家马克思·伍尔夫（Max Woolf）直言：“一种可能准确但带有讽刺意味的观...……更多

2024-03-18 10:00:00机器人,机器,梦想,机器人,机器,模型

刚刚，Llama 3.2 来了！支持图像推理，还有可在手机上

... Meta 对 Llama 模型来了一波大更新：不仅推出了支持图像推理任务的新一代 Llama 11B 和 90B 模型，还发布了可在边缘和移动设备上的运行的轻量级模型 Llama 3.2 1B 和 3B。不仅如此，Meta 还正式发布了 Llama Stack Distribution，其可……更多

2024-09-27 13:42:00推理,可在,图像,运行,版本,支持

5年后ai所需算力超100万倍

...提出的卷积神经网络（CNN）；YoshuaBengio在深度学习的因果推理领域的贡献；GeoffreyHinton，人工智能的先驱之一，在2006年提出了深度置信网络（DeepBriefNetwork）模型和反向传播优化算法。J̈urgenSchmidhuber提出了广为使用的循环神经网...……更多

2023-01-31 20:34:00智能,人工智能,人工,人类,能力,社会

大模型的未来，快手在自己身上找答案

...通话、英语及多种方言，还以其卓越的性能表现和极低的推理时延脱颖而出，广泛应用于快手的多种场景。理解了外部世界之后，受到考验的就是「AI 关小芳」的表达能力。「AI 关小芳」已经不是木讷的问答机器。它在对话能力...……更多

2024-07-11 14:20:00快手,模型,答案,快手,模型,小芳

老黄祭出史上最强 AI 芯片B200！30倍性能提升，AI

...ckwell，是英伟达A100/H100系列AI GPU的继任者。在大语言模型推理工作负载方面，Blackwell的性能相比H100 GPU提升了30倍，能耗却降低了25倍。亚马逊、谷歌、微软和甲骨文将是首批合作伙伴。此外，黄仁勋还在GTC大会推出了新一款服务...……更多

2024-03-19 13:00:00老黄,摩尔,定律,芯片,性能,媒体

阿里CEO吴泳铭：生成式AI让世界有了一个统一的语言——To

...著提升了用户的体验和接触AI技术的机会。结合阿里云在推理输入方面的优化，这些降价和优惠策略大大减轻了企业在AI应用中的成本压力，使得高性能AI模型的普及成为可能。通过云计算的支持，Token技术不再局限于实验室或小...……更多

2024-09-20 09:51:00阿里,生成,统一,语言,世界,模态

国内规模高达200亿，AI 新浪潮真的是“具身智能”吗？｜钛

...一的AI，也就是在‘知’的层面上，智能体要具有感知、推理、决策的能力。在‘行’的层面，智能体可以通过身体的动作和表情，与环境以及其他智能体进行交互。这是一种既要有大脑，还要有躯体的智能体。”上海人形机器...……更多

2024-04-13 01:00:00新浪潮,新浪,高达,规模,智能,媒体

模型即服务，卓世科技MaaS平台 2.0 正式上线

...。本次新上线了包括：模型训练新基座，支持模型训练、推理、量化、评测等功能。卓世科技MaaS平台是一款基于知识增强大模型的一站式行业模型训练开发平台。面向开发者和企业提供从基础算力服务、数据服务、模型训练服...……更多

2024-08-07 09:45:00模型,服务,平台,科技,模型,数据

以假乱真，天工音乐大模型带来颠覆式AI体验

...「天工2.0」MoE大模型，「天工3.0」在模型语义理解、逻辑推理、以及通用性、泛化性、不确定性知识、学习能力等领域拥有惊人的性能提升，其模型技术知识能力提升超过20%，数学/推理/代码/文创能力提升超过30%。同时，「天工...……更多

2024-04-03 11:35:00天工,颠覆,模型,体验,音乐,天工

刚刚，我们感受了一波最「像人」的国产AI，模型还是开源的

...的端到端多模态大模型的探索，一条是 o1 所代表的关于推理 Scaling Law 的探索。具体到 GPT-4o 上，OpenAI 跨文本、视觉和音频端到端地训练了一个新模型，所有输入和输出都由同一神经网络处理。行业内认为，这是一种可以将音频...……更多

2024-10-26 09:49:00一波,模型,国产,还是,语音,模型

浙大校友自研跨模态模型，打造具身智能的“通用语法”

...型、有效预测未来行为、以及在复杂交互场景中进行灵活推理等方面仍然面临挑战。图丨谷歌 PaLM-E[2]（来源：arXiv）由功能型到智能型的转变总的来说，由于技术水平的限制，关于具身智能的构想并未得到充分发展。直到近来...……更多

2024-03-22 10:31:00模态,语法,校友,模型,智能,智能

骁龙xelite和npu对未来windows的影响

...NPU的设备上，核心问题是如何编写充分调用本地计算和云推理的应用程序，而这也是我们计划通过WindowsAI生态系统实现的目标。所以我认为我们实际上将会有很多具有本地模型、混合模型的应用程序，这就是人工智能的未来。混...……更多

2023-10-26 11:58:00影响,纳德拉,纳德,人工智能,系统,人工

9.11和9.9哪个大？实测12个大模型8个都答错，Chat

...模型的短板，此前行业也多次讨论过大模型的数学和复杂推理能力较差，即便是目前最好的大模型GPT-4也仍然有很大进步空间。最近的一次，第一财经曾在6月报道过，根据司南评测体系OpenCompass的高考全卷测试，包括GPT-4在内，7...……更多

2024-07-17 11:56:00实测,模型,模型,数学,小数,问题

专家模型不要专家并行！微软开源MoE新路径

...好，所以要在左上角： GRIN作为MoE架构，总参数量约42B，推理时激活的参数为6.6B，打同级别（7B）的非MoE模型是手拿把攥，甚至比14B的Phi-3还要略胜一筹。在上面的这份成绩单中，GRIN MoE表现优异，尤其是在编码和数学测试中。...……更多

2024-11-12 09:57:00专家,微软,路径,模型,模型,专家

从架构、工艺到能效表现，全面了解LLM硬件加速，这篇综述就够

...法分别将 BERT、GPT-Neo、BigBird 和 Longformer 在当前 GPU 上的推理速度加快了 1.25 倍、1.12 倍、1.57 倍和 1.65 倍，显著减少了片外内存流量。SoftMax。2022 年，Choi 等人提出了一种通过重组 Softmax 层加速 Trans……更多

2024-09-21 09:37:00能效,架构,工艺,硬件,加速器,能效