架构,模型,优势,模型,训练,模块头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

轻量化模型架构catvton的优势在哪里

...下。来自中山大学、Pixocial等机构联合发布轻量化模型架构CatVTON。他们是以StableDiffusionv1.5inpainitng为基础模型。来看看更多效果。用扩散模型进行虚拟试衣CatVTON可以实现传统平铺服装图到人物的换装。不管是上衣、裤子、裙子...……更多

2024-08-01 08:52:00架构,模型,优势,模型,训练,模块

“苹果智能”仅面向付费开发者，三大新模块炸裂出圈

...在于芯片级别的互联性特别高。苹果的技术论文表明，TPU架构可以开发更大、更复杂的AI模型。三大新模块炸裂出圈随着iOS18.1Beta版的上线，注册开发者从即日起就能体验到苹果AI的部分功能。据悉，本次更新只支持M系和A17Pro芯...……更多

2024-07-31 23:28:00开发者,模块,苹果,三大,智能,开发

智能驾驶的「 ChatCPT 时刻」，这么近，那么远

...。让他发出感叹的方案，就是如今风靡整个行业的端到端架构。尽管几年前，端到端架构在自动驾驶领域的运用已经出现在英伟达论文中，但正式落地使用还是从特斯拉的这次转变开始。什么是智能驾驶的端到端架构呢？严格...……更多

2024-06-28 14:06:00驾驶,时刻,智能,驾驶,特斯,特斯拉

扩散模型也能搞定社交信息推荐，港大数据智能实验室提出RecD

...速度较慢。相比之下，团队的 RecDiff 则得益于紧凑的神经架构，不需要手工制作先验，因此能利用辅助信号进行更快的优化。对 RecDiff 框架抗噪能力的进一步探索团队评估了 RecDiff 在数据噪声情况下的鲁棒性，方法是在用户-用...……更多

2024-07-30 09:31:00社交,实验室,模型,实验,智能,数据

AI出图更快、更懂你心意，高美感文生图模型修炼了哪些技术秘籍

...》就邀请到了豆包文生图技术专家李亮、NVIDIA 解决方案架构师赵一嘉，为我们深入剖析了文生图模型出图更美、更快、更懂用户心意背后的技术链路。直播开始，李亮首先详细拆解了近期国产大模型「顶流」—— 字节跳动豆包...……更多

2024-08-13 09:39:00文生,出图,美感,秘籍,心意,更快

OpenCity大模型预测交通路况，零样本下表现出色，来自港

...题，研究团队新的基础模型OpenCity。OpenCity结合了Transformer架构和图神经网络，用以模拟交通数据中复杂的时空依赖关系。通过在大规模、异质性交通数据集上进行预训练，OpenCity能够学习丰富、具有泛化性的表征，这些表征可有...……更多

2024-09-02 13:34:00路况,样本,模型,交通,交通,模型

科学家研发自动驾驶新模块，让自动驾驶场景理解更接近人类认知

...以对周围环境进行实时感知和安全导航。然而，这种系统架构不但代码量巨大、后处理逻辑复杂、后期维护成本高。而且在实际应用过程中容易出现误差累积的现象，比如前方突然出现行人，由于感知模块的漏检，下游的预测决...……更多

2024-04-11 10:53:00驾驶,认知,科学家,模块,场景,人类

智谱AI发布视频生成大模型，B站参与研发，亦庄提供算力｜甲子

...空间。从模型本身角度看，需要更具突破式创新的新模型架构，它应该更高效压缩视频信息，更充分融合文本和视频内容，贴合用户指令的同时，让生成内容真实感更高。2.自研DiT架构清影底座的视频生成模型是CogVideoX，它将文...……更多

2024-07-27 09:30:00亦庄,甲子,生成,模型,视频,模型

英伟达开源NVLM 1.0屠榜多模态！纯文本性能不降反升

...经过多年的发展，逐渐发展成了统一的纯解码器Transformer架构。反观现有的多模态大模型架构仍然处于混乱状态，开源模型在选择LLM主干、视觉编码器以及训练数据方面都存在差异，性能优异的闭源多模态大模型也没有公布相关...……更多

2024-09-24 13:36:00英伟,模态,文本,性能,模态,模型

大模型下沉，汽车需要存算一体芯片｜超级观点

...电量，这是地球无法承受的。”然而，在传统的冯诺依曼架构下，存储和运算是分离的，芯片大概有80%-90%的功耗浪费在数据的存储和计算之间的搬运，而非计算上。此外，当大模型逐渐向智能汽车、电脑、手机等边缘端下沉，...……更多

2023-12-07 19:25:00芯片,模型,观点,一体,汽车,芯片

清华团队提出新型光计算架构，光训练速度提升1个数量级

...戴琼海教授课题组创新性地设计了全前向智能光计算训练架构，开发出一种名为“太极-II”的通用光训练芯片。该架构摆脱了对电计算离线训练的依赖，而且能够为智能系统的高效光训练提供支撑。图丨图中为课题负责人方璐教...……更多

2024-08-09 09:57:00量级,清华,架构,个数,团队,速度

中昊芯英与深圳联通携手共建广东首个国产TPU 智算中心

...积累与优势互补。据了解，中吴芯英作为国内领先的TPU 架构AI 芯片企业，此次提供了搭载其自主研发的高性能 TPU 芯片“刹那®”的人工智能服务器及大规模AI计算集群系统“泰则®”，为项目搭建坚实的AI 计算底座。深圳联通则...……更多

2024-09-13 11:54:00中昊,广东,深圳,国产,中昊,深圳

Llama3训练每3小时崩一次？豆包大模型、港大为脆皮万卡训

...nt 在不同并行度配置的任务中的灵活迁移。系统设计存储架构ByteCheckpoint 采用了元数据 / 张量数据分离的存储架构，实现了 Checkpoint 管理与训练框架和并行度的解耦合。不同训练框架中的模型以及优化器的张量切片 ( Tensor Shard)...……更多

2024-08-09 09:37:00万卡,训练,豆包,脆皮,大为,模型

让x86处理器也有AI智能，解读AMD Ryzen AI引擎

...理AI相关任务是采用神经网络进行计算的，和传统计算在架构和模式上都存在巨大的差异。我们知道人工智能最初是由传统的硬编码算法创造，并由人类编程完成，而现代的人工智能大多基于神经网络，数据以不同的权重从一个...……更多

2023-11-13 15:15:00处理器,引擎,处理,智能,处理器,引擎

蜘蛛侠妖娆起舞，下代ControlNet来了！贾佳亚团队推出

...的参数子集，其余参数则被冻结。另外在设计ControlNeXt的架构时，研究团队还保持了模型结构与原始架构的一致性，从而实现了即插即用。无论是ControlNet还是ControlNeXt，条件控制信息的注入都是一个重要环节。在这个过程中，Cont...……更多

2024-08-19 09:37:00佳亚,蜘蛛侠,妖娆,蜘蛛,团队,控制

人工智能光芯片“太极”发布

...摒弃传统电子深度计算范式，首创分布式广度智能光计算架构，研制出全球首款大规模干涉衍射异构集成芯片“太极”（Taichi）。该芯片具备每平方毫米每秒879万亿次乘加运算的面积效率与每焦耳160万亿次运算的能量效率，首次...……更多

2024-04-15 06:37:00太极,人工智能,人工,芯片,智能,智能

研究展示分布式架构在量子模拟领域优势

...大学物理系副教授鲁大为合作，在实验上首次使用分布式架构实现环面码模型并成功探测拓扑相位，展示了分布式架构在量子模拟领域的优势。近日，相关成果发表于《物理评论快报》。近年来，超导量子计算迅速发展，规模有...……更多

2024-01-18 07:46:00量子,分布式,架构,优势,领域,研究

5项重大更新，NVIDIA助力人形机器人研发迈入新阶段

...机器安全、自然地交互。据悉，该 SoC 基于 NVIDIA Blackwell 架构，采用第二代 Transformer 引擎，其变压器引擎可提供 800 teraflops 的 8 位浮点 AI 性能，运行带宽达 100GB/s，AI 计算性能达 800TFLOPs，多层次规划能力卓越，以运……更多

2024-05-16 15:10:00人形,机器人,机器,阶段,更新,机器人

对话腾讯汤道生：大模型和云一样，难以被垄断｜36氪专访

...服务能力获得市场竞争力，而不是单纯的低价。新的技术架构，也能为客户降本，比如大数据的湖仓一体架构，就比传统做法性价比更高。最近推出的新一代云服务器，基于性价比更高的Bergamo芯片，也能给到客户更低的单位计...……更多

2024-02-08 14:55:00腾讯,专访,模型,对话,模型,腾讯

冲击「行业前三」，长城的智驾开窍了？

...道里窄车道转弯等场景，可以处理的比较流畅。除了技术架构外，影响端到端效果最关键的，是算力和内存、数据，以及未知的训练效果。从长城分享的信息来看，数据来自于长城用户回传数据和专业数采数据，目前累计真实用...……更多

2024-07-17 10:50:00长城,冲击,行业,长城,驾驶,模型

阿里发“神笔马良版Sora”，轻轻一抹让猫咪转向，20个演示

...，创新两种运动处理模块Tora采用OpenSora作为其基本模型DiT架构，OpenSora是AI创企潞晨科技设计并开源的视频生成模型框架。为了实现基于DiT的轨迹控制视频生成，Tora引入了两个新型运动处理模块：轨迹提取器（Trajectory Extractor）...……更多

2024-08-05 09:34:00马良,神笔,阿里,猫咪,演示,报告

打通大模型产业应用的最后一公里!联想首次全面深入解读全栈智能

...从2017年开始，联想就着手围绕“端-边-云-网-智”的新IT架构做“全栈智能”的布局，目前已形成了AI内嵌的智能终端、AI导向的基础设施、AI原生的方案服务三个方向（联想内部称之为3S业务）的完整业务布局，而且在每一个业务...……更多

2024-01-14 22:52:00布局,模型,战略,智能,产业,应用

追一科技吴悦：一家做了7年NLP的公司，如何抓住大模型浪潮？

...，怎么在服务营销场景里利用起来。36氪：博文大模型的架构是怎么样的，基于什么通用大模型进行训练？吴悦：我们从需求出发，采取了两条路径。第一条是依靠国内外开源成果，如LLaMa、千问、百川、智谱等，在开源模型的...……更多

2023-12-06 14:07:00浪潮,专访,模型,一家,科技,公司

大模型推理乘上RISC-V快车？国内AI芯片创企推大模型系列

...RISC-V大芯片创企希姆计算就联合国鑫发布了基于开源指令架构RISC-V打造的大模型系列一体机。其中包括2U4卡、4U8卡机，支持部署6B、7B、13B参数规模的大模型，这也是专门针对私有化部署提供的系统级解决方案。在私有的处理器...……更多

2023-11-15 15:41:00模型,一体机,推理,快车,芯片,一体

RTX3090可跑，360AI团队开源视频模型FancyVi

... 360AI 团队和中山大学联合研发的 FancyVideo，一种基于 UNet 架构的视频生成模型。作者基于已经开源的 61 帧模型，实测效果如下。视频链接：https://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==∣=2650931627&……更多

2024-08-27 09:52:00红衣,大叔,模型,团队,视频,生成

模型即服务，卓世科技MaaS平台 2.0 正式上线

...现跨设备、跨域、跨品牌算力融合管理 6、支持各类模型架构：多种模型种类的支持，如大语言模型、多模态模型等;多种模型架构支持，如单体模型架构、MoE模型架构 7、平台提供多种模型微调方式：支持RLHF、LORA、P-turning等多...……更多

2024-08-07 09:45:00模型,服务,平台,科技,模型,数据

硬件在人工智能基础教育中的角色: 机遇和挑战

...度神经网络的研究重点主要集中在数据处理方法、神经元架构以及联结方式（特别是近期对大数据模型如transformer和Mamba架构的研究），以及网络训练方法。二、人工智能在基础教学中面临的问题叶琛博士认为，在人工智能领...……更多

2024-06-26 14:45:00人工智能,人工,机遇,角色,硬件,智能

微软连发3款Phi-3.5模型：128K上下文，首用MoE架

...U测试中击败了GPT-4o mini。这是微软首次使用混合专家模型架构。这一模型系列中最小的Phi-3.5-mini-instruct在长上下文代码理解任务以明显优势击败Llama-3.1-8B-instruct和Mistral-7B-instruct，而其参数规模还不到Llama-3.1-8……更多

2024-08-22 09:49:00上下文,微软,架构,模型,上下,性能