• 我的订阅
  • 头条热搜
谢赛宁新作:表征学习有多重要?一个操作刷新SOTA,DiT训练速度暴涨18倍
...测损失(feature prediction loss)和崩溃预防机制的联合嵌入架构。 这篇来自纽约大学谢赛宁团队的论文表明,即使只对生成像素感兴趣(例如,使用扩散Transformer生成漂亮的图片),包含特征预测损失也是值得的,以便解码器的内...……更多
多模态模型免微调接入互联网,即插即用新框架,效果超闭源方案
一个5月份完成训练的大模型,无法对《黑神话·悟空》游戏内容相关问题给出准确回答。这是大模型的老毛病了。因为《黑神话》8月才上市,训练数据里没有它的相关知识。众所周知,大模型的训练和微调会消耗大量计算资源...……更多
阿里多模态检索智能体,自带o1式思考过程!复杂问题逐步拆解
...,OmniSearch引入了一种动态检索规划框架。OmniSearch的核心架构包括:规划智能体(Planning Agent):负责对原始问题进行逐步拆解,根据每个检索步骤的反馈决定下一步的子问题及检索策略。 检索器(Retriever):执行实际的检索任...……更多
【产业互联网周报】马斯克发文反对美国禁止TikTok:将违背言论和表达自由;李彦宏再给开源大模型泼冷水,称大模型领域开源最贵;周鸿祎:说开源好不是针对李彦宏,开源和闭源没必要相互贬低
...泛化能力、学习和进化能力;基于AI 驱动智能可扩展安全架构,实现可扩展工作与协同模式。此外,安恒信息推出基于恒脑大模型+恒脑智能体支撑的8大核心产品,数据安全的API安全、数据分类分级、DLP 等场景已落地应用。生成...……更多
openai新旗舰模型“orion”性能不及预期
...相较于GPT-4的提升显得微不足道。Orion和GPT-4均基于变压器架构,但在设计上有所区别。GPT-4作为GPT-3的升级版,拥有更高的规模和训练技术。而Orion则采用了Anthropic公司的AI原则,更注重AI的道德性和可控性。虽然Orion在某些方面有...……更多
辽宁国资国企在线监管服务平台“一次办、在线办”模块暨政务大模型应用正式上线
...国企在线监管服务平台“一次办、在线办”模块暨政务大模型应用启动仪式在沈阳举行。本次启动仪式以“智慧国资·数创未来”为主题,正式上线“一次办、在线办”模块与政务大模型两大核心成果。数智集团的“一次办、在...……更多
让手机、PC、汽车、AIoT等“终端”都用好AI,搞定统一生态这事太重要了
...、展锐等手机芯片巨头的AI手机芯片无一例外都是基于Arm架构打造。紫光展锐执行副总裁兼市场部部长黄宇宁谈道,端侧AI如今正涌现出更多成果,包括硬件、软件、端侧大模型、端云协同与安全技术等领域的诸多新技术的成熟...……更多
2023内容科技应用典型案例:农业银行大模型ChatABC
...升AI大模型训练推理效率。应用:探索大模型知识融合新架构。构建异构知识库,支持全文检索、知识推理等各类知识检索场景需求。深度定制全文检索框架,支持文档类知识的高性能精准检索。依托知识图谱技术,构建概念类...……更多
vivo发布自研蓝心大模型及蓝河操作系统、OriginOS 4
...式。在流畅性上,蓝河操作系统从全栈视角进行了高性能架构设计,例如,在编程语言、运行时Runtime、系统调度、框架、显示和内存等技术方向取得了技术突破,能支持蓝河操作系统流畅地运行在各种配置的设备上。而在安全...……更多
科大讯飞副总裁刘聪:chatgpt类似的技术阶跃进步
...模型在细分行业的实用性,刘聪说,讯飞计划采用“1+N”架构,其中“1”是通用认知智能大模型算法研发及高效训练底座平台,“N”是应用于教育、医疗、人机交互、办公、翻译、汽车、工业等多个行业领域的专用大模型版本...……更多
Meta提出“可持续思维链”,让大模型在连续潜空间中推理
...学的研究团队进行了一项全面的研究,系统地探讨了模型架构、训练方法和数据整理策略之间的相互作用,并提出了一种名为 STIV 的简单、可扩展的文本、图像条件视频生成方法。他们的框架通过帧置换将图像条件整合到扩散 Tr...……更多
PyTorch官宣:告别CUDA,GPU推理迎来Triton加速新时代
...现CUDA-Free的计算,且生成token的吞吐量有显著提升。内核架构以Llama3为例,经典的Transformer块由一般由以下部分组成:其中涉及的核心操作包括:- RMS归一化- 矩阵乘法:融合QKV矩阵- 旋转位置编码(RoPE)- Flash Attention - 矩阵乘法..……更多
Hugging Face发布SmolVLM开源 AI 模型:20 亿参数,用于端侧推理
...(指令微调版本,可以直接用于交互式应用)三个版本。架构SmolVLM 最大的特点在于巧妙的架构设计,借鉴了 Idefics3,使用了 SmolLM2 1.7B 作为语言主干,通过像素混洗策略将视觉信息的压缩率提高到 9 倍。训练数据集包括 Cauldron ...……更多
数据中台的产品架构
...性和完整性,从而保证了数据的质量。二、数据中台一般架构数据中台的目标是:效率,成本,复用,业务数据化,数据资产化,资产业务化。 降低业务创新过程所需数据的获取和使用成本,数据分析和大数据人工智能应用更...……更多
移动办公轻薄本新标杆:华硕灵耀14 2024搭载酷睿Ultra 引领AI PC潮流
...用先进的Foveros 3D封装技术,实现了革命性的分离式模块架构,将整个处理器分为了计算模块、SoC 模块、IO 模块、图形模块的不同功能分区,这是英特尔PC处理器40年来最大的创新。分离式模块架构不仅可以快速适应PC从传统应用...……更多
一季度债基、指基受追捧;券结基金总规模突破6500亿元
...只云计算相关ETF大涨约5%。 有券商表示,2024年国内AI大模型新势力异军突起,产品力和应用体验快速追赶全球头部模型水平,部分领域已经接近,甚至达到了全球第一梯队。看好国产AI大模型持续突破,国内模型、应用、算力等...……更多
支持1024帧、准确率近100%,英伟达「LongVILA」开始发力长视频
...与纯文本 LLM 不同,VLM(例如 LLaVA)通常需要独特的模型架构和灵活的分布式训练策略。此外,长上下文建模不仅需要长上下文数据,还需要能够支持内存密集型长上下文训练的基础设施。因此,对于长上下文 VLM 来说,精心规...……更多
全面透视豆包:功能、版本、价格、优势、应用
...安全备案通过安全沙箱构建可信的执行环境多维度的安全架构保障数据安全 五、企业如何应用豆包企业在完成账号注册和企业认证后,可以进行知识库管理。打开知识库页面后,进入知识库列表。单击知识库列表页面左上角的...……更多
全球首个百亿级人类基因组基础模型Genos发布!
...局的宏大叙事。Genos通过混合专家(Mixture-of-Experts, MoE)架构,巧妙地解决了这一挑战。MoE架构如同一个拥有众多顶尖专家的智慧团队,面对任务时,总能精准调度最相关的几位专家协同处理,而不是调动所有人全部待命。这一...……更多
...。DeepSeek在V3模型技术报告中也提到,558万美元不包括与架构、算法或数据相关的前期研究和消融实验的成本,这意味着DeepSeek-V3模型的实际成本更大。不过,DeepSeek-V3模型确实节约了资源,提高了效率。创业公司的起步离不开资...……更多
助力全国一体化算力网建设,神州鲲泰以算力构建新质生产力
...泰从智算中心系统整体性能提升出发,提出了走新的智算架构之路的策略。通过整合异构的算力资源,带来多样性的服务器产品以满足差异化的客户场景需求。面对智算集群间以及集群内复杂异构兼容问题,神州鲲泰打造异构智...……更多
Token化一切,甚至网络!北大&谷歌&马普所提出TokenFormer
...海洋,北京大学20级博士生,目前主要关注是通用模型的架构设计和学习算法。指导教授主要包括王立威,北京大学智能学院教授;Bernt Schiele,德国马普计算所教授;Federico Tombari 谷歌人工智能科学家等。新一代通用灵活的网络...……更多
小米14ultra搭载ai大模型计算摄影平台
...史以来性能最强大的一款手机之一,并且首次搭载了AI大模型计算摄影平台XiaomiAISP。XiaomiAISP是小米影像大脑的升级版。官方表示,14Ultra所使用的XiaomiAISP平台是通过创新思考,结合效果、算力和生成等方面进行开发的。小米将Xia...……更多
中国智算建设潮背后,谁在推动十万卡集群
...走向十万卡集群。企业智算投资的热情高了百度杰出系统架构师王雁鹏,最近几个月频繁接触到高校客户,“他们对算力的需求在增多”。今年诺贝尔物理学奖、化学奖都颁给了人工智能相关专家,引发了广泛关注。“大家最兴...……更多
电视行业的大屏化和高端化趋势将持续深化
...能力;三星推出的新一代AI芯片NQ8AIGen3采用先进的神经网络架构,并依托大模型Gauss提供算法支持,实现了从“被动接收”到“主动服务”的转变;TCLTSR独立画质芯片在加入大模型支持后,实现了全域信息采集、全维图像分析、全境...……更多
meta推出两款基于ai的图像编辑工具
...并以EmuEdit为基础。开发团队解释,这种通过生成视频的架构能够应对外界各种输入方式,包括文字、图像、图文组合等,此外EmuVideo也能接受文字类提示词,将用户提供的图像“动画化”,从而提供了“超越过去模型的能力”。...……更多
不靠更复杂的策略,仅凭和大模型训练对齐,零样本零经验单LLM调用
...你预订酒店。既拥有海量常识,又能做长期规划的大语言模型(LLM),自然成为了智能体常用的基础模块。于是上下文学习示例、任务技巧、多智能体协同、强化学习算法…… 一切适用于通用智能体的想法都抢着在大模型落地...……更多
马斯克旗下人工智能大模型Grok已正式开源
...数,在复杂性和性能方面超越了开源竞争对手。该模型的架构融合了神经网络设计的创新方法,将 25% 的权重用于给定的令牌,以提高效率和有效性。此前,Grok 只能通过 Elon Musk 的社交网络 X 通过 X Premium+ 付费订阅服务访问。然...……更多
Sora强化算力投资主题,领先厂商持续打开估值成长空间
...,其作为领先的算力厂商,以“端-边-云-网-智”新IT技术架构为依托,在服务器、存储、高性能计算等产品以及“臻算”等服务下,为公有云、私有云、边缘计算、AI推理和训练等各类计算场景,提供普适兼智慧的“普慧”算力...……更多
苹果开源7B模型,训练过程数据集一口气全给了,网友:很不像苹果
...单:使用一个标准化的框架来进行实验,包括固定的模型架构、训练代码、超参数和评估,最终找出哪种数据整理策略最适合训练出高性能的模型。基于上述思路,团队构建了一个高质量数据集DCLM-BASELINE,并用它从头训练了一...……更多
更多关于科技的资讯:
“数字之城”杭州如何驶入文旅发展新赛道?
中新网杭州12月18日电(曹丹)近日,《AI涌现——2025杭州数字文旅产业发展年度报告》在浙江杭州发布。报告显示,该市数字文旅骨干企业2025年前三季度营收同比增长10
2025-12-19 08:24:00
天立教育与腾讯教育达成战略合作,携手推动K12教育智能化升级
2025年12月16日,天立教育与腾讯教育达成战略合作。双方将深度融合腾讯的前沿AI技术能力,与天立启鸣在K12教育领域积累的教学经验与实践场景
2025-12-19 08:26:00
特步签约全运会冠军刘景扬,从耐力赛道到速度赛场的战略延伸
12月18日,中国领先体育用品品牌特步正式宣布第十五届全运会女子100米栏冠军刘景扬成为特步体育代言人。此次合作不仅是特步运动资源矩阵的拓展
2025-12-19 08:26:00
西交利物浦大学启用沉浸式球幕影院,MEGA创意媒体盛典与国际沉浸媒体联盟同步亮相
12月18日,西交利物浦大学影视与创意科技学院揭幕沉浸式球幕影院,并举办第五届MEGA国际创意媒体盛典,同时宣布国际沉浸媒体联盟正式成立
2025-12-19 08:26:00
协同作战、共创大美食材节,良之隆集团328百天倒计时动员会举行
12月18日,是良之隆・2026第十四届中国食材电商节的倒计时100天。在此之际,良之隆集团举办了3·28百天倒计时动员会
2025-12-19 08:26:00
马克思曾指出:“生产力是社会发展的最终决定力量。”AI作为第四次工业革命的重要推动力量,正用数据、算法和算力重构生产力的模样
2025-12-19 10:56:00
我国虚拟数字人领域首个国家标准《信息技术客服型虚拟数字人通用技术要求》近日正式发布。该标准的出台填补了行业技术规范的空白
2025-12-19 12:14:00
“有烟草证就能办纯信用贷款,50万元额度随借随还,这下旺季订烟的资金缺口彻底补上了!”上饶市余干县一家超市负责人李先生
2025-12-19 12:14:00
在数字经济与日常生活深度融合的今天,优质的服务体验已成为衡量企业核心竞争力的重要标尺。中国移动通信集团江苏有限公司无锡分公司(下称“无锡移动”)再次荣获国家级“用户满意服务”认证
2025-12-19 13:15:00
米连科技布局多元社交矩阵,满足不同情感连接场景
当提及线上社交平台时,许多人脑海中首先浮现的仍是“婚恋”或“约会”的单一标签。然而,米连科技通过其创新实践,正在系统性地打破这一固有印象
2025-12-19 13:58:00
浙江日报杭州12月18日讯 (记者 何冬健 通讯员 肖乐) 记者18日从之江实验室举办的021科学基础模型创新合作大会上获悉
2025-12-19 08:54:00
在共享经济与人工智能技术加速融合、新就业形态不断涌现的当下,如何规范发展、保障权益、激发创新活力成为关键。近日,由杭州高新区(滨江)市场监督管理局牵头起草的两项团体标准——《共享
2025-12-19 06:51:00
本报记者 程宬3000元本金、一张百货柜台、十来个工人,这是彭广杰2020年春天的全部家底;三年半后,他的PAOFU宠物用品旗舰店在拼多多日出5000单
2025-12-19 07:18:00
在工厂轻松搬运物料、在医院为患者做预诊、在赛场上竞速奔跑……2025年即将收官,“具身智能”以高票入选年度十大流行语榜单第二名
2025-12-19 07:18:00
出门问问打造的AIGC产品服务用户数已超1500万、江苏奥赛康研制的新型抗感染药物加速攻关……时至今日,在南京,一个个令人瞩目的成果背后
2025-12-19 07:18:00