• 我的订阅
  • 头条热搜
OpenCity大模型预测交通路况,零样本下表现出色,来自港大百度
...题,研究团队新的基础模型OpenCity。OpenCity结合了Transformer架构和图神经网络,用以模拟交通数据中复杂的时空依赖关系。通过在大规模、异质性交通数据集上进行预训练,OpenCity能够学习丰富、具有泛化性的表征,这些表征可有...……更多
APUS李涛阐述AI战略:为中国定制AI大模型,让大模型应用与价值创造接轨
...由 AI 工程师用自然语言驱动大模型实现。 四、AI大模型架构的五层金字塔,让产业革新构想高质量落地AI大模型五层金字塔架构图展现产业发展形态大模型训练需要大量的算力、数据和场景支持,根据AI发展现状与未来趋势判断...……更多
...持大模型推理部署。依托自研芯片DeepEdge10创新的D2D chiplet架构打造的X5000推理卡,已适配并可承载SAM CV大模型、Llama2等百亿级大模型运算,可广泛应用于AIoT边缘视频、移动机器人等场景。(小标题)已创新打造系列化芯片目前,...……更多
重大突破!新一代绿色类脑智能计算系统在横琴全球首发
...产业化发展的底层核心技术问题提供了新路径,有望在助力大模型训练、脑仿真、工业计算模拟、社交网络分析、金融风控分析等智能产业应用,走出智能计算的“中国新路”。横琴工作室出品采写:南都记者 朱鹏景 赵雨琪 ……更多
...会。现阶段发展多模态的核心难点之一在于构建一套通用架构对图像、视频、语音等不同模态进行统一的建模。唐家渝告诉36氪,市面上不少的大模型宣称拥有多模态能力,但实际上是多个单模态或跨模态模型的“排列组合”,...……更多
GPT 能为自动驾驶带来什么?毫末给出了答案
...率提升了 48%。目前,毫末 DriveGPT 雪湖 · 海若实现了模型架构与参数规模的升级,参数规模达 1200 亿,预训练阶段引入 4000 万公里量产车驾驶数据,RLHF 阶段引入 5 万段人工精选的困难场景接管 Clips。毫末方面表示,DriveGPT 雪湖 ...……更多
...集中在大模型技术、人工智能算法、自然语言处理、系统架构、算力架构、数据安全、产品研发能领域。从创新工场披露的团队成员背景来看,“顶尖大厂”“一把手”是最显著的标签。官方表示,已加入的联创团队成员包含前...……更多
NPU全球出货超1亿颗!芯原如何迎战大模型时代的边缘计算变革?
...够去接入到大的生态系统中去。下图呈现了芯原NPU大概的架构,芯原NPU可以带浮点32去做大量通用运算,整个软件生态往上支持OpenCL等。在过去两年,Transformer已经变成一个主导的模型架构。芯原的NPU架构也专门对Transformer做了定...……更多
英伟达帝国的一道裂缝
...的GPU也适用于深度学习的训练。很多经典的深度神经网络架构早在20世纪下半叶就已经被提出,但因为缺乏训练它们的计算硬件,很多研究只能“纸上谈兵”,发展长期停滞。1999年10月的一声炮响,给人工智能送来了GPU。深度学...……更多
...丰富行业应用场景持续赋能企业数智化建设与运营在整体架构上,用友BIP和YonGPT依靠指挥调度中心,构成事项上的执行分离架构。“在大模型的基础架构当中,我们把确定性的事项交回用友BIP原有的产品功能去做,把不确定的事...……更多
独家对话岩芯数智CEO刘凡平:“百模大战”下,AIGC新玩家如何杀出重围?|钛媒体焦点
...其他大模型产品,目前岩芯数智不仅拥有自研的Transformer架构大模型,而且其拥有的非transformer的记忆逻辑架构大模型,在训练效率、推理效率、模型幻觉、应用效果等方面都得到很大提升,已开始应用于金融、政务、互联网等...……更多
Sora为何没能诞生在中国?
...Sora的技术报告中,强调了Diffusion Transformer(基于Transformer架构的扩散模型,以下简称DiT)的重要性,这是由两种模型合成的新模型。两种模型的“合璧”是Sora得以成为爆款的关键。Diffusion(扩散模型)是一种有效的内容生成模...……更多
英伟达阉割版B200A曝光!最强芯片架构难产:产能不够,刀法来凑
英伟达最强芯片B200被迫推迟三个月,传闻闹的沸沸扬扬。老黄的对策来了:阉割版芯片B200A曝光。这难道就是“产能不够,刀法来凑”?没错,根据SemiAnalysis分析,B200遇到的主要问题正是产能不足,更具体来说是台积电的新封...……更多
一块GPU都没用,苹果自研大模型干翻GPT-4?
...模型AFM-server,尚未公布模型参数。报告首次对AFM的模型架构、训练数据、训练过程、推理优化及评估结果进行了解读,并提到背后模型的训练采用的是累计10240颗谷歌TPU,而未提及英伟达GPU。根据论文描述,苹果自研大模型在指...……更多
...华为云Stack 8.3提供了完整的AI生产链,包括AI算力、计算架构、框架、开发平台、开发套件、基础大模型以及各种专业服务,降低大模型的建设门槛;同时通过软硬协同实现算子融合与混合精度的优化,让训练效率提升45%。目前...……更多
戴尔科技:夯实AI时代“算力底座”,让每一分算力“物尽其用”
...夯实了AI时代的“算力底座”。在戴尔科技集团信息基础架构解决方案事业部AI企业技术架构师、全球CTO大使吴跃看来,无论是哪种AI应用,背后都离不开AI算力与AI基础架构平台的支持。基于此,戴尔科技打造了面向AI的基础架构...……更多
Hugging Face发布SmolVLM开源 AI 模型:20 亿参数,用于端侧推理
...(指令微调版本,可以直接用于交互式应用)三个版本。架构SmolVLM 最大的特点在于巧妙的架构设计,借鉴了 Idefics3,使用了 SmolLM2 1.7B 作为语言主干,通过像素混洗策略将视觉信息的压缩率提高到 9 倍。训练数据集包括 Cauldron ...……更多
阿里云AI基础设施获2024世界互联网大会领先科技奖
...存储、网络、数据处理、模型训练和推理平台的全栈技术架构体系,成为国内最早自研、布局最深入的AI基础设施。目前,80%的中国科技公司、65%的专精特新“小巨人”企业和60%的A股上市公司使用阿里云的算力服务。随着人工智...……更多
腾讯云公布多项大模型产品进展
...模型也持续迭代升级。在生图领域,腾讯混元文生图基础架构已全面升级至Sora同款的DiT架构,支持中英文双语输入及理解,具备多轮绘图能力,测评结果国内领先;在生视频领域,腾讯混元支持文生视频、图生视频、图文生视...……更多
创新,是从积累到突破的过程
...行业大模型和算法“双备案”。自主设计了“1+3+N”技术架构,建设了领先基础模型+多参数组合的模型矩阵,不断探索实践Pre-instruction-tuning混合预训练策略、self-instruct问答对生成、知识蒸馏新知识注入、long-CoT思维链数据增强...……更多
昇思MindSpore 2.3全新发布
...。面向长远规划,昇思MindSpore深耕根技术,持续演进,助力大模型产业落地。四项行动赋能学术与生态昇思MindSpore开源社区理事长丁诚在大会上公布了昇思赋能学术与生态的四项行动。昇思和中国人工智能学会、鹏城实验室合作...……更多
字节跳动向大模型大乱斗扔出一个豆包
...衔,团队主体以字节跳动搜索业务部门和产品研发与工程架构部下属的智能创作团队为主导,再从 AI Lab 和 AML(应用机器学习)团队中抽调人手。字节跳动语言大模型团队本来预期是在年中拿出大模型,但现在 8 月已过半。时间...……更多
华为云正式发布盘古大模型3.0 打造世界AI另一极
...模型3.0是一个面向行业的大模型系列,包括“5+N+X”三层架构,几乎涵盖当前人工智能的各个主流方向,其核心定位是为各行各业进行赋能。在“5+N+X”三层架构中,L0提供5大基础模型,包括NLP(中文语言)大模型、CV(视觉)大...……更多
中国电信中部智算中心在中部地区属于最高等级
...冷智算集群,首次采用基于国产AI基础软硬件平台的方案架构,实现算、存、网、电、热整体设计。通过独特的嵌入式液冷单元,盲插总线架构,实现液冷到芯片,液冷到服务器,液冷到机柜,全场景PUE≤1.15,在达到业内一流绿...……更多
奥看科技携手政务一网通军团,AI赋能共创城市“智理”新范式
...、摄像头智能巡检、数字人城市推介等领域共同发力,助力大模型科技成果在更多场景落地。 (奥看科技CEO庞明,左3)奥看科技与政务一网通军团过多年生态磨合,在行业内形成了坚实的定位互补,共同聚焦城市治理“一网统...……更多
“政”解丨设30亿产业基金!河南要给人工智能建“社区”
...豫具身智能实验室的人形机器人“行者二号”。基础丨聚力大模型发展,筑牢人工智能根基作为人工智能产业发展的核心要素,大模型的发展是实现“通用人工智能”的关键一步。2024年,麒麟合盛网络技术股份有限公司(以下...……更多
活动回顾|当我们谈论Sora时,我们在谈论什么?
...的Scaling Law数据、图文音视频多模态的基础模型以及Sora的架构。▲ Sora 架构 然而,骆继祥指出,尽管AI视频技术取得了长足的进步,当前仍处于完全生成与模拟之间的阶段,“无中生有为生成,适应规则为模拟”。文字与物体...……更多
大模型是否有推理能力?DeepMind数月前的论文让AI社区吵起来了
...数据上进行(自)监督训练,并大规模应用基于注意力的架构。在此过程中,研究者们开发出了具有令人印象深刻的认知能力的 LLM,如 OpenAI 的 GPT 系列、LLaMA 模型系列或谷歌 DeepMind 的 Chinchilla 和 Gemini。然而,目前还不清楚同...……更多
李彦宏:AI原生应用比大模型数量更重要
...发生了根本性改变,从原来的芯片、操作系统和应用三层架构,变成了芯片、框架、模型、应用四层架构:底层是芯片层,主流芯片从CPU变成了GPU。芯片之上是框架层,主流框架包括百度飞桨,Meta的PyTorch,谷歌的TensorFlow。框架...……更多
0提示词就能续写小说!彩云科技首创DCFormer架构大模型,AI秒变网文产粮神器
...沟通会上,AI技术公司彩云科技正式推出首款基于DCFormer架构开发的通用大模型“云锦天章”,旗下AI RPG平台“彩云小梦”也成为首款基于DCFormer架构开发的AI产品。与此同时,彩云科技CEO袁行远就AI大模型落地应用难、大模型未...……更多
更多关于科技的资讯:
厦门网讯(厦门日报记者 李晓平)在人工智能深度赋能千行百业、重塑生产生活各领域应用场景的当下,今年来,科华数据、国投智能
2025-08-25 08:54:00
英科医疗上榜TopBrand 2025中国品牌500强 位居细分行业首位
近日,《TopBrand 2025中国品牌500强榜单》在2025(第十九届)中国品牌节上正式发布,英科医疗以196.18亿元品牌价值位列第373位
2025-08-25 08:59:00
健康领跑品质卓越 飞利浦空调又获三大奖项
8月22日,以“创异破局 智启新程”为主题的2025-2026中国空调行业高峰论坛在长春举行,本次论坛汇聚行业精英,旨在探讨行业良性健康发展
2025-08-25 09:24:00
8月15日至19日,以“互通互助互利 共商共建共享”为主题的第十五届新疆喀什·中亚南亚商品交易会(以下简称“喀交会”)在喀什国际会展中心盛大举办
2025-08-25 10:33:00
进入7月以来,北京经历了数场分散性降雨,气温较高,湿度较大。气象监测显示,7月北京相对湿度一度冲高至82%。不少北京市民表示
2025-08-25 10:33:00
养老机器人产品形态日益丰富
本报记者 赵 曦 □ 唐 瑞8月20日,工业和信息化部发布通知,征集2025年度中小企业人工智能典型应用场景。通知要求
2025-08-25 10:34:00
上午9点,刚从湘潭某高校通信工程专业毕业的李明打开手机上的“零障碍”平台,一条精准推送的岗位信息映入眼帘——本地一家高新技术企业的见习工程师职位
2025-08-25 10:34:00
莱州市商务局:莱州市举办外贸政策宣讲会
大众网记者 孙建峰 烟台报道为推动莱州本地优势产业与外贸政策深度融合,搭建跨境电商行业交流合作平台,近日,2025莱州外贸政策宣讲会(亚马逊专场)在莱州市电商产业园胜利召开
2025-08-25 10:51:00
“云聚鸢都・赋能潍企”潍企云品牌发布会8月26日启幕
鲁网8月25日讯为深入贯彻国家推动制造业数字化转型、发展新质生产力的战略部署,加速潍坊市中小企业数字化、智能化转型进程
2025-08-25 11:02:00
推动新能源产业高质量发展,是践行绿色低碳发展理念、构建现代化经济体系的重要路径。国家税务总局新泰市税务局紧盯新能源汽车产业发展痛点与需求
2025-08-25 11:08:00
淘宝闪购饿了么官宣外卖行业首套制服,百万骑士将免费换新
外卖行业第一套制服今天由淘宝闪购饿了么正式官宣,网友热议称,新制服既是整个行业升级的重要标志之一,也意味着社会各界对骑士这一职业的全新认同
2025-08-25 11:08:00
从广州塔到南极冰盖:慕思818睡眠文化之旅的战略升维与文化深耕
一场驶向南极的睡眠探索,背后是慕思从传播睡眠文化到践行全球共享的品牌升维。2025年盛夏,当地表温度逼近40℃,慕思完成了一次极具象征意义的跨越
2025-08-25 11:35:00
先理知学REAL PhD:专业团队打磨申博文书,助学子彰显学术实力与潜力
博士申请文书是展现学术潜力的核心材料,直接影响录取和奖学金机会。2025年数据显示,全球申博竞争加剧——申请人数年增15%
2025-08-25 11:36:00
浪潮科技一成果入选“2025可信数据空间建设实践创新案例”
为响应国家数据局关于可信数据空间建设的战略部署,8月20日-21日,由中国信息协会主办,中国信息协会大数据分会承办的2025可信数据空间推进大会在北京举行
2025-08-25 11:41:00
聊城市检验检测中心精准检定筑牢企业安全生产防线
大众网记者 刘臣臣 聊城报道近日,聊城市检验检测中心收到一家化工企业的紧急检定申请,一批气体报警器即将到达检定周期,亟需进行计量检定以确保安全运行
2025-08-25 11:45:00