• 我的订阅
  • 头条热搜
...千亿参数多模态大模型,以及Step-2万亿参数MoE(混合专家架构)语言大模型预览版。据阶跃星辰系统负责人朱亦博博士介绍,其中,千亿参数大模型Step-1耗时2个月训练成功,在逻辑推理、中文知识、英文知识、数学、代码方面...……更多
对话钉钉:如何打造一款超级AI应用?
...是一年多前钉钉所面临的产品问题。一年多来,钉钉产品架构上发生过多次取舍、删减以及重构,今天在智能化的课题中,钉钉似乎再次变得性感起来。钉钉的基本面是ToB,但又很要求用户体验。“客户是ToB的,用户是ToC的,钉...……更多
定价15000!老黄重磅发布RTX 5090:世界最小AI超级计算机也来了
...发布了自家最新的GPU——RTX 5090。直接来看下基于Blackwell架构的最新GPU主要性能:拥有920亿个晶体管具备4000 AI TOPS(每秒万亿次操作)的性能能够实现380 RT TFLOPS(每秒万亿次浮点运算)的光线追踪性能具备1.8 TB/s 的内存带宽,能...……更多
好气网发布天然气能力认知大模型
...大模型白皮书》,深入解析了大模型发展的脉络、能力、架构、应用以及挑战与展望,呈现了大模型在资源商、分销商、设施商等生态核心场景的应用成效,如提升运营效率、降低风险,助推产业智能化转型等。同时,对大模型...……更多
泉果基金调研开勒股份
...,全面支持国产芯片和操作系统;产品使用高性能软硬件架构,支持高强度计算、多并发访问。硬件产品搭载多种参数的预置大模型,已完成多种国产芯片的适配,用户可根据业务场景灵活选型。三、请问医疗板块如何布局?产...……更多
硅谷顶级VC的最新洞察:AI公司应该专注用户需求,而非模型构建
...模型将被通用模型采用,而另一些则需要在训练数据集和架构方面进行微调。此外,Gil还提到,AI公司应该更关注专注于客户需求,而不是将注意力集中在模型构建上。 以下为本文目录,建议结合要点进行针对性阅读:Michael Mig...……更多
大模型上岗三甲医院,给每个医生都配个“病历质控助手”
...户的反馈持续进行优化。图:惠每科技病历内涵质控方案架构最终,在界面的呈现上,惠每科技这个系统会有医生端和管理端两种:医生在医生端快速做错误检测和处理,专家在管理端做更进一步的专业性查缺补漏。由此,原先...……更多
斯坦福AI团队抄袭国产大模型?连识别“清华简”都抄了!清华系团队发文回应
...用了MiniCPM-Llama3-V的分词器,后来证据越来越多——不仅架构和代码高度相似,而且被发现作者曾在Hugging Face导入MiniCPM-V的代码,然后改名成Llama3-V。最绝的是Llama3-V连国产AI模型的“胎记”都抄走了,跟MiniCPM-V一样能识别清华战...……更多
...B,具有5种以上模态数据,已支撑训练了基于ChatGLM等先进架构的大语言模型,并应用于图像识别、古文字识别、文物病害识别等专用模型。市数据局相关负责人表示,下一步,天津市将依托产业、科技、人才等优势,持续支持鼓...……更多
...扬清说,他的一个朋友告诉他,某国产大模型不过是LLaMA架构,只是更换了几个变量名而已。很快有好事者发现,在大模型、数据集开源社区Hugging Face上,就有一位开发者发出了类似质疑:“该模型使用了Meta LLaMA 的架构,只修...……更多
马斯克要求OpenAI恢复开源,背后是开源闭源路线之争
...售大模型API访问权限,但不再发布有关其训练数据和模型架构的详细信息。2019年,阿尔特曼还组建了一个由OpenAI非营利组织管理的营利性实体,以便从微软等外部投资者那里筹集资金。对此,OpenAI在5日发文时曾解释,这是因为...……更多
Sora背后团队:成立不到1年,站在谷歌肩头,应届博士带队
...空Patch)技术和DiffusionTransformer(DiT,或扩散型Transformer)架构。Sora官网截图记者查询这两项技术的原作论文发现,时空Patch的技术论文实际上是由谷歌DeepMind的科学家们于2023年7月发表的。DiT架构技术论文的一作则是Sora团队领导..……更多
商汤科技sensetime推出“云端边”全栈大模型体系
...汤在尺度定律的指导下,会持续探索大模型能力的KRE三层架构(知识-推理-执行),不断突破大模型能力边界。”“日日新SenseNova5.0”性能超越GPT-4 Turbo:文理双修能力大幅提升,新增多模态交互自去年4月首次发布,商汤“日日...……更多
...网”,正整合全市零散性算力资源,实现多元算力的统一架构、统一管理、统一运维、统一调度和统一供给。算法方面,青岛发挥崂山实验室虹吸效应,汇集国内顶尖团队,完成了具有1700亿参数规模训练任务,培育了“瀚海星...……更多
调研219篇文献,全面了解GenAI在自适应系统中的现状与研究路线图
...GenAI 在自适应系统的分析和规划中有巨大潜力。LLMs 支持架构和需求驱动的适应,扩展了系统处理自然语言和非结构化数据的能力。LLMs 和 Diffusion 模型还能生成先验知识,提升模型性能并降低成本。新兴的规划方法包括:基于 Tr...……更多
大模型是否有推理能力?DeepMind数月前的论文让AI社区吵起来了
...数据上进行(自)监督训练,并大规模应用基于注意力的架构。在此过程中,研究者们开发出了具有令人印象深刻的认知能力的 LLM,如 OpenAI 的 GPT 系列、LLaMA 模型系列或谷歌 DeepMind 的 Chinchilla 和 Gemini。然而,目前还不清楚同...……更多
大模型成私人导游,一键规划Citywalk,港大MIT联合出品
现在,大模型可以做私人导游,为你规划Citywalk路线了——港大MIT等单位联合推出ITINERA,将LLM与空间优化相结合,实现个性化的开放域城市行程规划。举个栗子,用户输入“给我规划一条包含‘巨富长’、以静安寺为终点的cityw...……更多
开源社区分水岭:Meta大模型Llama 3发布,参数最高或达4000亿
...能力在内的新功能,是目前市场上最好的开源大模型。在架构层面,Llama3选择了标准的仅解码(decoder-only)式Transformer架构,采用包含128K token词汇表的分词器。Llama 3在Meta自制的两个24K GPU集群上进行预训练,使用了超过15T的公开...……更多
联想发布超级智能体矩阵,端侧AI开启规模化落地
...,突破传统顺序解码瓶颈,推理速度大幅提升;异构计算架构,动态分配CPU/GPU/专用AI芯片资源,降低内存占用;算子融合优化,提升能耗效率;以上这些技术,与大模型推理芯片相结合,实现深度耦合,达到“算力放大效应”...……更多
年度生成式AI大会上海站公布最新嘉宾,报名进入最后阶段
...责人朱国梁、声网生成式AI产品负责人毛玉杰、Alluxio首席架构师傅正佳将在主会场第二日的AI Infra峰会上带来主题演讲。 接下来介绍技术研讨会最新确认的嘉宾。联想集团首席研究员、联想研究院人工智能实验室研发总监师忠...……更多
Meta首款多模态Llama 3.2开源!1B羊驼宝宝,跑在手机上了
...觉任务的Llama模型,Meta为11B和90B型打造了一个全新的模型架构。在图像输入方面,训练了一组适配器权重,将预训练的图像编码器集成到预训练的大语言模型中。具体来说,该适配器:由一系列交叉注意力层组成,负责将图像编...……更多
小米澎湃OS体验沟通会召开:面向万物互联时代的新起点
...成PPT。AI大模型应用的广泛落地,需要领先、高效的技术架构作为支撑。小米澎湃OS的AI子系统支持将大模型部署至设备NPU,提升运行效率的同时,降低设备功耗。基于此,小米澎湃OS得以首次支持在手机端侧运行小米自研大模型...……更多
生成式AI在金融行业的应用及思考
...引发了广泛关注和热议。在这场由亚马逊云科技金融行业架构师团队负责人张呈刚先生主讲的演讲中,他全面深入地探讨了生成式人工智能在金融行业的应用现状、挑战和机遇,并分享了亚马逊云科技为企业提供的全方位支持和解...……更多
王兴兴、朱啸虎们说了些AI创业真心话
...如果追求商业化,就不要追求最前沿的技术只要Transformer架构解决不了幻觉问题,只要存在1%的幻觉,那么复杂的流程类的管理软件就不可能被AI取代掉。简单来说,低代码、无代码的软件,肯定会被AI替代掉,这个现象现在已经...……更多
只要一张图就能还原绘画过程,这篇论文比Paints-UNDO实现得更早
...前在寻找 2025 fall 博士入学机会。最近,lvmin 带来了最新模型 Paints-UNDO。这款 AI 生成工具可以根据图片还原整个绘画过程,整个 AIGC 社区都为之震撼。Paints-UNDO 的演示 demo。早在 1 个月前,NUS,SJTU,Tiamat 等机构联合已经发布……更多
...。Figure AI表示,之前的方法面临着一个根本性的权衡:VLM架构通用但不够快,而机器人的视觉运动策略快但不通用。Helix通过两个互补系统解决了这一问题,让两个系统经过端对端训练,可以进行通信。系统1(S1):快速反应视...……更多
本文转自:参考消息参考消息网6月12日报道 据美国趣味科学网站5月13日报道,麻省理工学院研究人员开发了一种新的方式,帮助人工智能(AI)系统在编码、战略规划和机器人科学三个领域执行复杂推理任务。聊天生成预训练转换...……更多
跨越算力鸿沟丨星凡科技2024AI算力集群产品发布会圆满成功
...并发,同时通过星凡自研软件进一步优化性能。 1+3产品架构支撑算力全场景运营产品内置开普云和星凡科技联合开发的“神机AIOS、X-Boost、星瀚LMOps”三重使能平台,帮助大模型开发者解决国产芯片性能低、适配难,开发成本高...……更多
致敬浪潮“她”力量丨成功秘诀?不过是把“我能行”,用代码写了千万遍
...模态关键技术时,薛娇将自己的主要精力投入在核心技术架构设计以及研发资源统筹上,通过每周固定时间召开例会的方式深入了解团队当前研发痛点,并给予专业指导意见,借助这种精细化、系统化的工作模式,薛娇带领团队...……更多
英伟达blackwell计算引擎制造商推出的ai模型
...达联合创始人兼CEO黄仁勋发表的主题演讲之前,因此许多架构及性能细节尚未明确披露。我们将针对搭载BlackwellGPU的系统带来后续报道,并对这款全新GPU的架构和经济性开展深入研究,将其与英伟达自家的前代产品,以及AMD、英...……更多
更多关于科技的资讯:
当城市核心区的物理空间增长几近饱和,未来的竞争力新高地何在?12月5日,一场发布会以别开生面的“数字气味”体验开场,为上城区加快建设中央创新区(CID)的战略发布
2025-12-07 07:21:00
日前,山西转型综改示范区入区企业山西恒真真空玻璃科技有限公司自主研发的新产品——“真空发热玻璃”上市。这一产品将高效真空玻璃技术与新型半导体制热技术深度融合
2025-12-07 07:32:00
生产设备共享给清河羊绒带来什么——河北特色产业集群共享智造故事(四)纱线在电脑横机上来回穿梭、电商平台的提示音此起彼伏……随着冬季来临
2025-12-06 08:04:00
厦门移动智慧康养产品亮相首届海峡两岸(厦门)银发博览会
市民现场体验移动随心屏(闺蜜机)的AI舌象问诊功能。厦门网讯 (文/厦门日报记者 许晓婷 王玉婷 通讯员 陈奕珣 图/厦门移动 提供)伸出舌头拍一拍
2025-12-06 08:26:00
厦门网讯 (厦门日报记者 林露虹)刷到一部微短剧,不知不觉被剧情吸引,回过神来看介绍,发现竟是AI参与制作的。类似经历
2025-12-06 08:26:00
从“手搓”到“智造” 厦门跑步机“跑”向全球
厦门网讯 (厦门日报记者 詹文 林健华)在位于同安工业集中区的生产车间里,一节一节钢板正传送上激光切割台,自动切割、打孔
2025-12-06 08:26:00
共建共享破局资源瓶颈:临沂联通与电信合作以5G RedCap创新实现业务与服务双突破
鲁网12月5日讯近日,临沂联通与临沂电信深度践行国家共建共享战略,成功完成全省首个基于电信800M频段的5G RedCap技术承载联通物联网专网业务的商用落地
2025-12-06 13:44:00
中国青年报客户端讯(中青报·中青网记者张均斌)近日,“中央引导地方”专项科技赋能文化方向立项课题——“面向文博场景的智能伴游导览系统研发及示范应用”启动会
2025-12-06 15:25:00
2025教室节能照明标杆盘点 四大品牌绿色护眼解决方案解析
在“双碳”目标引领下,校园节能改造成为教育领域绿色发展的重要方向。据住建部统计,商业建筑能耗中照明系统占比高达35%,学校作为人员密集
2025-12-06 16:09:00
海尔智慧家电亮相迪拜
11月26日至28日,中东地区极具影响力的家电电子展在迪拜世贸中心举办。展会中,海尔智家针对当地高温、多尘等特点,集中展示了洗衣机
2025-12-06 16:10:00
12月1日,豆包手机助手技术预览版正式发布,首发搭载于中兴Nubia工程样机。豆包手机助手是以豆包APP为基础,与手机厂商在操作系统层面合作开发的AI助手软件
2025-12-06 17:41:00
文化中国行|全场听觉无死角 吉林省音乐厅声学揭秘
历经修缮重生的丰乐剧场,以“吉林省音乐厅”之名即将绽放春城。这座历史建筑,从伪满时期影剧院到音乐剧场的跨越,背后藏着一套极致考究的声学设计方案
2025-12-06 18:41:00
伊贝格:让机床行业不再为“头”烦恼
“关键核心技术与高端装备对外依存度高”一直是制约制造业升级的瓶颈。五轴联动铣头作为五轴机床的核心功能部件,过去很长一段时间被欧洲部分知名厂商垄断
2025-12-06 22:07:00
山东重工潍柴集团2026年商务大会圆满召开
鲁网12月6日讯12月6日,以“乘势向上 聚力向新”为主题的山东重工潍柴集团2026年商务大会在潍坊举行。山东重工集团党委书记
2025-12-06 22:43:00
近日,兴业数金上线投产跨境人民币理财项目,建立基于手机银行APP的“跨境理财通”线上功能专区,助力本行成为第二家实现“跨境理财通”业务全线上办理的内地商业银行
2025-12-06 16:08:00