• 我的订阅
  • 头条热搜
llava-1.6与gpt-4vmp面硬刚的性能,一起来看看
...率基础上,并通过改进视觉指令数据集和SGLang,提升了“推理、OCR等方面的性能”,意味着人类向AGI(通用人工智能)探索的道路上又迈进了一步。LLaVA-1.6的研发团队成员Haotian Liu在X平台发文原文 二、更适合中国人体质的GPT-4V...……更多
算力浪费超50%!百度AI计算部负责人拆解大模型时代的算力成本
...利用率目前,主流模型训练存在以下4个劣势。首先在线推理或计算任务当中,系统在峰值负载时的性能是平均负载时的3倍。这意味着系统在设计时预留了较多的算力以应对峰值。但AI集群的波峰和波谷其实较为明显,这也造成...……更多
国内首个以国产全功能GPU为底座的大规模算力集群正式落地
...能GPU的多元计算优势,可以满足不断增长的大模型训练和推理需求。据介绍,摩尔线程KUAE智算中心解决方案以全功能GPU为底座,旨在以一体化交付的方式解决大规模GPU算力的建设和运营管理问题。该方案可实现开箱即用,大大...……更多
背水一战狙击GPT-4,谷歌最强大模型Gemini终发布,听说读写全能选手 | 焦点分析
...大模型——跨越文本、 图像、 视频、 音频和代码的无缝推理。”谷歌官网上,这是介绍Gemini的第一句话。这是Gemini 1.0最重要的特点:一位更强大的“全科选手”。如果和OpenAI做对比,OpenAI的GPT-3.5一开始是纯文字的大语言模型...……更多
...终端CPU芯片,即使是发布多年的老款机器也能流畅运行,推理成本仅为国际同行的百分之一。据悉,面壁智能核心技术团队源于清华NLP实验室,是在国内较早开展大模型研究的团队之一,是2020年12月“悟道”大模型首发的主力团...……更多
涂鸦智能亮相CES 2025,以AI技术开启智慧未来新入口
...在距离和速率中取得了一种很好的平衡,因此,在高数据吞吐量、高节点数的应用场景中,如智能电表、智慧路灯以及智慧城市等领域,Wi-SUN往往会成为首选。在英国伦敦,涂鸦成功赋能客户在街道照明、停车场等场景中部署了...……更多
中国移动数字两亚(昆明)智算中心落成 将为多领域赋能
...算中心采用业界领先的算力硬件和高功耗液冷技术,数据吞吐量达TB/s级。依托数字化全光底座的全光OXC互联架构,打造覆盖昆明、滇中城市群、南亚东南亚的超低时延圈运力网络,为大模型带来极致通信效率和最短训练时间,...……更多
“国家队”AI大模型正式发布,AI人工智能ETF(512930)持续获资金积极布局
...高,市值达到2.62万亿美元。华泰证券表示,云厂商自用推理需求值得高度关注。若大模型实现在传统业务场景的算法替代,云厂商自用的AI推理需求将加速释放。云厂对AI算力自我消化能力或超市场预期。华泰证券认为,AI有望...……更多
5年投资超1000亿,北京公布一系列AI重磅成果,北大清华百度蚂蚁微软大佬齐谈AI未来|钛媒体AGI
...计算具备高算力低功耗的特性,能够加速AI大模型训练与推理。戴琼海提到,清华大学提出光电混合全模拟智能计算架构,研制ACCEL芯片,突破光电模数转换瓶颈。相比A100,ACCEL系统级算力提升3个数量级,能效提升6个数量级(百...……更多
千行百业加速拥抱大模型(AI前沿观察)
...库建设。”建设智算中心增加算力供给大模型进行训练和推理时,对算力的需求量巨大。算力是大模型的底座。算力通常分为通用算力、智能算力和超算算力,大模型需要的是智能算力。如何破解智能算力紧缺问题,成为大模型...……更多
大模型到了该「验收」的时候
...万亿级分层异构MoE结构,不仅模型效果大幅提升,其训练推理效率也提升了超过100%,并带来了50%的推理部署成本下降。而Turbo版本的混元大模型,定价仅为前一代Pro版本的一半。性能更强、价格更低,这是大模型是深入落地场景...……更多
新疆机场集团:安全运行 全局掌控(附图片)
...业也迎来了快速增长。今年第一季度,新疆机场集团旅客吞吐量突破1000万人次,货邮吞吐量达5.05万吨,保障航班起降10.35万架次。持续增长的旅客吞吐量和航班量在给区域经济发展注入活力的同时,也给机场安全管理带来了不...……更多
神州数码生成式AI战略升级,聚焦算力和AI应用工程平台研发|最前线
...于训练的高速成长阶段,基于我们对市场的理解,训练和推理的出货量大概在1:5 到1:6。随着未来人工智能在行业的深入应用,推理服务器会得到大量的部署。”AI应用工程平台也是神州数码接下来发力的重点方向。当前,企...……更多
腾讯混元文生图大模型升级并对外开源
...源,目前已经在HuggingFace及Github上发布,包含模型权重、推理代码、模型算法等完整模型,可供企业与个人开发者免费商用。▲混元文生图效果▲混元长文生图效果升级后的混元文生图大模型采用了与Sora一致的DiT架构,腾讯表示...……更多
小扎新开源的Llama3.1,要带着套壳大模型追平GPT-4o?
...,研究了一番,发现这篇论文涵盖了预处理、生成训练、推理训练、退火迭代、多模态评估等流程,但核心其实说的就是两件事,一是大量的训练,二是训练里做了些优化。首先咱就说训练这方面,他们就下了大功夫,做了算力...……更多
4000亿参数,国产大模型硬刚Llama 3?|钛媒体AGI
...上一代,天工3.0的模型技术知识能力提升超过20%,数学、推理、代码、文创能力提升超过30%,多模态性能超越GPT-4V。同样在4月17日,昆仑万维还宣布,中国首个音乐SOTA(领域最佳水准)模型“天工SkyMusic”音乐大模型也正式开启...……更多
新一批南京大模型通过国家备案
...火X1全新升级,作为业界唯一基于全国产算力训练的深度推理大模型,升级后的星火X1,在数学、代码、逻辑推理、文本生成、语言理解、知识问答等通用任务上效果提升,在模型参数比业界同类模型小一个数量级的情况下,整...……更多
智谱开源GLM-PC 基座模型CogAgent-9B,让 AI 智能体“看懂”屏幕
...开源的第一版 CogAgent 模型,CogAgent-9B-20241220 在 GUI 感知、推理预测准确性、动作空间完善性、任务普适性和泛化性等方面均实现了显著提升,并支持中英文双语的屏幕截图和语言交互。CogAgent 的输入仅包含三部分:用户的自然语...……更多
赛道正在变得拥挤 腾讯混元大模型杀入文生视频 让用户 “用起来”是关键
...模型已在 Hugging Face平台及Github上发布,包含模型权重、推理代码、模型算法等完整模型,可供企业与个人开发者免费使用和开发生态插件。基于腾讯混元的开源模型,开发者及企业无需从头训练,即可直接用于推理,并可基于...……更多
英伟达最新技术分享:手把手教你用Llama 3.1合成数据改进模型!附代码
...05B开源巨兽Llama 3.1最近正式上线,既可用于批处理和在线推理,也可以作为基座模型,进行特定领域的专门预训练或微调。尤其是考虑到Llama 3.1有如此大的参数规模,加上丰富的15.6T token训练数据,非常适合用于数据生成。这篇...……更多
...数据集大小、模型类型、模型参数、模型占用内存、模型推理所需算力等关键信息,并分享实践中AI对移动通信系统性能的提升,供产学研用各界参考研究。 ……更多
响应速度碾压英伟达,AI芯片领域又出“王炸” 创始人豪言将把计算成本“降至零”
...主流的GPU(图形处理单元)路线。LPU架构是Groq公司专为AI推理所设计的,线路极其精简,也没有GPU需要的高性能且昂贵的内存结构。另外,通过LPU也在能效上更胜一筹,让芯片更“饱和”地进行计算,提高了处理效率。正因如此...……更多
苹果推出DeepPCR 神经网络训练和推理速度提升7倍
...该算法通过并行处理常规顺序操作,可以加速神经网络的推理和训练过程。尽管神经网络已能处理文本或图片合成、分割和分类等复杂任务,但由于计算需求过大,神经网络训练和反馈结果的时间可能需要数天或者数周。目前广...……更多
...DeepSeek-R1模型完成全场景纳管适配,全面增强工业知识库推理能力,成为行业内公认的精细领域的“专家”和通用领域的“杂家”。 ……更多
重要交通、水利枢纽工程加速推进 点滴民生实事汇聚美好生活
...投入运营后,这里每年的飞机起降可达38万架次,年旅客吞吐量达4500万人次。大藤峡水利枢纽首次达到61米正常蓄水位1月18日上午10时,国家172项重大水利工程之一——广西大藤峡水利枢纽工程首次蓄水达到61米正常蓄水位,标志...……更多
搞医学影像,为什么都青睐于CPU?
...ACS/RIS产品中,就采用了基于CPU的方案运行三维可视化、AI推理等工作负载。在三维可视化加持下,融合影像分析等技术,让医务人员通过旋转、缩放、分割、图像增强等操作,从多角度清晰了解到医学影像中各结构之间的空间位...……更多
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...型开发的关键指导之一便是如何让机器像人类一样思考和推理。诸如注意力机制和思维链(Chain-of-Thought)等技术正是由此产生的灵感。然而,可能很多人并没有意识到,很多对人类来说很简单的认知任务也往往伴随着非常复杂...……更多
首家!联想moto手机正式接入DeepSeek-R1满血版
...DeepSeek-R1大模型后,手机的AI应用在自然语言处理、数学推理及多模态处理等方面将获得显著提升。随着DeepSeek的爆火,各大手机厂商纷纷加快将其接入自家产品的步伐,华为于2月5日宣布,基于原生鸿蒙操作系统的小艺助手App已...……更多
苹果公司公布“mm1”多模态大模型
...0亿、70亿、300亿三种参数规模,拥有图像识别和自然语言推理能力。IT之家注意到,苹果研究团队相关论文主要是利用MM1模型做实验,通过控制各种变量,找出影响模型效果的关键因素。研究表明,图像分辨率和图像标记数量对...……更多
科技界的工匠精神如何定义?
...车的常态化混行,并且安全完成了超过40.5万TEU(集装箱吞吐量的一种计量单位,指1个20英尺标准集装箱或等量的装载能力)实船作业。这也成了在疫情下首批出海的中国智能项目,并助力林查班港成为全球首个无人驾驶与人工...……更多
更多关于科技的资讯:
20日,国家人工智能应用中试基地(医疗)·浙江正式开园并发布系列重大成果。其中,浙江省推出的全国首个数实融合的“安诊儿”医疗智能体升级至3
2025-12-21 07:20:00
河北日报讯(见习记者康晓博)12月19日,中国气象局在雄安新区发布气象人工智能科学模型“风源”(以下简称“风源”)。该模型将通过提供开源开放科创平台底座
2025-12-20 08:21:00
2025年,港交所成为中国机器人企业的上市“热土”。据不完全统计,年初至今,超30家机器人相关企业向港交所递交申请表,业务范围覆盖核心零部件
2025-12-20 08:23:00
鲁网12月19日讯为加快数字人民币业务拓展,提升数字钱包渗透率,抢占支付市场与同业市场,工商银行泰安分行精心组织、强力推进数字人民币单位钱包拓展工作
2025-12-20 09:07:00
中国科大提出视觉与波动特征融合的异常检测框架
大皖新闻讯 城市地面下的空洞、裂缝和其他隐蔽灾害如若未被及时发现,会存在一定的安全隐患。12月20日,大皖新闻记者从中国科学技术大学获悉
2025-12-20 11:05:00
12月15日,工信部正式公布我国首批L3级有条件自动驾驶车型准入许可,两款分别面向城市拥堵场景和高速公路场景的车型将在北京
2025-12-20 12:13:00
鲁网12月20日讯为进一步提高服务水平,提升业务竞争力,莱芜农商银行高新区公司业务营销中心优化办贷流程,坚持“我们多跑趟
2025-12-20 15:11:00
这支年轻团队在合肥逐梦星辰 致力打造国内首款电循环液体运载火箭
大皖新闻讯 几天前,关于合肥要造火箭的消息引发外界广泛关注,背后则是合肥星火空间科技有限公司(以下简称星火空间)落户合肥新站高新区
2025-12-20 15:13:00
莱芜农商银行钢城区公司业务营销中心:提升厅堂质效 强化精准赋能
鲁网12月20日讯为进一步深化“以客户为中心”的服务理念,提升金融产品渗透率与客户满意度,近日,莱芜农商银行钢城区公司业务营销中心精心策划并开展了一场主题为“金融惠民进厅堂
2025-12-20 15:13:00
鲁网12月20日讯为强化基础营销工作,深入推进“做小做散”战略,莱芜农商银行公司金融部全面开展“千企万户大营销”基础工作专项活动
2025-12-20 15:13:00
鲁网12月20日讯小微企业是区域经济发展的“毛细血管”,是稳就业、保民生的重要支撑。作为扎根本土的金融机构,莱芜农商银行营业部始终坚持以优质信贷服务支持辖内小微企业发展
2025-12-20 15:14:00
日前,晋塔塔式起重机远程智能辅助驾驶系统正式在太原“锦绣汾东”落地应用,这是太原首次投入使用的塔式起重机智能辅助驾驶系统
2025-12-20 17:48:00
“众星・长白岐黄” 中医药大模型正式发布
由吉林省委命题,长春中医药大学校长冷向阳教授牵头制定并实施《落实“AI+中医”具体行动方案》,吉林工商学院副院长赵佳教授领衔
2025-12-20 19:52:00
厦门网讯 (厦门日报记者 林露虹)来自厦门的光通信电芯片“单项冠军”登陆科创板。昨日,厦门优迅芯片股份有限公司在上交所科创板上市
2025-12-20 08:51:00
摘要:随着企业业务复杂度的提升与项目制运营的普及,多项目并行管理成为企业提升效率与竞争力的重要模式。然而,项目间的资源冲突
2025-12-20 05:18:00