• 我的订阅
  • 头条热搜
llava-1.6与gpt-4vmp面硬刚的性能,一起来看看
...率基础上,并通过改进视觉指令数据集和SGLang,提升了“推理、OCR等方面的性能”,意味着人类向AGI(通用人工智能)探索的道路上又迈进了一步。LLaVA-1.6的研发团队成员Haotian Liu在X平台发文原文 二、更适合中国人体质的GPT-4V...……更多
算力浪费超50%!百度AI计算部负责人拆解大模型时代的算力成本
...利用率目前,主流模型训练存在以下4个劣势。首先在线推理或计算任务当中,系统在峰值负载时的性能是平均负载时的3倍。这意味着系统在设计时预留了较多的算力以应对峰值。但AI集群的波峰和波谷其实较为明显,这也造成...……更多
国内首个以国产全功能GPU为底座的大规模算力集群正式落地
...能GPU的多元计算优势,可以满足不断增长的大模型训练和推理需求。据介绍,摩尔线程KUAE智算中心解决方案以全功能GPU为底座,旨在以一体化交付的方式解决大规模GPU算力的建设和运营管理问题。该方案可实现开箱即用,大大...……更多
背水一战狙击GPT-4,谷歌最强大模型Gemini终发布,听说读写全能选手 | 焦点分析
...大模型——跨越文本、 图像、 视频、 音频和代码的无缝推理。”谷歌官网上,这是介绍Gemini的第一句话。这是Gemini 1.0最重要的特点:一位更强大的“全科选手”。如果和OpenAI做对比,OpenAI的GPT-3.5一开始是纯文字的大语言模型...……更多
...终端CPU芯片,即使是发布多年的老款机器也能流畅运行,推理成本仅为国际同行的百分之一。据悉,面壁智能核心技术团队源于清华NLP实验室,是在国内较早开展大模型研究的团队之一,是2020年12月“悟道”大模型首发的主力团...……更多
涂鸦智能亮相CES 2025,以AI技术开启智慧未来新入口
...在距离和速率中取得了一种很好的平衡,因此,在高数据吞吐量、高节点数的应用场景中,如智能电表、智慧路灯以及智慧城市等领域,Wi-SUN往往会成为首选。在英国伦敦,涂鸦成功赋能客户在街道照明、停车场等场景中部署了...……更多
中国移动数字两亚(昆明)智算中心落成 将为多领域赋能
...算中心采用业界领先的算力硬件和高功耗液冷技术,数据吞吐量达TB/s级。依托数字化全光底座的全光OXC互联架构,打造覆盖昆明、滇中城市群、南亚东南亚的超低时延圈运力网络,为大模型带来极致通信效率和最短训练时间,...……更多
“国家队”AI大模型正式发布,AI人工智能ETF(512930)持续获资金积极布局
...高,市值达到2.62万亿美元。华泰证券表示,云厂商自用推理需求值得高度关注。若大模型实现在传统业务场景的算法替代,云厂商自用的AI推理需求将加速释放。云厂对AI算力自我消化能力或超市场预期。华泰证券认为,AI有望...……更多
5年投资超1000亿,北京公布一系列AI重磅成果,北大清华百度蚂蚁微软大佬齐谈AI未来|钛媒体AGI
...计算具备高算力低功耗的特性,能够加速AI大模型训练与推理。戴琼海提到,清华大学提出光电混合全模拟智能计算架构,研制ACCEL芯片,突破光电模数转换瓶颈。相比A100,ACCEL系统级算力提升3个数量级,能效提升6个数量级(百...……更多
千行百业加速拥抱大模型(AI前沿观察)
...库建设。”建设智算中心增加算力供给大模型进行训练和推理时,对算力的需求量巨大。算力是大模型的底座。算力通常分为通用算力、智能算力和超算算力,大模型需要的是智能算力。如何破解智能算力紧缺问题,成为大模型...……更多
大模型到了该「验收」的时候
...万亿级分层异构MoE结构,不仅模型效果大幅提升,其训练推理效率也提升了超过100%,并带来了50%的推理部署成本下降。而Turbo版本的混元大模型,定价仅为前一代Pro版本的一半。性能更强、价格更低,这是大模型是深入落地场景...……更多
新疆机场集团:安全运行 全局掌控(附图片)
...业也迎来了快速增长。今年第一季度,新疆机场集团旅客吞吐量突破1000万人次,货邮吞吐量达5.05万吨,保障航班起降10.35万架次。持续增长的旅客吞吐量和航班量在给区域经济发展注入活力的同时,也给机场安全管理带来了不...……更多
神州数码生成式AI战略升级,聚焦算力和AI应用工程平台研发|最前线
...于训练的高速成长阶段,基于我们对市场的理解,训练和推理的出货量大概在1:5 到1:6。随着未来人工智能在行业的深入应用,推理服务器会得到大量的部署。”AI应用工程平台也是神州数码接下来发力的重点方向。当前,企...……更多
腾讯混元文生图大模型升级并对外开源
...源,目前已经在HuggingFace及Github上发布,包含模型权重、推理代码、模型算法等完整模型,可供企业与个人开发者免费商用。▲混元文生图效果▲混元长文生图效果升级后的混元文生图大模型采用了与Sora一致的DiT架构,腾讯表示...……更多
小扎新开源的Llama3.1,要带着套壳大模型追平GPT-4o?
...,研究了一番,发现这篇论文涵盖了预处理、生成训练、推理训练、退火迭代、多模态评估等流程,但核心其实说的就是两件事,一是大量的训练,二是训练里做了些优化。首先咱就说训练这方面,他们就下了大功夫,做了算力...……更多
4000亿参数,国产大模型硬刚Llama 3?|钛媒体AGI
...上一代,天工3.0的模型技术知识能力提升超过20%,数学、推理、代码、文创能力提升超过30%,多模态性能超越GPT-4V。同样在4月17日,昆仑万维还宣布,中国首个音乐SOTA(领域最佳水准)模型“天工SkyMusic”音乐大模型也正式开启...……更多
新一批南京大模型通过国家备案
...火X1全新升级,作为业界唯一基于全国产算力训练的深度推理大模型,升级后的星火X1,在数学、代码、逻辑推理、文本生成、语言理解、知识问答等通用任务上效果提升,在模型参数比业界同类模型小一个数量级的情况下,整...……更多
智谱开源GLM-PC 基座模型CogAgent-9B,让 AI 智能体“看懂”屏幕
...开源的第一版 CogAgent 模型,CogAgent-9B-20241220 在 GUI 感知、推理预测准确性、动作空间完善性、任务普适性和泛化性等方面均实现了显著提升,并支持中英文双语的屏幕截图和语言交互。CogAgent 的输入仅包含三部分:用户的自然语...……更多
赛道正在变得拥挤 腾讯混元大模型杀入文生视频 让用户 “用起来”是关键
...模型已在 Hugging Face平台及Github上发布,包含模型权重、推理代码、模型算法等完整模型,可供企业与个人开发者免费使用和开发生态插件。基于腾讯混元的开源模型,开发者及企业无需从头训练,即可直接用于推理,并可基于...……更多
英伟达最新技术分享:手把手教你用Llama 3.1合成数据改进模型!附代码
...05B开源巨兽Llama 3.1最近正式上线,既可用于批处理和在线推理,也可以作为基座模型,进行特定领域的专门预训练或微调。尤其是考虑到Llama 3.1有如此大的参数规模,加上丰富的15.6T token训练数据,非常适合用于数据生成。这篇...……更多
...数据集大小、模型类型、模型参数、模型占用内存、模型推理所需算力等关键信息,并分享实践中AI对移动通信系统性能的提升,供产学研用各界参考研究。 ……更多
响应速度碾压英伟达,AI芯片领域又出“王炸” 创始人豪言将把计算成本“降至零”
...主流的GPU(图形处理单元)路线。LPU架构是Groq公司专为AI推理所设计的,线路极其精简,也没有GPU需要的高性能且昂贵的内存结构。另外,通过LPU也在能效上更胜一筹,让芯片更“饱和”地进行计算,提高了处理效率。正因如此...……更多
苹果推出DeepPCR 神经网络训练和推理速度提升7倍
...该算法通过并行处理常规顺序操作,可以加速神经网络的推理和训练过程。尽管神经网络已能处理文本或图片合成、分割和分类等复杂任务,但由于计算需求过大,神经网络训练和反馈结果的时间可能需要数天或者数周。目前广...……更多
...DeepSeek-R1模型完成全场景纳管适配,全面增强工业知识库推理能力,成为行业内公认的精细领域的“专家”和通用领域的“杂家”。 ……更多
重要交通、水利枢纽工程加速推进 点滴民生实事汇聚美好生活
...投入运营后,这里每年的飞机起降可达38万架次,年旅客吞吐量达4500万人次。大藤峡水利枢纽首次达到61米正常蓄水位1月18日上午10时,国家172项重大水利工程之一——广西大藤峡水利枢纽工程首次蓄水达到61米正常蓄水位,标志...……更多
搞医学影像,为什么都青睐于CPU?
...ACS/RIS产品中,就采用了基于CPU的方案运行三维可视化、AI推理等工作负载。在三维可视化加持下,融合影像分析等技术,让医务人员通过旋转、缩放、分割、图像增强等操作,从多角度清晰了解到医学影像中各结构之间的空间位...……更多
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...型开发的关键指导之一便是如何让机器像人类一样思考和推理。诸如注意力机制和思维链(Chain-of-Thought)等技术正是由此产生的灵感。然而,可能很多人并没有意识到,很多对人类来说很简单的认知任务也往往伴随着非常复杂...……更多
首家!联想moto手机正式接入DeepSeek-R1满血版
...DeepSeek-R1大模型后,手机的AI应用在自然语言处理、数学推理及多模态处理等方面将获得显著提升。随着DeepSeek的爆火,各大手机厂商纷纷加快将其接入自家产品的步伐,华为于2月5日宣布,基于原生鸿蒙操作系统的小艺助手App已...……更多
苹果公司公布“mm1”多模态大模型
...0亿、70亿、300亿三种参数规模,拥有图像识别和自然语言推理能力。IT之家注意到,苹果研究团队相关论文主要是利用MM1模型做实验,通过控制各种变量,找出影响模型效果的关键因素。研究表明,图像分辨率和图像标记数量对...……更多
科技界的工匠精神如何定义?
...车的常态化混行,并且安全完成了超过40.5万TEU(集装箱吞吐量的一种计量单位,指1个20英尺标准集装箱或等量的装载能力)实船作业。这也成了在疫情下首批出海的中国智能项目,并助力林查班港成为全球首个无人驾驶与人工...……更多
更多关于科技的资讯:
厦门网讯 (厦门日报记者 林露虹)来自厦门的光通信电芯片“单项冠军”登陆科创板。昨日,厦门优迅芯片股份有限公司在上交所科创板上市
2025-12-20 08:51:00
摘要:随着企业业务复杂度的提升与项目制运营的普及,多项目并行管理成为企业提升效率与竞争力的重要模式。然而,项目间的资源冲突
2025-12-20 05:18:00
摘要:在健康中国战略引领下,推进特殊人群运动康复指导课程教学改革已成为新时代体育教育与健康服务体系建设的重要任务。本文探讨如何以数智技术深度赋能传统教学模式
2025-12-20 05:18:00
蔡云霞摘要:企业人力资源管理创新发展是激活人力价值、适配组织转型的核心举措。本文聚焦传统管理中的理念滞后、流程固化等痛点
2025-12-20 05:18:00
12月18日,太原北方重工集团生产车间内机器轰鸣,电光闪烁。国内首台φ820mm特大型无缝钢管矫直机已完成安装,正式交付用户并进入试车阶段
2025-12-20 06:54:00
一家科技研发企业 为什么要做城市安全科普宣传?
今年秋季开学季,杭州叙简科技股份有限公司董事长金国庆在瓶窑中学主讲“开学第一课”,当他为近600名学生讲完“AI赋能城市安全”的讲座后
2025-12-20 07:22:00
昨日,由陕西省商务厅指导、西安市商务局主办的“美美共融”2025西安城市消费品牌合作周在西安浐灞凯悦酒店举行。中国连锁经营协会
2025-12-20 07:49:00
定了!明年4月28日,杭州恒隆广场商场亮相
12月18日,恒隆集团及恒隆地产对外发布消息,集团现任行政总裁兼执行董事卢韦柏,将于2026年8月31日前荣休。同时,在这份对外声明里
2025-12-20 07:52:00
摘要:人工智能技术正广泛应用于企业财务管理的各个方面,目前对于该领域的探讨多集中于提升效率、降低成本与优化决策,而对技术渗透所产生的深层风险并未引起企业重视
2025-12-20 05:18:00
一缕发丝织就“头上帝国”丨链接世界的河南力量
编者按:从中原大地到全球市场,一批来自河南的新服务新供给品牌企业正加速“出海”,以优质产品为全球消费者提供更多选择。12月12日起
2025-12-19 14:36:00
在国家持续推进税收现代化、优化营商环境的大背景下,企业合规经营与诚信纳税已成为衡量其可持续发展能力的重要标尺。新疆瑞源乳业有限公司作为巴州地区乳制品行业的领军企业
2025-12-19 14:47:00
浙江新昌:一家县属国企的低空经济腾飞记
在2025年公路交通行业数据要素应用创新大赛中,“基于异构低空飞行器协同的智慧巡检与低空运营解决方案”项目,荣获全国三等奖
2025-12-19 14:47:00
在数字化转型与精益管理深度融合的当下,电子商城作为企业物资采购、资源配置的核心载体,其运营效率与服务质量直接影响企业整体运营成本与发展活力
2025-12-19 14:47:00
浙江飞流科技创新模式成就“飞”速度
12月1日,河南省辉县市,河南共城智通低空经济有限公司正式开业,今年8月,该公司以“品牌加盟”形式获得浙江飞流科技有限公司(以下简称“飞流科技”)在河南省新乡市的品牌授权
2025-12-19 14:47:00
全省唯一入选,就在常州高新区新桥街道!
近日,工信部发布《再制造机电产品典型应用案例》公示名单,常州市新北区新桥街道企业常州越新传动系统有限公司(以下简称“越新传动”)的“再制造风电增速齿轮箱及其应用——以华奥新能源
2025-12-19 14:48:00