• 我的订阅
  • 科技

LiveMe x TiDB 简化技术架构 实现数据量单表 39 亿条

类别:科技 发布时间:2023-02-16 12:00:00 来源:中关村在线

2023-02-16 10:30:47 作者:宋均益

近些年,由于互联网的快速发展以及线上需求的爆发,直播在国内已经成为一个非常成熟的商业模式。在娱乐、教育、办公等场景中涌现出许多优秀的视频直播产品。随着国内市场竞争日益白热化,加之企业出海渐成趋势,越来越多的直播公司选择走出去,寻找新的海外直播市场,借鉴国内成熟的产品、运营以及商业模式,让全球的用户都用上中国人创造的产品,LiveMe 便是成功的出海直播产品之一。

LiveMe 是一个全球直播和社交平台,于 2016 年 4 月推出。LiveMe 的产品功能包括 H2H、多人聊天、虚拟形象直播、蹦迪房等,它使用户能够随时随地直播、并观看其他精彩的直播以及与世界各地的朋友进行视频聊天。目前 LiveMe 已在全球积累了超过 1 亿用户和超过 300 万的主播。它已成为美国最受欢迎的社交应用程序之一,并已在 200 多个国家和地区推出。

业务痛点

与其他行业出海一样,直播产品的出海也面临着许多全球化挑战。如各地的合规监管、本地化运营、持续创新、政治文化差异等,都为直播产品出海带来巨大挑战。而在出海的过程中,底层的技术能力帮助 LiveMe 在成本节约、用户增长、金融风控、提升研发效率等方面不断实现精细化运营与业务创新。

经过了多年的沉淀,LiveMe 在业务上已经形成了线上微服务主导,线下计算中心主导的技术架构。线上业务是通过 Go 语言开发的一套微服务架构,每个服务根据不同业务特性具有自己独立的存储。线下业务是由数据研发团队来维护,通过 sqoop 和 MySQL Binlog 同步等方式从数据库层面抓取数据到数据仓库,完成一系列业务相关的支持。

这套业务架构中线上业务主要面临着以下痛点:

第一,虽然完成了微服务分库的设计,每个服务都有自己独立的数据库,但是每个业务中又存在很多业务上的大表,都存在 MySQL 分表的现象。在典型的分表场景中,数据库表会按照用户的 UID 尾号经过 MD5 后分到 256 张表,但是日积月累后又需要再根据时间日期做一个垂直的分表,导致数据库表无法完成聚合查询,再加上跨时间段的分表需求,很多场景无法满足线上需求。

第二,对于分析型业务数据而言,需要保证数据的实时性,并保留数据细节。实时的数据分析,可以在业务上更快做出决策,例如在一些活动运营场景中,业务团队需要快速从各个数据维度来分组统计观察活动效果;在金融相关风控业务中,需要根据各个维度快速聚合来判断各项数据是否达到风控模型的阈值。如果使用离线计算的方式,数据的实时性根本无法得到保证;此外,经过离线计算或者实时计算过的数据,如果用户反馈数据有问题,需要查看数据的细节也很难实现。

第三,各种精细化运营需求,例如推荐、个性化运营等场景不断增加,对于数据的实时要求越来越高。因此,LiveMe 急需一种更简单,同时让线上线下业务做好平衡的方案。

此时,如果 LiveMe 继续选择大数据技术栈解决痛点就会面临以下挑战:1)大数据技术栈的架构非常复杂,中间件过多;2)需要额外的技术栈学习成本,比如如果使用数据同步,就需要 sqoop、scala、kafka 等中间件,会大幅增加整个业务的复杂性;3)希望线上业务以及架构非常简单,能够简化到普通开发人员只要能够 CRUD(增加(Create)、读取(Read)、更新(Update)和删除(Delete)) 数据库就可以上手开发。

为什么选择 TiDB ?

基于以上业务挑战,LiveMe 经过一系列技术选型后最终选择了 TiDB 数据库。 TiDB 的以下特性可以帮助 LiveMe 很好的应对挑战:

1)TiDB 的性能大于等于 MySQL ;

2)TiDB 的 HTAP 特性能够解决线上大表的问题,在后台或者一些实时分析场景中,其 OLAP 分析能力能够保证实时数据报表;

3)TiDB 引入的 MPP 架构分析能力,使得 OLAP 查询速度非常快,这也是 OLAP 数据库架构上的技术方向;

4)TiDB 团队有着完善和专业的技术支持,在过程中可以帮助 LiveMe 解决很多问题,在线上大规模使用后也没有后顾之忧。

如何利用 TiDB 实现实时聚合查询

鉴于 LiveMe 的微服务架构,如果将数据源全部替换,工程量大且不能一蹴而就,因此就需要一种兼容性的方案,在保证线上业务不受影响的同时也能使用 TiDB 的特性来解决 LiveMe 的业务痛点。因此,对于需要聚合查询的业务, LiveMe 通过消息队列广播的方式,在业务层订阅相关事件再补充业务侧需要的宽表信息写入 TiDB,基于 TiFlash 就可以做到实时的运营报表。业务开发人员只需要编写对应的 SQL 查询,就可以轻松完成需求。 没有了复杂的 ETL 过程,大大简化了开发流程。

对于业务数据, LiveMe 使用 AWS SQS 消息队列,相比 Kafka 的优势在于每条数据都是原子性的,每条数据都可以用来做幂等重试,来保证数据的最终一致性。目前,这套技术方案已经支撑了 LiveMe 的活动运营和金融风控等多个业务场景,满足了 LiveMe 对于线上大量数据实时聚合查询的要求。

LiveMe x TiDB 简化技术架构 实现数据量单表 39 亿条

如何使用 TiDB 简化技术架构

LiveMe 有一个类似朋友圈功能的场景,这个业务中存在两个技术难点:第一是对于数据的无限量增长存储如何实现扩容;第二是数据的冷热分离,这又涉及到数据成本的问题。

以用户发 Twitter 的场景举例:如果用户发了一条 Twitter,它会写入到自己所有的关注列表,比如有 100 个粉丝,就写入 100 条,如果有 10 万粉丝就需要写入 10 万条数据,这是一个典型的写扩散场景。这个场景带来的效果是数据爆炸半径非常大,如果某流量网红发一条 Twitter ,数据写入量会非常大,因此需要一个能够接近于无限扩容的存储机制才可以实现这个场景。

LiveMe x TiDB 简化技术架构 实现数据量单表 39 亿条

Twitter 是通过维护一个 redis-cluster 来解决 feed 分发的存储。LiveMe 的技术团队也想到使用这种技术架构,技术团队经过选型考虑使用 codis 集群来做存储,但通过对成本的考量,认为这个方案是不可行的,大量的 feed 冷数据存储在 codis 这样的内存密集型数据库中,成本非常高。因此,技术团队面临的挑战是如何用低成本的方式去实现一个写扩散的场景。

LiveMe x TiDB 简化技术架构 实现数据量单表 39 亿条

基于 TiDB 解决方案,LiveMe 技术团队在上述写扩散场景中,把扩散写入的部分替换成了 TiDB,使用一张数据库表来存储所有 feed 的写入关系,比如用户有 100 万粉丝,就在数据库里插入 100 万条数据。基于 TiDB 的分布式数据库特性,帮助 LiveMe 简单高效地解决了数据增长扩容问题。

基于此技术架构,技术团队简化了一个典型的 redis 缓存设计问题,热数据放在 redis 中,用 mget 来获取。冷数据放在 TiDB 中,用 select in 查询,这样做数据冷热区分就非常容易,甚至可以实现一个简单的布隆过滤器来了解哪些数据在热数据,哪些数据在冷数据里。以此减少无效数据的回源,更高效获取数据。

LiveMe 的朋友圈功能基于 TiDB 的分布式存储特性进行技术改造后, feed 表从 2021 年中旬上线至今已经达到数十亿数据写入,现在的数据量单表 39 亿条。因为这些数据是永久保留不会删除的,所以该数据也会一直增长。

未来规划

未来, LiveMe 将会继续尝试 TiDB 在更多业务中,一方面会做数据库管理开发;另一方面将对于强事务依赖交易型的业务尝试使用 TiDB,为直播电商场景做技术储备。 返回搜狐,查看更多

责任编辑:

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-02-16 13:45:10

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

...领域。诸多难题之下,业界开始了破解数据管理的探索。架构升级探索之一在于升级原有技术架构。以爱数为例,不久前,爱数升级AnyBackup Family 8,并对其涉及的核心技术
2023-02-21 13:00:00
夯实科技监管基础,证监会发布《上市公司行业统计分类与代码...
...场区块链通用基础设施通讯指南》《证券期货业信息技术架构管理指南》《证券期货业数据标准属性框架》《证券基金经营机构运维自动化能力成熟度规范》等8项金融行业标准,自公布之日起施行
2024-11-22 21:09:00
...实施、应用、治理于一体,基于云原生、DDD思想、微服务架构和敏捷高效的DevOps交付体系构建设计模型、业务模式及微服务开发框架,对微服务应用进行全生命周期管理,并为其提供基
2023-05-13 22:00:00
...层技术的基本概念及其优势;然后分析了不同层次在软件架构中的功能及其相互关系;接下来,研究了几种常见的分层模式及其实现方法,包括表示层、业务层和数据层的设计;最后,总结了分层技
2024-08-02 10:37:00
...器科技联合创始人兼CEO喻思成表示:多云、一体化是数据架构演进的必然方向,也是过去十几年我们通过总结服务过的客户经验,看到的技术进化方向。今天我们选择这个赛道是因为我们认同并
2023-06-16 12:00:00
OceanBase是如何从数据库赛道“杀”出来的?
...cle、EMC为代表的小型机、集中式数据库和高端存储的技术架构。今天我们先单独聊聊阿里在数据库方面是如何操作的?▉ 数据库为什么一定要去?去"IOE"的一个重要考虑是信息安全
2024-07-15 13:49:00
威海市商业银行率先实现省内城商行“一云多芯”架构部署
...,全力建设“一云多芯”金融云平台,兼容适配传统通用架构和信创架构,实现异构资源的统一管理和调度,成为山东省首家实现“一云多芯”架构部署的城商行。筑牢资源底座,共享技术能力。基
2023-09-08 10:47:00
金融行业如何突破数字化转型困境?
...多方面挑战。“目前银行业中小金融机构基于分布式、云架构的自主可控转型尚未全面展开,IT架构仍以传统集中式架构为主,整体架构的灵活性、自主可控能力仍显不足,整体技术创新能力有待
2023-12-05 11:28:00
...企业数据、业务连续性将难以得到保障。2、跨平台、跨架构的热迁移基于各种原因,现在许多的企业已经开始采用多云/混合云的业务架构,受限于虚拟机集群内的热迁移技术无法实现该场景下企
2023-02-13 11:00:00
更多关于科技的资讯:
上海乐高乐园票价公布:成人最低价319元!
快科技4月2日消息,上海乐高乐园今天正式公布票价,上海乐高乐园度假区采用六级票价体系,该票价体系基于季节性客流预测,价格从255元到599元不等
2025-04-02 10:40:00
真我GT7官宣本月发布!首批搭载天机9400+
快科技4月2日消息,真我GT7今天正式官宣,将在本月发布。官方还强调“没有3nm,怎敢称性能旗舰”,而真我GT7将首批搭载联发科天机9400+旗舰芯片
2025-04-02 10:40:00
看!宇宙中最惊艳的“光之指环” 爱因斯坦做梦都想见到
快科技4月2日消息,爱因斯坦广义相对论预测的引力透镜效应,相信大家都有所耳闻,而在引力效应的实际体现中,最神秘、最美丽的形态
2025-04-02 11:10:00
欧洲最大廉价航拟购买C919:只要价格比空客便宜20% 就下单
快科技4月2日消息,据媒体报道,近日,欧洲廉航瑞安航空CEO 奥利里表示:“C919飞机只要价格够给力,比空客便宜10%-20%
2025-04-02 11:10:00
一加13T确认6开头电池!唯一一款6000mAh+小屏旗舰
快科技4月2日消息,一加13T日前已经正式官宣,将在本月正式发布,是一款小屏旗舰。今天李杰直接官方爆料:一加13T冰川电池容量6开头
2025-04-02 11:10:00
性价比更高!RTX 5080移动版实测:比RTX 5090移动版低15%
快科技4月2日消息,根据Notebookcheck的最新测试结果,RTX 5080移动版的性能,比RTX 5090移动版低约10%到15%
2025-04-02 11:10:00
全球首例!武汉团队给大脑画出精准“3D地图”
快科技4月2日消息,据报道,华中科技大学同济医学院附属协和医院叶哲伟教授、周弘博士团队与武汉衷华脑机融合科技发展有限公司联合发布了全球首例微米级脑机接口多模态三维图谱
2025-04-02 11:10:00
内蒙老牌科尔沁:风干牛肉4两20元抄底
天猫科尔沁食品旗舰店,科尔沁风干牛肉200g日常售价67元,今日下单3件可用141元冲量券,3袋1.2斤实付60元包邮
2025-04-02 11:10:00
50万内品价比最高SUV!零跑C10交付突破10万大关!3月交付超1.2万台
快科技4月2日消息,零跑汽车宣布零跑C10累计交付突破10万台,3月交付超1.2万台。此外,官方宣布即刻下定可享至高立省51680元
2025-04-02 11:10:00
京东又涨工资了:达达员工今年升至19薪 明年20薪 还送股票
快科技4月2日消息,京东又宣布涨工资了!今天,京东黑板报宣布,达达员工薪酬将在今年升级至19薪,明年升级至20薪。此外
2025-04-02 11:10:00
常思思助阵!生活在左广州塔水上大秀开启非遗时尚新纪元
Deepseek眼里的非遗广州是怎样的?木棉花映红天际时,广绣在绸缎上绽放出灵动的花鸟,醒狮的金毛在阳光下闪烁着威严的光芒
2025-04-02 11:11:00
对话元戎启行周光:“车位到车位”的智驾,依靠的是高精地图,是“缝合怪物”
出品 | 搜狐科技作者 | 梁昌均编辑 | 杨锦“大模型经历了从专家系统到通才系统,再到真正强专家系统的阶段,智驾、机器人也会经历同样阶段
2025-04-02 11:29:00
Walmart线上店铺销量前十品类有哪些
Walmart作为全球最大的零售商之一,其线上店铺同样在全球电商市场中占有重要地位。根据最新的市场数据和趋势分析,带大家了解一下Walmart线上店铺销量前十的品类
2025-04-02 11:33:00
《易达威学术微课堂》首期录制圆满启动!对话五大领域学者
2025年3月——由易达威学术出版社打造的公益栏目《易达威学术微课堂》正式进入录制阶段,首期特邀来自中山大学、陕西科技大学
2025-04-02 11:40:00
强脑科技携非侵入式脑机接口技术亮相交个朋友直播间
4月1日晚,杭州“六小龙”之一的强脑科技,携其领先的非侵入式脑机接口技术走进交个朋友直播间,与罗永浩探讨脑机科技的实际应用
2025-04-02 11:46:00