全员内卷时代,人们的知识学习需求也日益增长,而传统的知识获取方式已经不能完全满足需求,大量知识付费类 App 也随之涌现,为用户提供了一个更加便捷、高效的学习方式。
然而,知识付费行业同时也兼具快速变化和不确定性较高的特点,用户对于内容和服务的需求会随着时代变迁和趋势变化而不断调整。因此,传统的线性式、预测式的运营模式逐渐无法适应行业的发展需要,亟需引入敏捷运营模式来适应变化,灵活应对这些“不确定”。
与传统运营模式相比,敏捷运营更加注重数据驱动、用户体验、快速迭代和灵活决策,能够更快速地获取并响应用户反馈、调整运营策略和优化产品功能,从而提高用户满意度和盈利能力。除此之外,还能有效激发团队创新和激情,提高团队凝聚力和执行力,从而带来长期的发展优势。这些,都是眼下诸多知识付费类 App 希望真正实现突破的问题。下面我们就跟随头部知识付费 App ——得到的真实案例,来了解其是如何在保障内容质量和新功能稳步迭代的服务竞争力前提下,一步步提升人效,促进敏捷运营,激发团队潜能,集中资源创造业务增长点的。
一、创新与迭代的另一面:繁杂的业务系统,沉重的后端压力
在不断推陈出新,开创新的内容板块与功能模式的过程中,该知识付费类 App 的业务系统的数量也在不断攀升,逐渐形成维护困难的意大利面架构,数据同步的一致性和实时性都在面临挑战:
① 跨系统同步难
面对现存的大量不同的系统,尤其是其中一些彼此强关联的组合,或是分存在不同数据库中的某项业务数据,例如分散存放于不同系统中的财务数据,一部分在 MongoDB 中,一部分在 MySQL 中,需要依赖异构数据同步能力来实现数据的跨系统同步,在同步过程中还会需要进行建模与计算,在这类场景下,数据的一致性要求当属重中之重。但历史惯用的跨系统同步解决方案为数据库双写,在数据一致性及数据质量方面,难以提供稳定保障。
② 后端维护压力大
随着后端团队需要维护的服务不断增加,无论是人员精简还是人员更替,都会带来新的问题,前者导致人均压力激增,难度更加突出;后者则易由于新人对历史代码缺乏理解,以及代码习惯的差异,导致维护复杂度再升级。因此,急需通过好用的工具来解决这一业务痛点,缓解人工压力,实现降本增效。
③ 为用户体验造成负面影响
对于服务学习者的专业 App 而言,后端系统的运营维护压力,直接反馈在用户的日常体验之中。以推荐算法为例,该应用最初依据定时更新的数据为用户进行内容推荐,但这样操作的一个弊端就是两次更新间隔内的数据变化无法应用在推荐算法中,一方面可能导致把已下架内容推荐给用户的乌龙事件;另一方面还会由于用户浏览信息、行为记录不能实时推送给算法引擎,从而错过最佳推荐时机,导致商机流失。简言之,由于算法的引擎数据库和后端的数据脱离,导致数据延迟,严重影响了推荐结果的准确性和及时性,使得用户体验下降。留言系统与审核系统也是如此,两个系统相互独立,但鉴于审核反馈的时效性要求,两者间数据同步的一致性和实时性也都直接关系到用户体验。为了有效应对此类问题,团队内部对数据实时性的要求也越来越高。加之随着数据量的不断膨胀,一天跑一次的全量更新方式耗时也在不断增多,逐渐难以为继,急需寻找用以替代的实时同步方案。
为了从后端快速打通各个系统,实现数据的实时、精准同步,在有效节约人力成本的同时,优化运营管理模式,为后续更多内容及模式优化积蓄能量,团队决定寻找一个兼具异构数据实时同步功能,及实时计算能力的工具,来搭建全新的数据底座解决方案——这也是促成该 App 与 Tapdata 最终牵手的原因。
二、Tapdata 助力搭建实时数据平台:让数据按需存储、随需流动
正式选择 Tapdata 前,我们也对比分析了市面上常见的一些同类工具,很遗憾都未能满足需求,特别是在数据源支持的广泛度以及数据端到端的全链路实时能力方面,Tapdata 的优势尤其突出,可以以相对较高的性价比满足我们的需求。与此同时,在合作的两年期间,无论是对需求的及时响应,还是其他售后服务上,我们也都获得了非常不错的体验。
—— 得到 App
作为一个以低延迟数据移动为核心优势构建的实时数据集成和数据服务平台,Tapdata 的典型用例包括数据库到数据库的复制、将数据引入数据仓库或数据湖,以及通用 ETL 处理,无论是从功能模块的角度,还是实时、易上手等特性层面来看,都与该应用眼下的切实需求高度契合。
Tapdata 解决方案:量身打造实时数据平台
镜像层 Mongo:用于存放数据历史变更记录
Kafka:统一为下游业务系统提供数据接入
整体规划
如上图所示,Tapdata 实时数据解决方案助力数据资源按需存储,随需流动:
该应用团队方面希望通过精准推送来降低用户运营成本,挖掘用户付费。而精准推送讲究时效性,根据内部研判,当用户发生首次交易后的 1 小时内,会有较高概率产生二次付费,这就需要推荐系统在短时间内做出精准分析,并推送匹配的知识内容。基于对上述业务需求的分析与拆解,Tapdata 结合自身产品能力,将其落入可执行的技术方案如下。
首先,通过 Tapdata 对源端业务系统库数据进行实时同步,这里包含了订单交易、商品状态、客户行为记录、留言系统等核心业务数据。其后,数据落入镜像层,用于用于记录所有数据的历史变化,再通过 Tapdata 将镜像层数据实时推送到下游 Kafka。最后由推荐系统通过 Flink 消费 Kafka 数据后,完成实时计算、分析。
成果反馈
在 Tapdata 提供的实时数据平台解决方案的加持下,该 App 成功打破瓶颈问题,从数据源头入手,真正实现了降本增效,助力运营管理快速、轻松升级:
节省人力成本:2-3 名的数据开发、运维等人员精简,推动人力向业务创新流动;提供可靠、可复用的数据结果,面对新需求无需写新代码,可直接配置使用,减少代码维护压力。
提升数据同步效率,保障数据同步质量:基于 Tapdata 强大的实时数据集成能力,在提升数据同步效率的同时,也为数据质量提供保障,成功解决数据一致性的历史难题
优化用户体验,推动用户转化:个性化推荐的实时性更强,根据浏览记录阅读习惯,精准捕获用户需求,实现实时推荐,有效减少用户流失。
为什么选择 Tapdata?
在技术选型阶段,该应用团队的标准和方向都非常清晰:一是在技术能力层面,需要完美解决传统数据双写方案遗留下的数据不一致问题。与此同时,考虑到受历史发展因素影响,该 App 内部存在大量不同的数据库类型,而很多同步工具支持的数据源却又比较少,新方案在跨库同步与数据源支持广度方面,都需要有非常出色的表现。二是在后续维护方面,新工具需要支持批量管数据同步链路,且操作简单,有助于减轻后端压力,释放人力资源。
面对上述需求,Tapdata 则展现出如下优势:
开箱即用与低代码可视化操作
Tapdata 部署简单,且支持无代码和低代码可视操作,可以在拖拉拽中快速创建任务,无需编码甚至 SQL 来编写转换规则。
内置 60+ 数据连接器,稳定的实时采集和传输能力
以实时的方式从各个数据来源,包括数据库、API、队列、物联网等数据提供者采集或同步最新的数据变化。支持多源异构数据双向同步,自动映射关系型到非关系型。基于自研的 CDC 日志解析技术,0入侵实时采集数据,对源库几乎无影响,一键实现实时捕获,毫秒内更新。已内置 60+连接器且不断拓展中,覆盖大部分主流的数据库和类型,并且支持自定义数据源,具有强可扩展性的 PDK 架构,4 小时快速对接 SaaS API 系统;16 小时快速对接数据库系统。
秒级响应的数据实时计算能力
全链路实时,基于 Pipeline 流式数据处理,以应对基于单条数据记录的即时处理需求,如数据库 CDC、消息、IoT 事件等。不同于传统 ETL,每一条新产生并进入到平台的数据,会在秒级范围被响应,计算,处理并写入到目标表中。同时提供了基于时间窗的统计分析能力,适用于实时分析场景。
稳定易用的数据实时服务能力
支持低代码可视化方式开发和配置业务需要的 Data API,能够提供毫秒级延迟、大并发的实时交互式数据访问能力,做到真正意义上支持 TP 型业务。具备完善的、可配置的数据访问权限,支持访问监控和分析能力,可为数据需求部门提供基于权限内的自助式主数据访问服务和机制。 兼具高可用、可扩展的架构设计,足以应对大并发和大流量的访问。
数据、任务分类,让数据跨部门流动起来
支持任务分类,可根据不同项目自定义标签,方便快速筛选查找,有助于对全部任务的协同管理与后续维护。
平台级数据校验
通过多种自研技术,保障目标端数据与源数据的高一致性。支持通过条数校验、主键校验、行级校验、高级数据校验多种校验方式,以定时校验、轮询校验、分钟级动态校验等不同的校验周期完成一致性校验,保障生产要求。同时支持错误数据二次校验,以及错误数据修复,共同为数据一致性提供保障。
可视化任务运行监控和告警
包含 20+ 可观测性指标,包括全量同步进度、增量同步延迟等,能够实时监控在运行任务的最新运行状态、日志信息等,支持任务告警。进入 Tapdata 控制台看板,任务运行情况一览无余。
三、宽表构建与主数据管理:得到 x Tapdata 的更多可能
从上述内容中我们不难发现,目前,得到 App 与 Tapdata 在实时数据平台层面的初步尝试已经取得了漂亮的成绩与不错的反馈,但这仅是 Tapdata 整体产品能力中的一部分。为了进一步优化 App 体验,为学习者设计并甄选更加优质的知识内容,Tapdata 也在持续寻找与 Tapdata 其他功能的更多连接点,例如在计划中的宽表构建与主数据管理。
宽表构建:提升数据处理效率和数据利用价值
知识付费类 App,特别是得到这样的头部产品,通常需要处理大量的用户行为数据和内容数据。为了更好地分析和利用这些数据,设计数据模型时需要考虑到数据表之间的关联,以及如何最大程度地提高数据的读取效率。Tapdata 宽表构建能力作为一种数据表设计方式,支持将多个关联的数据表中的数据合并到一个大表中,减少表之间的关联查询,从而有效提高查询效率,可用于用户 360、课程资源管理、订单管理等场景。
宽表可以帮助运营人员更好地分析用户行为和内容数据之间的关系,例如用户购买的课程、观看的视频、留言的内容等等,通过这些数据的分析,知识付费应用可以更好地了解用户的需求和兴趣,从而提供更好的内容和服务,提高用户的满意度和留存率。同时,宽表还可以用于生成数据报表、推荐算法等方面,提高数据的利用价值。
主数据管理:提升数据质量和服务质量,优化用户体验
主数据管理(MDM)作为一种数据管理方法,支持将数据中的关键信息进行集中管理,并以此确保数据的一致性、准确性和可靠性。对于知识付费类 App 而言,有效的主数据管理意味着数据价值、数据质量、服务质量以及数据安全性的全面升级,有助于进一步提高用户体验:
数据一致性:知识付费类 App 通常会有多个数据源,如用户信息、课程信息、付费记录等,这些数据源可能存在重复或者不一致的情况,通过主数据管理可以保证数据的一致性,避免出现错误或者混乱的情况。
数据集成:主数据管理可以将不同数据源中的数据集成到一个单一的数据源中,方便知识付费类 App 进行数据分析和挖掘,提高数据价值。
数据质量:主数据管理可以对数据进行规范化和清洗,提高数据的质量和准确性,从而提高知识付费类 App 的服务质量和用户满意度。
数据安全:主数据管理可以对数据进行权限控制和安全管理,保护知识付费类 App 的核心数据不受非法访问和窃取,避免数据泄露和损失。
Tapdata 作为一个自带 ETL 的实时数据平台,具备实时数据集成(ETL)和实时数据服务(DaaS)两大核心技术能力,可以帮助企业无代码快速连接孤岛系统,构建企业的主数据底座。借助 Tapdata 主数据管理,可以帮助知识付费应用管理和维护数据,提高 App 的数据质量和决策能力,更好地满足用户需求。适用于知识分类管理、用户信息管理、付费信息管理以及内容管理等多重场景。
期待 Tapdata 在未来与知识付费应用展开更多深度合作,为学习者创造更多惊喜,激发知识。
【推荐阅读】