Tapdata Community(社区版),即 Tapdata Live Data Platform (Community Edition) ,是 Tapdata 面向社区开发者和用户提供的开源版本,目前处于 beta 状态。Tapdata Community 拥有企业版的绝大部分核心功能, 支持用代码而非 SQL 来处理数据。核心覆盖的场景包括:实时数据同步、开发和 Fluent ETL,具备全量和增量复制,异构数据库间的同步与转换,表级同步以及任务监控等能力。预计下个版本将新增实时数据校验、增量数据校验、自定义函数与聚合算子场景支持,同时将数据源补充到 50 个以上。
本教程章节将具体介绍,如何基于 Tapdata Community 构建并运行一个 MongoDB => MySQL 的简单同步任务。(点击这里查看更多技术教程与资源)
提前准备的库(已确认可连通):
MongoDB: 4.2,包含一张表:car
MySQL: 8.0.22,空库
PG: 12.6,空库
*任务说明:这个同步任务不包含任何复杂处理,要求是将 car 表从 MongoDB 同步至 MySQL。
新建表同步任务并运行
p = Pipeline('mongo=>mysql')p.readFrom(mongodb.car).writeTo(mysql.car)p.start()
查看任务运行状况:show jobs
监听实时状态:monitor job mongo=>mysql
查看运行日志:logs job mongo=>mysql
在源与目标查看数据情况
做一个变更,查看数据是否同步
任务完成情况:数据的增删改都可以实时同步过来,延迟一般在几百毫秒以内。
Tapdata Live Data Platform 是一个自带 ETL 的实时数据平台,通过把企业核心数据实时集中到中央化数据平台的方式并通过 API 或者反向同步方式,为下游的交互式应用,微服务或交互式分析提供新鲜实时的数据。申请试用