Tapdata 获数千万美元 Pre-A 轮融资,开辟实时数据服务新赛道

2021-07-16 09:00

       近日,主推面向 TP 业务实时数据服务平台的 Tapdata (深圳钛铂数据有限公司),宣布完成数千万美元 PreA 及PreA+连续两轮融资,两轮分别由五源资本独家领投及XVC及德联资本联合领投。


融资.png

     

      Tapdata 成立于2019年9月,由前 MongoDB 大中华区首席架构师,MongoDB中文社区主席唐建法(别名TJ)创建,早期核心员工来自MongoDB、Oracle、百度、阿里、腾讯等,并在成立之初获得极客公园旗下变量资本等天使机构近千万人民币天使轮投资。成立后的第二年,Tapdata 营收即超千万实现10倍增长,其产品“实时数据服务平台”获得了诸多行业标杆客户认可,包括中国移动、中国一汽、周生生、TCL、南方电网、富邦银行等。


聚焦实时数据即服务(Real Time DaaS)赛道,主打实时业务场景


       企业在信息化和数字化建设过程中涉及到数据处理,一般分为两大阵营:OLTP和OLAP。OLTP 指的是Online Transaction Processing 事务型系统,关注的是交互式人机业务,如浏览电商网站,下单购买,转账,打车,内部流程等。而OLAP指的是Online Analytical Processing, 联机分析,通常指的是对企业已经产生的业务数据,通过聚合,分组统计,或者机器学习,人工智能的方式来对数据进行分析并得出一些洞察,用以改进业务流程或提升客户体验。目前市场上面向分析的产品和解决方案层出不穷,从20年前的以Teradata为代表的MPP数仓,到10年前以Hadoop生态为代表的大数据平台,到现在的爆款Snowflake为代表的云数仓。


      但是Tapdata创始人TJ则观察到了一个不同的刚性需求: 一个打通数据孤岛,面向TP型业务的实时数据服务平台。


      TP型业务和AP业务相比的特点是交互式场景为主,响应速度快(毫秒级),并发高,支持数据更新和事务等。但是通常这些业务主流都是使用Oracle,MySQL,MongoDB,TiDB等事务型数据库来作为数据支撑。一个TP型的数据平台,真的有必要吗?


      TJ认为,在企业经过了20多年的烟囱式的信息化建设之后,数据孤岛现象对企业数字化转型中快速启动新业务已经在产生巨大的阻碍。举例来说:

  • 某个高端零售业客户,有十多套独立的进销存系统支持不同地区和不同渠道的业务,业务人员都很难确切知道某个商品的准确库存,难以建立一个全渠道营销平台

  • 某保险公司准备上线一个新的SCRM系统,通过微信进行客户关怀。上线前发现需要对接企业的数个业务系统获取客户数据,数据合并去重异常麻烦,额外多出了3个月的上线准备

  • 某传统制造业客户,ERP系统是由Oracle原厂提供,一般业务开发人员没有权限更无胆量去修改核心系统去支撑一些新型营销业务

  • 某内容互联网公司,核心客户和业务数据在多套MySQL、PostgreSQL和MongoDB 之中,但是一些新的搜索或者分析场景需要用到Elastic Search 或者 Neo4J,如何获取最新的客户业务数据进行实时搜索?

       一个能够快速打通数据孤岛,为新业务提供一个统一、完整并且实时数据,并且支持十万级并发和毫秒级响应的TP型数据平台,就能很好的解决这些问题。


       从另一个角度来讲,现在主流的数据库有几十种,DBEngines上面列出的则有370多种。这种多模异构数据库并存的事实,将会是未来企业在精细化数据业务追求下的一个常态存在。连接这些独立的数据库库,为企业提供一个虚拟的“超级数据库”,会带来极大的业务价值。


       所以TJ认为,是时候来提供这样的一个TP型的数据平台了。 毕竟,企业在TP和AP业务上的预算投入是9:1,虽然这个比例在随着数据分析价值的凸显在逐渐缩小,它依然可以说明巨大的市场潜力。

      Tapdata正是基于这样的一些考量而诞生的一个新型数据产品。


像来自水龙头的自来水一样简单的使用数据


      无论企业现在有多少个业务系统,用了多少个不同的数据库,Tapdata希望能够以一种无痛接入的方式,使用基于日志同步的数据虚拟化技术,   为企业构建一个逻辑,虚拟的,统一的数据访问层。如此,企业需要数据时候只需要到一个中央化的地方,通过Tapdata 提供的标准化接口(tap),可以简单方便地获取到想要的数据。这也是Tapdata取名的初衷,使用数据,只要打开水龙头,数据就流出来了。


     为了达到这个目标,Tapdata产品具有以下核心优势:

  • 轻量级私有化部署 - 快速安装到客户数据中心或者私有云环境,3台虚拟机即可拥有

  • 强大的实时同步能力: 支持Oracle, DB2, SQLServer, MySQL,   PostgreSQL , MongoDB, Kafak等近30种数据源

  • 可视化数据开发:从接入数据源到建成第一个模型只需数分钟,拖拉拽方式快速建宽表或者其他数据模型,基本无代码

  • 无代码API发布:任何数据,简单配置即可以RESTful 或 RPC方式发布出去

  • 数据目录: 为DaaS管理的数据提供一个可搜索可分类的数据目录


Tapdata有哪些技术核心


     Tapdata 提供了以下几个核心技术点:

  • 基于数据同步的虚拟化

  • 流处理引擎 + 可视化数据开发平台

  • 低代码API发布能力

  • 异构数据源统一访问框架

      实现DaaS架构的一个核心技术就是数据虚拟化,类似于计算虚拟化一样,数据虚拟化让你不用关心数据的物理存在,只是以一个服务形式提供给用户,这种是数据使用的最佳用户体验方式。相比于传统的联邦查询,基于同步的虚拟化对技术要求更高,容错性更低,毕竟需要对各种底层实现完全不同的数据库进行事务级别的日志解析,忠实还原并在亚秒级延迟下重放到DaaS平台。这个架构没有捷径,就是通过Tapdata 数据库专业团队经过大量的实战研发,并且在不断优化实现和算法的基础上,形成了一个技术壁垒,能够安全可靠的将源系统数据无需其他ETL工具,就可以实时镜像到DaaS 平台,提供准确的数据服务。


ent.png


      Tapdata的异构数据源统一访问框架通过定义一个支持绝大部分数据库的标准,从统一的URL连接方式,到富结构的数据模型,到标准的DML和DDL,来为具有多源异构数据库的企业用户提供一个简单、一致的数据访问能力。只需要一种语法,就可以对企业所有数据进行浏览查看,甚至简单的更新管理。


       在技术选型上,Tapdata勇敢的选择了自研的路线,没有使用主流的类似Flink或者Kafka这样的大数据技术。Tapdata认为在体验为王的时代,客户对建设成本,长期运维,和学习曲线都非常关注。能够提供一个解决客户核心痛点,同时还能保证优秀的产品化体验和可控的成本,这些都意味着自研会是一个更好的选择。即时是存储方面,一些类似的产品往往会包括5-6种存储方案,如MySQL来管理元数据,ES来做搜索,Redis做缓存,Kafka做队列等。相比而言,Tapdata只使用分布式数据库MongoDB加上自研的数据计算中间件,就构成了一个实时DaaS的产品方案,具有架构简单,部署轻量,低成本和上手快等优秀特性。


Tapdata和现有的很多云数仓、大数据平台和数据中台厂商,会是什么样的竞争或合作关系?


      Tapdata的核心能力在于多源异构数据库的实时打通,拖拉拽模式的数据开发,以及低代码数据发布及推送能力。从这个角度出发,Tapdata可以用来作为各个云数仓、大数据平台以及数据中台的前置架构,为这些数据平台解决方案提供数据的采集同步,处理加工,各种可视化建模,以及最终落地到这些数仓或中台。同时,对于很多新型数据库系统,也都面临着需要从传统数据库中实时抽取数据为我用的直接业务诉求,所以从这个角度出发,Tapdata将会是各个新型数仓、数据平台和中台的极佳合作伙伴。


      帮助企业打通数据孤岛,构建实时数据服务平台,直接应用到TP业务系统,切中企业的核心运营价值链。


     Tapdata 实时数据服务平台是以数据服务为导向的,并不企图大而全地支撑起所有数据业务。事实上,大部分数仓、大数据平台和中台建设提供最完整、统一、准确的实时源数据。用Tapdata 创始人唐建法的话说就是:“我只把数据给到你,你把‘水’拿过去以后,是用去做饮料还是啤酒,由你来定。”这也是Tapdata 创立的初衷:Make Your Data on Tap!


开放+开源,加速实时DaaS架构的普及


      Tapdata 目前面向的还是CDO,数据或者应用架构师,在定位上更偏向基础软件。关于如何让市场更好的理解这一点并接受,TJ 表示有办法。


       开源目前是基础架构软件最快提高市场接受度的一种模式,今年的开源产品融资额看上去可以达到或超越前20年总和。但是作为一个从开源数据库(MongoDB) 商业化大坑里爬出来的老兵,TJ表示他还在寻找Tapdata开源后的最合适的商业化模式。但是本轮融资后,Tapdata就已经启动了一些核心能力的开源路线图。


       在开源之前,Tapdata会通过云上开放的方式,以另一种方式将核心产品能力无偿提供给社区。Tapdata Cloud已于近日正式推出公测版(http://cloud.tapdata.net) , 目前这个版本还只是Tapdata 产品的一小部分功能,但是已经可以独立完成多达十几种数据库的异构数据同步能力,为新业务扩展,缓存加速, 全文检索,数据库备份容灾等很多新型业务场景提供生产级的支撑。


       TJ表示此前Tapdata的云同步技术已经与移动公有云深度合作,为移动云的各种异构数据库提供上云和云间同步迁移功能,其能力已经得到充分验证。由于其架构的特性,运营管理成本完全可以将持续由Tapdata公司来承担。TJ希望通过免费云版开放来让大家体会到实时数据的巨大价值,并能够进一步了解并采用Tapdata的Real Time DaaS数据架构及产品。


投资人意见


       五源资本合伙人刘凯表示:“Tapdata 面向OLTP场景的数据处理产品开创了一片待开发的蓝海市场,目前DaaS赛道中比较出名的厂商只有美国的Dremio和Tibco,严格来说,Tapdata 是国内实时DaaS 赛道的开创者,其技术先进性与产品稀缺性是我们所看重的。此外,全球数据库市场中约80%是面向TP数据场景的,因此我们也非常看好这一赛道的市场发展潜力。”


       德联资本合伙人肖然表示:“数字化转型大浪潮是德联资本重要的投资主题,其背后意味着爆发式增长的海量但散落的数据,因此围绕数据的底层平台能力建设和 DaaS 便是我们的关注重点。在这一方向上,针对实时性 TP 能力的诉求愈发旺盛。Tapdata 在成立不到2年的时间里,打造了具有竞争力的产品,被多家知名企业级客户认可,充分说明团队能力模型和市场需求的高度匹配。我们非常期待Tapdata 这一具有国际化视野的团队在全球 DaaS 赛道上尽情施展,十分高兴此次与 Tapdata 合作。”


       XVC合伙人胡博予表示:“随着信息化、数字化的不断渗透,企业在经营和业务过程中所产生的数据也在爆发增长。不仅体现在数据量,也体现在数据种类,数据应用场景上。Tapdata 把原本复杂的异构数据采集,传输,存储,治理工作,通过产品化、低代码、拖拉拽的方式实现,并且打造了一个数据平台。除了为数据分析场景供数之外,由于 Tapdata 的全链路实时的特性,未来企业的交互式场景都可以长在这个平台上,支撑企业新业务的灵活开发,高速发展。XVC 很看好 TJ 所带领的 Tapdata 团队,希望 Tapdata 团队可以带领中国 DaaS 赛道高速发展!”



推荐阅读

Tapdata 推出“钛计划”公益项目,着力打通数据孤岛助推社会数字化升级

为响应数据要素市场化配置改革政策方向的指引,Tapdata 推出“钛计划”打通数据孤岛公益行动,面向非盈利机构(如各城市政务服务数据管理局、社会公益组织/项目等)以及为社会培养数据技术人才的相关培训机构,提供 Tapdata 实时数据服务平台的特殊免费授权,助推公共领域数据互通、共享与实时应用......

Tapdata 钛铂数据的产品理念

Tapdata 是全球首个基于数据即服务架构理念、面向 TP 场景的企业实时主数据服务平台,可以帮助企业快速实现主数据的统一管理和发布,并为所有数据库、数仓、大数据平台提供最实时的源数据,让数据随时可用。

Tapdata Cloud 是什么?

Tapdata Cloud 是钛铂数据自研的异构数据库实时同步工具 Tapdata Replicator 的云服务版本,现在免费提供所有开发者和企业使用Tapdata Cloud 目前支持 Oracle、MySQL、PostgreSQL、SQL Server、MongoDB、Elasticsearch 之间的数据迁移和同步,未来将陆续上线 DB2、Sybase ASE、Redis、Kafka 等。

什么是数据即服务(Data as a Service)?

数据即服务(DaaS)是一种数据管理策略,旨在利用数据作为业务资产来提高业务创新的敏捷性。它是自 1990 年代互联网高速发展以来越来越受欢迎的“一切皆服务”(XaaS)趋势下关于数据服务化的那一部分,介于 PaaS 和 SaaS 之间。与 SaaS 类似,DaaS 提供了一种方式来管理企业每天生成的大量数据,并在整个业务范围内提供这些有价值的信息,以便于进行数据驱动的商业决策。同时,我们也...

什么是数据虚拟化(Data Virtualization)?

本文将简单易懂地介绍数据虚拟化技术及数据虚拟化软件架构的实现方法,尽量避免教条主义。如需要了解虚拟化定义,可通过wiki 百科了解。先引用一段百度百科的文字来说明数据虚拟化的定义:数据虚拟化(data virtualization)是用来描述所有数据管理方法的涵盖性术语,这些方法允许应用程序检索并管理数据,且不需要数据相关的技术细节,例如它格式化的方式或物理位置所在。正如百科的定义,采用数据...

Tapdata 数据库实时同步的技术要点

Tapdata 专注于实时数据的处理技术,在数据库迁移和同步方面,Tapdata 的表现非常优秀,实时、多元、异构,尤其在关系数据库到非关系数据库之间的双向同步方面,无论是从操作上,还是效率上,都体现了业界领先的水平。本文重点阐述 Tapdata 在数据库实时同步方面的技术要点。

教育中台与第三方系统对接整合数据案例

最近, 南京秦淮区教育中台系统,成功地和市系统进行了一次圆满对接。通过教育中台提供的统一数据能力和低代码API对接能力,实现了对市系统数据的实时推送和拉取,以及各类业务逻辑上的处理。这次对接为南京市中小学生创客大赛的成功举办提供了及时可靠的数据支撑, 体现了中台系统在快速响应业务方面的优越性。

周生生 | 全渠道商品中心建设

通过Tapdata 构建全渠道商品中心,实现: - 支持中国大陆港澳台的上千家门店的生产环境; - 使用JS脚本来进行流处理计算,业务需求从开发到上线过程快至 1 天以内; - 任务配置与执行监测全程可视化操作,不懂技术也能完成操作,极大降低维护成本; - 一套产品可满足不同需求,根据业务需求产出不同类型的业务模型节省大量人力物力。

关系型数据库到MongoDB实时数据同步解决方案

使用MongoDB作为主机下行或新一代数据库的选择,将业务数据从已有主机或Oracle等关系型数据库复制到MongoDB; 使用Tapdata Replicator的CDC技术,实时监听现有业务库的数据变动并同步至MongoDB; 使用Tapdata 的RDM技术将关系型表合并转型到MongoDB JSON数据结构,并保持和源库的高度数据一致; 在MongoDB上进行新业务的开发。

Tapdata肖贝贝:实时数据引擎系列(一)-新鲜的数据流

前言2006 年诞生的 hadoop 和 她周边的生态, 在过去的这些年里为大数据的火热提供了足够的能量, 十几年过去了, 场景在变化, 技术在演变, 大家对数据的认知已经不再局限于 T+1 与 高吞吐高延迟 为主要特征的上一代框架理念, 在真实的场景里, 实时, 准确, 多变 的数据也发挥着越来越重要的作用为满足这些新的需求, 各种框架和中间件如雨后春笋般不断涌出hive 的出现让这头大象...
联络我们:
Email:team@tapdata.io    电话:0755-26656080
深圳市南山区临海大道香江金融中心 2410-13
官方服务号
Tapdata 微信公众号
扫码关注