Tapdata 技术博客
Tapdata 技术博客

阿里云对话 Tapdata:以秒级响应速度,为企业提供实时数据服务

2022-11-17 21:44 Tapdata

【导语】今年年初,Tapdata 入选阿里云首期云原生加速器,开始携手阿里云共建云原生行业新生态;8月,获阿里云首批产品生态集成认证,与阿里云正式在产品层面展开合作,加速云原生落地,自此,Tapdata 与阿里云形成稳定的生态合作伙伴关系。适逢 Tapdata 再与 RDS MySQL、RDS MariaDB、AnalyticDB 完成产品生态集成认证,作为阿里云加速器成员企业,Tapdata 创始人唐建法(TJ)接受阿里云专访,分享了 Tapdata 的产品理念与设计初衷,以及拥抱云原生的时代意义。以下为访谈核心内容。


数字化转型正当时,各行各业都在乘风破浪,加速数字化进程。随着信息化、数字化的不断渗透,企业在经营和业务过程中产生的数据爆发式增长。数据驱动增长的现实条件之下,对数据的获取、处理和应用的需求愈发迫切。


然而,多年烟囱式的信息化建设,造成许多孤岛式系统和数据,海量而零散的数据,成为企业数字化征程上最大“拦路虎”。随着数字化进程加快,数据的时效性也关乎到企业的生存发展。


图片


如果能够将这些孤岛式的数据平台以某种方式连接起来,并且给他们安上一个个“水龙头”,当企业需要的时候,一打开水龙头,数据就像水一样源源不断地流出来。让用户使用属于他们的数据,像喝新鲜扎啤那么简单——这正是 Tapdata 在做的事情。

一、让企业使用数据,像拧开水龙那样简单


过去数十年间,企业在信息化进程中搭建了非常多的业务系统。如今数字化浪潮奔涌而至,各行各业迸发出各种定制化业务系统的需求。随着数据架构日益低代码化和平台化,各类新的业务和数据系统数量仍在不断扩张。


企业在信息化和数字化建设过程中,通常涉及到两类数据的处理:OLTP 和 OLAP。其中,OLTP(Online Transaction Processing)指事务型系统,如浏览电商网页、下单、打车、内部流程等;OLAP(Online Analytical Processing)即分析型系统,指对已产生的业务数据,通过聚合、分组统计、AI 等方式进行分析,得出一些洞察,以改进业务流程或提升客户体验。


当企业开始使用 ERP、BI 报表、数据大屏、标签画像等各类系统时,由此产生的海量数据也散落在不同系统。当有新业务时,往往需要从不同数据库里提取不同结构的数据。然而,这些数据源可能有成千上万甚至百万个,不同源库之间数据并不相通,处于一种数据孤岛的状态,导致数据应用的价值低效且难以释放。


随着 IT 架构的迭代升级和业务端的全渠道营销,新一代的运营型分析以及交互型业务场景逐渐成为主流数据应用。企业需要获取最新的实时数据,为客户做及时的业务响应。尽管目前数据库和存储库已经很强大,很多企业也拥有各类 SaaS 系统,但针对交互式 App 或运营分析的场景,对实时数据支持力度有限。


在数字化转型过程中,企业面临着两大难题,一是多年信息化过程中造成的数据孤岛,一是对数据实时性要求越来越高。在 NoSQL 数据库公司 MongoDB 担任首席架构师的时候,TJ 就观察到了这个刚性需求。


TJ 曾在北美留学、工作十余年。2014年,加入 MongoDB,通过大会、博客、文档翻译、免费社区技术支持等方式,一手打造了 MongoDB 非盈利的技术交流中文社区。


在 MongoDB 工作期间,唐建法接触到很多行业的客户,他从客户侧也强烈地感受到了,企业在数字化转型过程中遇到的上述数据难题。


事实上,数据仓、大数据平台、数据中台等几代数据工具和架构都在解决“数据孤岛”问题,只是支持的核心业务偏 OLAP 场景,重在对历史数据做洞察和分析,能为企业提供即时数据,用于 OLTP 业务支撑的实时数据平台十分匮乏


另外,企业在 OLTP 上的预算投入占到90%以上,虽然这个比例随着数据分析价值的凸显正在逐渐缩小,但仍有巨大市场潜力。


正是基于这些考量,一个能够快速打通数据孤岛,为 OLTP 业务提供实时数据的新型平台就呼之欲出。


2019年9月,TJ 从 MongoDB 辞职,创办了 Tapdata,推出面向事务型业务(OLTP)的 DaaS 平台,提供了一套易集成、易维护、完整且实时的数据平台解决方案,助力企业数字化转型


经过3年发展,TJ 当初的构想已经实现,Tapdata 已经搭建了像自来水管一样的数据架构,当需要数据时,企业直接拧水龙头,就能获得新鲜数据。

二、打造一款好用的新一代实时数据产品


作为国内实时 DaaS 赛道的开创者和领跑者,Tapdata 一直聚焦数据即服,针对企业运营中的 TP 业务,以毫秒级响应速度,提供实时数据平台服务。


“国内实时数据处理集成,包括 Daas 服务、主数据服务,Tapdata 是领先的。目前 Tapdata 已经有 7000 多家用户,同步的数据已达到几百亿行的级别”。


今年6月,Tapdata 官宣自带 ETL 的实时数据平台 Tapdata Live Data Platform 上线。这款产品的核心突破点在于,实现了完整的基于 CDC 的异构数据实时集成和计算建模的能力,可以源源不断对数十种源数据库实时采集并输送到 DaaS 存储,确保数据在 DaaS 里始终得到实时更新


Tapdata 产品最明确的定位有两个方向,其中之一,是做云上数据集成,也就是 SaaS 服务。另一个是在云上搭建数据服务平台,帮助企业把数据集中到这个托管平台,提供无代码的实时数据服务,满足企业一站式获取数据的需求。


Tapdata Live Data Platform 具备实时数据集成(ETL)实时数据服务(DaaS)两大核心技术能力。可以做到对企业所有数据系统进行无缝无代码实时打通,从多套系统中进行数据实时采集,然后同步到中央化的数据平台,并通过 API 或反向同步方式,为下游业务的交互式应用、微服务或交互式分析提供新鲜实时的数据。


通俗来讲,就是当有新业务时,企业不需要再去各个地方做数据同步、复制、开发,操作人员只须用一个标准的操作方式就能获取最新最实时的数据。


相较于传统方案,Tapdata 的核心竞争力体现在“全链路实时”。从数据产生开始,第一时间对数据进行实时采集、加工和服务。从采集到交付,整个过程最快不到一秒钟。而以前的方案都是基于小时或者最快15分钟才能做一些数据的抽取同步。


Tapdata 在消费端上呈现出的数据,也都是一些最新的数据或业务状态,这也是全链路实时能力的体现,即提供更加实时、快速的产品体验。


总体而言,Tapdata 的核心能力在于多源异构数据库的实时打通,拖拉拽模式的数据开发,以及低代码数据发布及推送能力,提供毫秒级查询响应及数以万计的并发,和源系统的数据延迟保持在亚秒级。


为方便用户使用,Tapdata 的实时数据平台设置三种发布形式。其中,线上版本针对新一代企业,或已在云上的云原生公司、互联网公司等。线下版则是针对很多尚未在云上的传统企业。


因为实时 DaaS 难度大、概念新,许多企业并没有那么容易接受,Tapdata在市场推广上采取“曲线救国”的方式。比如,开放了开源版本,即通过一种源代码可用的方式,使不能上云的用户也能使用到 Tapdata 的先进技术。


Tapdata 坚信,商业化和开源并不矛盾,通过开源方式能让产品更广泛地触达目标用户,让大家体会到实时数据的价值,能进一步了解并采用 Tapdata 的数据架构及产品,对商业版有一定促进作用。另外,打磨产品最关键的是接收到用户的反馈,开源是一个非常好的共创产品的渠道。


成立三年来,Tapdata 发展迅速,早期就有很不错的资本投入,先后获得变量资本和蓝海资本以及五源资本、XVC及德联资本数千万美元投资。而且获得诸多行业标杆客户认可,包括中国移动、中国一汽、周生生、TCL、南方电网、富邦银行等。


早在 2020 年,Tapdata 营收超过千万元,实现收支均衡。Tapdata 将海外市场作为未来增长的重要方向。在尚未开源和推广的情况下,Tapdata 已经获得若干海外付费客户。


作为一家技术驱动产品的公司,TJ 认为,产品是公司的灵魂,创业成功的关键在于打造一款好产品。只有好产品,才能让团队长久地保持热情。另外,还要跑在好的赛道上。


在 TJ 看来,实时 DaaS 赛道非常清晰,每个企业都有对数据进行集成加工处理的需求,而且上云是未来发展趋势。只要抓住机会,把产品做好,市场是非常广阔的。

三、云原生助力企业,打破传统数据库瓶颈


随着越来越多企业迁移上云,具有高性能、高可用性和高安全性等特点的云上托管数据库及云原生数据库,正成为企业实现高效创新,打破传统数据库瓶颈的首选。


在 TJ 看来,云原生是以云作为起点,所有计算存储处理,信息化或者数字化都是基于云,作基础架构的方式。Tapdata 本身是一个连接数据的产品,其开发测试、环境部署、产品交付都很依赖云来发展。


相比于互联网等云原生企业,传统企业在数字化转型时面临的数据挑战更为艰巨,他们也将目光投放到能大大降低成本的云原生数据库的建设中。


TJ 判断,按照趋势,即使是传统企业,未来也都会需要作规划和迁移,最终把主要的基础架构都搬到云上。


而一些互联网公司一开始所有数据库、应用或服务,全部构建在云上,在不同的云上可能有不同的数据或业务的系统。对于这些云原生企业,Tapdata 也可以帮他们把数据打通连接,为其新业务提供很好的数据支撑。


基于云原生架构,Tapdata 在国内率先推出“异构数据实时同步 SaaS平台”——Tapdata Cloud,将异构数据实时同步能力以免费形式对外开放,以0代码、可视化的操作体验,解决企业跨系统之间的数据实时同步/备份/迁移、集成等问题,帮助企业释放数据准备阶段的精力,更加专注数据业务的开发与创新,加速数字化转型。


20220830


今年3月初,Tapdata Cloud 入选阿里云首期云原生加速器,后与阿里云的 Serverless 应用引擎(SAE),完成了首批产品生态集成认证,实现自云原生加速器项目启动后,Tapdata 与阿里云在产品层面的正式合作。


阿里云拥有丰富的云原生产品家族,有超过300款产品,近千个技术解决方案。阿里云产品生态集成认证,是面向阿里云合作伙伴自有产品、解决方案与阿里云相关产品的兼容性、可用性的技术能力认证。


由此表明,Tapdata 的技术能力、产品应用水平已满足阿里云相关产品的适配性要求,有利于双方一起丰富云原生产业生态圈,加速云原生落地。


通过云原生加速器项目,Tapdata 接触到阿里云很多产品线,也与阿里云的一些产品做了实质性的对接。阿里云提供的一些资源、产品和技术,也帮助 Tapdata 的产品更好、更快成长,打造更佳的用户体验。


Tapdata 一直以生态伙伴的身份与阿里云保持着深度合作。未来,借助阿里云的生态战略与生态集成技术的全面开放,双方的紧密合作将进入新的阶段,共同为中国数千万家企业提供数字化转型服务。


关于 Tapdata


Tapdata Inc.「深圳钛铂数据有限公司」,成立于2019年9月,核心员工来自MongoDB、Oracle、百度、阿里、腾讯等,研发人员占比超90%,至今已获五源资本等多家头部风投数千万美元融资。Tapdata 是新一代的实时数据平台,通过把企业核心数据实时集中到中央化数据平台的方式并通过API 或者反向同步方式,为下游的交互式应用,微服务或交互式分析提供新鲜实时的数据,已服务周生生、中国移动、中国联通、南方电网、中国一汽、富邦银行、罗辑思维等数十家行业标杆企业。Tapdata 坚持“开放+开源”战略,推出 Tapdata Cloud,将无代码数据实时同步的能力以 SaaS 的形式免费开放,目前已积累 7000+ 注册用户,覆盖电商、金融、制造等多个行业。此外,Tapdata 社区版也已发布,正在面向开发者逐步共享其核心功能。


旗下产品:

  • Tapdata Enterprise(企业版):Tapdata Live Data Platform (Enterprise Edition) 是一款由 Tapdata 自主研发的实时数据平台,具备实时数据集成(ETL)和实时数据服务(DaaS)两大核心技术能力,可帮助企业无代码快速连接孤岛系统,把核心数据实时集中到中央化数据平台,并通过 API 或反向同步方式,为下游业务的交互式应用、微服务或交互式分析提供新鲜实时的数据。适用于构建实时数据管道、数据库上云/跨云同步、实时数据 ETL、实时入湖入仓、实时主数据管理、传统业务系统升级与加速等多个场景。可以在数据中心或者云上部署。点击:试用 Tapdata Live Data Platform

  • Tapdata Community(社区版):Tapdata Live Data Platform (Community Edition) 是 Tapdata 面向社区开发者和用户提供的开源版本,目前处于beta状态。Tapdata Community 拥有企业版的大部分核心功能, 支持用代码而非 SQL 来处理数据。核心覆盖的场景包括:实时数据同步、开发和 Fluent ETL,具备全量和增量复制,异构数据库间的同步与转换,表级同步以及任务监控等能力。预计下个版本将新增实时数据校验、增量数据校验、自定义函数与聚合算子场景支持,同时将数据源补充到 50 个以上。点击:了解并试用 Tapdata 社区版

  • Tapdata Cloud(云版):一款异构数据库实时同步 SaaS 服务,支持主流的开源数据库、商业数据库、消息类中间件以及 SaaS 平台(包括:MongoDB、MySQL、Oracle、SQL Server、DB2、Elastic、Kafka、Sybase、PostgreSQL、Redis、GaussDB 等),基于日志的数据库 CDC 技术,0入侵实时采集,毫秒级同步延迟,拖拽式的“零”代码配置操作,可视化任务运行监控和告警,通过 Tapdata Cloud 可轻松实现跨系统跨类型的数据实时同步。 点击:注册 Tapdata Cloud,永久免费使用


推荐阅读