Tapdata 技术博客
Tapdata 技术博客

口腔专科医院实时数据中心:如何高效拆除数据烟囱,建立患者360视图,助力智慧医疗?

2024-08-16 16:40 TapData

使用 TapData,化繁为简,摆脱手动搭建、维护数据管道的诸多烦扰,轻量代替 OGG、DSG 等同步工具,「CDC + 流处理 + 数据集成」组合拳,加速仓内数据流转,帮助企业将真正具有业务价值的数据作用到实处,将“实时数仓”方法论落进现实。


TapData 持续迭代产品能力,优化用户体验的同时,也在不断探索各行各业数据需求的底层逻辑,力求为行业用户提供更加简洁、更具针对性的解题思路。本期内容便是我们在口腔医疗行业做出的实践以及展望。


通过 TapData 强大的实时数据能力,我们成功整合了各类医疗数据,搭建了运营及临床数据中心,显著提升了运营效率和患者体验。在这个过程中,TapData 不仅帮助我们拆除了积年的数据烟囱,还为临床和运营管理决策提供了有力的数据支撑。它简化了数据管理流程,使我们能够更快速地响应患者需求,向智慧医疗的未来更进一步。——北京口腔医院


近年来,智慧医疗已经成为医疗健康领域的重要发展方向。从信息化到数字化再到数智化,依托大数据、物联网、人工智能等前沿科技,智慧医疗正在不断革新医疗服务模式和管理方式。


而无论处于哪个发展阶段,数据都是智慧医疗的核心驱动力——不仅是实现精准医疗和个性化诊疗的基础,还为医疗决策和资源优化提供了有力支持。因此,医疗数据资产化,即掌握高质量医疗数据资源也是各医疗机构、研究学会、药械企业及公卫监管部门目前的刚需。


然而,作为一个信息密集、分散且高度专业化的领域,医疗行业也备受数据孤岛问题的困扰。在进一步推动数据要素价值创造,加快形成新质生产力的背景下,行业多方合力打破数据孤岛、释放数据价值,政策层面持续鼓励数据互联互通并细化标准,医疗机构也积极拥抱现代化数据管理解决方案。口腔医疗也并不例外。


本文将以北京口腔医院为例为例,详解医疗机构如何快速打通医疗机构内外部信息孤岛,助力部门、区域、行业之间的数据共享,为智慧医疗推进打稳数据地基。

一、客户背景:数据烟囱阻碍数据中心的落成

出于提升数据质量,实现精准医疗的目的,建立医疗数据中心是医疗行业常见的策略之一。医疗数据中心作为集中的数据存储和管理平台,能够汇集和整合来自不同来源的多种医疗数据,包括电子病历、诊断报告、影像资料、实验室测试结果等。这些数据中心不仅仅是简单的数据存储空间,更是数据分析和挖掘的核心基地。


医疗行业的数据中心大致可分为三类,分别是:

  • 运营数据中心:主要处理人力、财务和物资等方面的数据,涉及医院的日常运营和管理。

  • 临床数据中心:主要处理医生诊断、处方、患者健康记录等临床相关数据,包含电子病历(EMR)、诊疗信息等。

  • 科研数据中心:用于管理科研相关的数据,特别是实验和研究数据,旨在支持科研活动,为医学研究提供数据支撑。

北京口腔医院现阶段专注于前两者的搭建,主要为临床及运营管理服务。在这个过程中,各个系统生产的数据需要实时同步到数据中心。这些系统包括 HIS 系统、电子病历、检查检验、手术麻醉、血库管理系统等各个类别,不仅每个类别的服务或产品供应商各不相同,同一个类别内涵盖的厂商也可能五花八门,从而形成了所谓的“数据烟囱”或孤岛问题,即数据孤立在各自的系统中,盘根错节,难以整合。专科医院尚且如此,综合医院面临的孤岛困境只会更加严重,内部在运行的系统可能不下数百套。


毫无疑问,想要让数据中心真正跑起来,第一步就是——拆掉烟囱——抓取各个系统来源的数据并按照需求汇总为统一的格式。

二、拆掉烟囱实践:ETL 脚本 vs. 现代化数据工具

在此之前,业内常见的数据集成解决方案通常依赖定时任务来实现数据的批量导入。具体做法是通过预定的时间间隔运行脚本或程序,以自动化数据的提取、转换和加载(Extract, Transform, Load,ETL)过程。对比起市场上一些成熟的现代化数据工具,二者各有其特点和应用场景:


传统 ETL 脚本


如前所述,这是一种相对传统的数据处理方法,用于从多个来源提取数据,进行转换处理,然后加载到目标数据仓库或数据湖中。它的主要优点包括:

  • 灵活性:ETL 脚本可以根据具体需求进行定制化开发,适应性强。

  • 控制:数据工程师可以精细控制数据的转换和加载过程,确保数据质量和一致性。

然而,ETL 脚本也存在一些局限性:

  • 开发和维护成本高:编写和维护 ETL 脚本通常需要专业的编程技能,且随数据源和需求变化,脚本的调整和更新成本较高。

  • 扩展性不足:面对数据量增长和复杂性增加的情况,ETL 脚本的扩展能力可能受到限制。

  • 难以支撑实时性需求:传统的 ETL 脚本通常依赖批处理模式,这意味着数据的提取、转换和加载是以预定的时间间隔进行的。这种批量处理的方式无法满足日益高涨的实时数据处理的需求,导致数据时效性不足。

  • 对源端的侵入性高:ETL 脚本通常需要直接访问和提取源系统中的数据,这可能对源系统的性能产生影响。此外,在进行数据提取时,ETL 脚本可能需要与源系统进行较为深入的集成,这增加了对源系统的依赖性和对其资源的占用。

现代化数据工具


现代化数据工具,如 TapData、Fivetran、Airbyte 等,提供了更高效、更自动化的数据整合解决方案。这些工具的优势包括:

  • 自动化和易用性:现代数据工具通常具有图形化界面和自动化功能,使得数据集成和管理更加便捷,降低了技术门槛。

  • 实时处理能力:许多现代工具支持流数据处理,可以实现数据的实时抓取和分析,适应快速变化的业务需求。

  • 扩展性和灵活性:现代化数据工具通常基于云计算架构,能够灵活扩展,处理海量数据,同时支持多种数据格式和源的集成。

相较而言,ETL 脚本更适用于需要定期同步和更新数据的场景。但数据的实时性需求在口腔医疗的实际场景中并不少见。举个例子:不同于其他专科,口腔医疗有一点特殊性在于,治疗费用通常在治疗完成后才能确定。这是由于每个患者的治疗过程和使用的材料不同,费用也随之变化。只有在治疗结束时,医生才能开具账单,且多需复诊。也正是因为这种不确定性,漏缴费的情况时有发生。为了在不影响患者后续就诊的同时,控制医院损失,需要实时同步相关信息(历史诊疗、缴费记录等)至统一的数据中心以确保:1) 及时推送消息提醒患者未结清的账单,减少因遗忘导致的延期支付;2) 有效追踪患者的缴费情况,及时发现未支付账单,协助甄别失误和恶意逃单,前者可在再次预约时予以支付提醒,后者酌情黑名单处理(限制再次挂号),以避免误判和欠费问题累积;3) 实时校验患者信息和诊疗记录,无需反复到源头生产库中遍历历史数据进行校验,从而减少生产系统负担。


综上,考虑到快速实施、降低维护成本并具备实时数据能力这些综合因素,北京口腔医院在接触到 TapData 实时数据平台后,意识到这是更加符合发展需求的选择。

三、解决方案:基于 TapData 构建的医疗实时数据中心

口腔1.jpg

鉴于上述需求与挑战,尤其是内部对于实时能力的强调,北京口腔医院最终采用了 TapData 来承担数据中心整个工作环节中数据集成部分的工作,最终实现实时的运营与临床数据中心。以下是该方案的关键组成部分:


1. 数据采集与整合


TapData 支持从多种来源实时采集数据,包括电子病历系统、财务系统、人力系统,以及物联网设备等。通过其丰富的内置数据连接器,TapData 能够无缝集成多种数据格式和源,确保数据的完整性和一致性。同时,TapData 的数据标准化功能可以将不同来源的数据转换为统一的格式,为后续的数据处理和分析打下基础。


2. 实时数据处理


与传统的批处理模式不同,TapData 支持基于 CDC 的流数据处理,大大提高了数据的时效性和决策支持能力。例如,通过实时更新驾驶舱展示大屏,院领导可以随时查看当日运营数据的动态变化。这种实时数据的可视化展示,不仅提供了医院关键运营指标的即时反馈,如床位使用率、门诊流量、急诊处理情况等,还能够及时捕捉和应对突发事件和异常情况。


3. 高性能数据存储与分析


通过 TapData 集成高性能的数据存储和分析引擎,可支持大规模数据的存储和快速查询。通过与云端或本地的数据仓库集成,TapData 可以提供高效的存储解决方案,并支持复杂的分析任务,如数据挖掘、统计分析和机器学习模型的训练。这些功能有助于医疗机构从海量数据中提取有价值的洞见,支持临床研究、资源优化和个性化医疗服务的提供。

成果反馈

经过一段时间的运行验证,目前,该方案得到的数据已顺利应用于北京口腔医院的以下业务场景:

  1. 患者360视图

  • 问题:患者的各类数据分散在不同的系统中,工作人员需要在不同系统中查找患者的挂号信息、诊疗记录、化验报告、病理报告等,导致工作效率低下。为了获取患者的全面信息,必须跨多个系统进行数据查询,这不仅耗时,还容易遗漏重要信息。

  • 现状:实时数据中心高效整合所有患者的就诊数据,形成“患者360视图”功能模块,提供了一个患者在医院就诊的全生命周期数据的完整视图,涵盖挂号、诊疗、收费、医保报销、检查检验报告、病理报告、用血记录、电子病历等。这一模块为管理科室(如行风办、医务处)提供了全面的患者信息,便于随时查阅患者的全部就诊记录。

    其中,TapData 确保数据在各系统之间实时更新和整合,使患者360视图始终展示最新的患者信息。这不仅提高了信息的可用性和准确性,还显著提升了医院管理的效率。患者360视图的实施极大地简化了医院的管理流程,使得管理人员和医务人员能够更快捷地获取完整的患者信息,医院可以更好地服务患者,确保所有医疗活动的透明和追踪,减少误诊和遗漏的风险,有效提升了医院的服务质量和患者体验。


2. 向上(卫健委)的信息汇报

  • 问题:过去需要根据每个系统的不同接口手动抓取数据,非常麻烦。

  • 现状:按照规范的电子病例系统要求,借助 TapData 将各系统的数据整合并统一数据模型后,再通过接口完成上传。这种统一的数据模型包含数百个字段,涵盖各类业务数据。


3. 帮助及时处理未支付账单

  • 问题:过去因口腔医院耗材多、患者费用后结算且需多次复诊等客观原因,易导致患者漏缴费的情况。

  • 现状:通过数据中心,医院能够实时更新患者的账单状态,帮助设立支付提醒提醒机制。同时,患者也能够通过线上平台或小程序随时查看并支付账单,提升了医疗服务的便利性和用户体验。

4. 药品管理和处方限制

  • 问题:存在患者通过不当手段获取超量药品的风险。

  • 现状:利用实时同步库校验处方开药限制,如急诊只能开三天药,慢性病最多开五天,确保患者按规定用药。

5. 大屏展示和领导驾驶舱

  • 需求:实时展示医院运营情况,如挂号人数、费用变化等不断更新的数据。

  • 现状:通过同步库实现实时数据展示,避免生产系统过载,确保领导能实时查看医院的运营状态。


未来应用

  1. 数据交易

  • 需求:医院在提供数据给外部机构时,需要确保业务数据不能离开医院,以保护患者隐私和数据安全。然而,涉及数据交易时,尤其是 AI 公司对医疗数据的需求,可能会遇到管理上的卡点,例如如何共享数据而不违反隐私法规和医院的内部政策。

  • 方案:计划对数据进行清洗和转换,以满足数据交易的需求。清洗过程包括去除或匿名化敏感信息,确保数据脱敏处理。转换过程则涉及将数据格式标准化,方便外部机构使用。这样,医院能够在法律和政策允许的范围内提供处理后的数据,既满足 AI 公司对医疗数据的需求,又保护患者的隐私和医院的敏感信息。这一方案不仅能有效利用数据资源,还能促进医院与外部机构的合作,推动医疗技术的创新和发展。

2. AI 辅助系统和超算服务器

  • 计划:利用 AI 系统和超算服务器进行语音识别、智能诊断等应用,减少医生的工作量。

  • 解决方案:数据中心提供数据支持,帮助 AI 系统处理大量数据而不影响生产系统的性能。

3. 微服务架构和业务划分

  • 现状:医院在尝试微服务架构,但由于业务边界划分的复杂性,尚未完全实施细粒度划分。

  • 方案:利用数据中心方案整合多个微服务的数据,在医生需要查看详细信息时提供支持,而不必在每个微服务中存储冗余数据。

4. 其他扩展应用

  • 现状:医院主要涉及的数据源是关系型数据库,如 SQL Server、Oracle、MySQL

  • 计划:引入 Elasticsearch(ES)为数据目标,用于:

    • 实现全文检索功能:医院需要在电子病历(EMR)等文本数据中进行快速而高效的全文检索,以提取和统计特定信息,如病例数、药物使用情况等。ES 强大的全文检索能力能够满足这一需求。

    • 快速响应查询需求:在高并发查询的场景下,如领导驾驶舱和实时业务展示,ES 能够提供快速响应的查询能力。这有助于医院实时获取和展示关键业务数据。

    • 支持复杂查询和分析:ES 不仅支持简单的文本检索,还能够处理复杂的查询和数据分析需求。这为医院的决策支持和报告生成提供了技术支持,提升了数据利用效率。

总结

通过 TapData,北京口腔医院成功上线了实时的医疗数据中心,并实现了多项关键业务功能的优化。该实时数据中心不仅提高了数据整合和处理的效率,还支持了多部门协作,改善了运营管理。为医院提供了一个强大的信息化平台,从而更好地管理资源、提高服务质量,并为今后的医疗创新奠定了坚实的基础。


未来,TapData 还将持续挖掘实时数据在医疗领域的实用性价值,为行业提供更多运营灵感。

采用 TapData 实时数据平台解决方案有哪些优势?

  • 广泛的数据源和目标支持:内置 100+ 数据连接器,稳定的实时采集和传输能力

  • 学习成本低,轻量易上手:开箱即用与低代码可视化操作,支持数据模型预览,无需专业的编程能力,即可完成复杂的数据集成和开发。

  • 更实时,更高效:兼具秒级响应的数据实时计算能力,以及稳定易用的数据实时服务能力

  • 支持数据、任务分类:可根据不同项目自定义标签,方便快速筛选查找,有助于对跨部门协同管理及后续维护

  • 支持平台级数据校验:有效保障数据一致性

  • 可视化任务运行监控和告警:20+ 可观测性指标,实时监测任务最新状态

【推荐阅读】:


推荐阅读