
近年来,我国在芯片制造领域发展迅猛,同步出台了一系列相关政策和投资计划,以推动国内芯片产业的升级和转型。作为现代信息技术产业的基石,同时也是芯片制造的原材料,半导体对于现代科技和工业的发展自是意义非凡。随着智能手机、物联网、云计算等技术的升级,对半导体产业的需求也不断增加,继而迎来快速发展。
然而,半导体产业面临的问题也日益突出,从资金投入,到技术工艺,再到整个产业链条,环环相扣,各有挑战。除却芯片功耗、散热、尺寸等方面的限制,制造过程中的质量和效率等问题也不容忽视。例如,半导体制造过程中需要控制温度、流量、压力等多种参数,而这些参数之间还存在相互影响的关系,如果不能准确控制,将严重影响芯片质量,进而波及整个产业链。
单就生产原料来看,半导体制造需要使用非常纯净的硅晶圆,其生产过程非常复杂,容易受到多种因素的影响,比如温度、湿度、化学物质等等,这些因素都可能导致制造过程中的缺陷。如果这些缺陷没有及时发现并进行纠正,可能会导致半导体芯片的性能下降或者无法正常工作,从而对整个生产线的效率和产出造成严重的影响。
因此,我们迫切需要采用一种能够对制造过程进行全面、实时监测和控制的解决方案,以提高生产效率和质量。
一、「卡脖子」的实时难题:产能受限、流程阻塞
半导体生产协作关系复杂、生产连续性强;产线情况瞬息万变,资产状态、订单情况等变化对生产有巨大影响,因此半导体生产对生产调度决策系统要求极高。
诸多半导体制造企业正在面临这样的生产调度实时性难题:
① 影响产能,造成业务损失
某晶元厂无人产线,共有 2000 个机器,其中包含 200 个型号,负责 200 个制造步骤,平均半个小时出一批货。相关数据 10-15 分钟更新一次,计算一次结果,完成一次操作。因此会出现当前订单已生产完成,但机器人在查询数据的时发现状态仍然是生产中的情况,导致无法进入下一批次生产,机器停摆。制造业每分钟的机器运转都意味着巨大的成本消耗,这将直接影响产能,造成业务损失。

传统的离线数据同步方案
② 阻塞核心业务流程
由于半导体先进制程的复杂性和高精度要求,生产过程中产生的数据量也随之增加。如果数据不及时更新或准确性有误,将会导致生产计划不准确、设备闲置、生产效率低下等问题。这些问题不仅会直接影响企业的产能和效益,还会导致客户满意度下降、订单延迟等问题,进而影响企业的声誉和品牌价值。12寸晶元工艺流程复杂,物料状态时刻都在发生变化,某先进半导体制造企业 10-15 分钟的数据更新频次无法满足物料状态的快速变更,致使相关业务难以顺利开展。
由此可见,数据的实时性和准确性对于半导体企业的产能和效率密切相关。一方面,实时数据可以帮助制造企业更快地发现生产过程中的异常和问题,并及时采取措施加以解决,避免损失和浪费。另一方面,半导体制造企业也需要利用实时数据来支持先进制程的生产控制和管理,以提高生产效率,降低生产成本,从而增强整体竞争力。
因此,如果想要寻求一个能够有效消除这些“业务影响”的解决方案,加快技术创新、提升产业链水平,发挥“实时数据”价值会是一个不错的突破口——而这正是 Tapdata 的核心能力所在。
二、Tapdata 助力升级半导体 RTD 解决方案:实时调度,保障交付
作为一种半导体制造中常用的解决方案,RTD(Real-time Dispatching)可以实时监测半导体生产过程中的缺陷并进行纠正,避免生产线的停机或重新生产,从而达到提高生产效率,降低成本的目的。这个过程涉及到:在制造中使用高分辨率摄像头或其他传感器来检测生产过程中的缺陷 → 使用计算机视觉和机器学习算法进行分析和判断→将检测结果反馈到生产线控制系统,实现自动化纠正等多个环节。
而传统方案往往依赖 ETL 出报表,受限于架构,只能做到 10 分钟左右更新一次数据,RTD 获取数据后再计算,容易导致数据延时过大,无法支撑接下来的自动化产线。这也是需要 Tapdata 重点解决的问题。
为什么需要 Tapdata 的实时同步能力?
由于半导体制造业涉及到的如此复杂的生产流程,需要在不同的生产阶段使用各种不同的机器和设备。这些机器和设备都会产生各种不同类型的数据,例如温度、压力、电流等。此外,生产过程中还需要管理和监控各种物料的流动和使用情况,例如原材料、化学品、半成品等等。这些都需要跨越不同的系统进行管理和监控,像是 MES、ERP、PLM、SAP 等,涉及的数据库类型更是多种多样。
,受限于架构,只能做到 10 分钟左右更新一次数据,RTD 获取数据后再计算,容易导致数据延时过大,无法支撑接下来的自动化产线。这也是需要 Tapdata 重点解决的问题。

Tapdata 量身打造实时数据平台,为 RTD 输送实时之力
整体规划
如上图所示,Tapdata 实时数据解决方案助力数据资源按需存储,随需流动:
该应用团队方面希望通过精准推送来降低用户运营成本,挖掘用户付费。而精准推送讲究时效性,根据内部研判,当用户发生首次交易后的 1 小时内,会有较高概率产生二次付费,这就需要推荐系统在短时间内做出精准分析,并推送匹配的知识内容。基于对上述业务需求的分析与拆解,Tapdata 结合自身产品能力,将其落入可执行的技术方案如下。
首先,通过 Tapdata 对源端业务系统库数据进行实时同步,这里包含了订单交易、商品状态、客户行为记录、留言系统等核心业务数据。其后,数据落入镜像层,用于用于记录所有数据的历史变化,再通过 Tapdata 将镜像层数据实时推送到下游 Kafka。最后由推荐系统通过 Flink 消费 Kafka 数据后,完成实时计算、分析。
成果反馈
在 Tapdata 提供的实时数据平台解决方案的加持下,该 App 成功打破瓶颈问题,从数据源头入手,真正实现了降本增效,助力运营管理快速、轻松升级:
节省人力成本:2-3 名的数据开发、运维等人员精简,推动人力向业务创新流动;提供可靠、可复用的数据结果,面对新需求无需写新代码,可直接配置使用,减少代码维护压力。
提升数据同步效率,保障数据同步质量:基于 Tapdata 强大的实时数据集成能力,在提升数据同步效率的同时,也为数据质量提供保障,成功解决数据一致性的历史难题
优化用户体验,推动用户转化:个性化推荐的实时性更强,根据浏览记录阅读习惯,精准捕获用户需求,实现实时推荐,有效减少用户流失。
为什么选择 Tapdata?
在技术选型阶段,该应用团队的标准和方向都非常清晰:一是在技术能力层面,需要完美解决传统数据双写方案遗留下的数据不一致问题。与此同时,考虑到受历史发展因素影响,该 App 内部存在大量不同的数据库类型,而很多同步工具支持的数据源却又比较少,新方案在跨库同步与数据源支持广度方面,都需要有非常出色的表现。二是在后续维护方面,新工具需要支持批量管数据同步链路,且操作简单,有助于减轻后端压力,释放人力资源。
面对上述需求,Tapdata 则展现出如下优势:
开箱即用与低代码可视化操作

Tapdata 部署简单,且支持无代码和低代码可视操作,可以在拖拉拽中快速创建任务,无需编码甚至 SQL 来编写转换规则。
内置 60+ 数据连接器,稳定的实时采集和传输能力

以实时的方式从各个数据来源,包括数据库、API、队列、物联网等数据提供者采集或同步最新的数据变化。支持多源异构数据双向同步,自动映射关系型到非关系型。基于自研的 CDC 日志解析技术,0入侵实时采集数据,对源库几乎无影响,一键实现实时捕获,毫秒内更新。已内置 60+连接器且不断拓展中,覆盖大部分主流的数据库和类型,并且支持自定义数据源,具有强可扩展性的 PDK 架构,4 小时快速对接 SaaS API 系统;16 小时快速对接数据库系统。
秒级响应的数据实时计算能力

全链路实时,基于 Pipeline 流式数据处理,以应对基于单条数据记录的即时处理需求,如数据库 CDC、消息、IoT 事件等。不同于传统 ETL,每一条新产生并进入到平台的数据,会在秒级范围被响应,计算,处理并写入到目标表中。同时提供了基于时间窗的统计分析能力,适用于实时分析场景。
稳定易用的数据实时服务能力

支持低代码可视化方式开发和配置业务需要的 Data API,能够提供毫秒级延迟、大并发的实时交互式数据访问能力,做到真正意义上支持 TP 型业务。具备完善的、可配置的数据访问权限,支持访问监控和分析能力,可为数据需求部门提供基于权限内的自助式主数据访问服务和机制。 兼具高可用、可扩展的架构设计,足以应对大并发和大流量的访问。
数据、任务分类,让数据跨部门流动起来

支持任务分类,可根据不同项目自定义标签,方便快速筛选查找,有助于对全部任务的协同管理与后续维护。
平台级数据校验


通过多种自研技术,保障目标端数据与源数据的高一致性。支持通过条数校验、主键校验、行级校验、高级数据校验多种校验方式,以定时校验、轮询校验、分钟级动态校验等不同的校验周期完成一致性校验,保障生产要求。同时支持错误数据二次校验,以及错误数据修复,共同为数据一致性提供保障。
可视化任务运行监控和告警

包含 20+ 可观测性指标,包括全量同步进度、增量同步延迟等,能够实时监控在运行任务的最新运行状态、日志信息等,支持任务告警。进入 Tapdata 控制台看板,任务运行情况一览无余。
三、宽表构建与主数据管理:知识付费应用 x Tapdata 的更多可能
从上述内容中我们不难发现,目前,该知识付费 App 与 Tapdata 在实时数据平台层面的初步尝试已经取得了漂亮的成绩与不错的反馈,但这仅是 Tapdata 整体产品能力中的一部分。为了进一步优化 App 体验,为学习者设计并甄选更加优质的知识内容,Tapdata 也在持续寻找知识类 App 与 Tapdata 其他功能的更多连接点,例如在计划中的宽表构建与主数据管理。
宽表构建:提升数据处理效率和数据利用价值
知识付费类 App,特别是这样的头部产品,通常需要处理大量的用户行为数据和内容数据。为了更好地分析和利用这些数据,设计数据模型时需要考虑到数据表之间的关联,以及如何最大程度地提高数据的读取效率。Tapdata 宽表构建能力作为一种数据表设计方式,支持将多个关联的数据表中的数据合并到一个大表中,减少表之间的关联查询,从而有效提高查询效率,可用于用户 360、课程资源管理、订单管理等场景。
宽表可以帮助运营人员更好地分析用户行为和内容数据之间的关系,例如用户购买的课程、观看的视频、留言的内容等等,通过这些数据的分析,知识付费应用可以更好地了解用户的需求和兴趣,从而提供更好的内容和服务,提高用户的满意度和留存率。同时,宽表还可以用于生成数据报表、推荐算法等方面,提高数据的利用价值。
主数据管理:提升数据质量和服务质量,优化用户体验
主数据管理(MDM)作为一种数据管理方法,支持将数据中的关键信息进行集中管理,并以此确保数据的一致性、准确性和可靠性。对于知识付费类 App 而言,有效的主数据管理意味着数据价值、数据质量、服务质量以及数据安全性的全面升级,有助于进一步提高用户体验:
数据一致性:知识付费类 App 通常会有多个数据源,如用户信息、课程信息、付费记录等,这些数据源可能存在重复或者不一致的情况,通过主数据管理可以保证数据的一致性,避免出现错误或者混乱的情况。
数据集成:主数据管理可以将不同数据源中的数据集成到一个单一的数据源中,方便知识付费类 App 进行数据分析和挖掘,提高数据价值。
数据质量:主数据管理可以对数据进行规范化和清洗,提高数据的质量和准确性,从而提高知识付费类 App 的服务质量和用户满意度。
数据安全:主数据管理可以对数据进行权限控制和安全管理,保护知识付费类 App 的核心数据不受非法访问和窃取,避免数据泄露和损失。
Tapdata 作为一个自带 ETL 的实时数据平台,具备实时数据集成(ETL)和实时数据服务(DaaS)两大核心技术能力,可以帮助企业无代码快速连接孤岛系统,构建企业的主数据底座。借助 Tapdata 主数据管理,可以帮助知识付费应用管理和维护数据,提高 App 的数据质量和决策能力,更好地满足用户需求。适用于知识分类管理、用户信息管理、付费信息管理以及内容管理等多重场景。
期待 Tapdata 在未来与知识付费应用展开更多深度合作,为学习者创造更多惊喜,激发知识。
【推荐阅读】