首先,不提倡全部金融企业都选择构建湖仓一体替代原有数据仓库和数据湖;这是因为湖仓一体架构虽然能完成统一的数据存储、加工计算和面向应用端的供给,但是Lakehouse它不是一个全新架构的替代性产品,无法解决企业进行架构升级带来的数据迁移的巨大成本和原有架构效能持续发挥,所以并不提倡以新的引擎彻底换掉现有的Data Warehouse 或 Data Lake。
其次,企业要接受数据源在一定程度上的分散和割裂,通过多架构融合纳管来实现逻辑层面的统一;即使在数字化转型比较领先的行业,也会面临着云上数据仓库和数据平台整合或者第三方数据的现状问题。企业如果要进行新引擎的搭建,要选择技术领先的Lakehouse引擎,同时接受多物理数据,用逻辑的方式把它进行统一,建立逻辑统一数据仓库,通过产品化的方式提供 Data Virtualization 的能力完成数据业务化表达、数据组织和数据共享。 趋势2:从单点烟囱式数据开发走向高度工程化和产品化的数据分析应用的规模化能力
企业数据治理、数据稳定性以及数据服务存在问题,这是因为企业不具备数据工程能力,数据工程是涵盖企业全量数据连接、数据处理分析计算、数据加载管道,将数据重构为可用形式,形成一套体系化的工程。现阶段大部分企业 80% 的精力在管理数据,没有注重数据的软件工程能力、数据基础架构和运营能力,所以导致数据工作无法开展。