大数据集成与预处理实训_梁楠楠_9787121518072

内容简介
作者介绍
目录

大数据技术的落地应用高度依赖高效的数据集成能力。Sqoop、DataX、Flume、Flink CDC等工具作为连接关系型数据库与分布式存储系统的桥梁，是大数据开发工程师的核心技能栈。本书以场景化实训为导向，系统介绍Sqoop、DataX、Flume、Flink CDC的原理与应用方法，帮助读者掌握从数据采集、传输到存储的全流程技术。通过“图书销售数据集成”“零售业务数据集成”等项目，演示单工具在离线同步、实时捕获等场景中的应用；通过“银行金融租赁审批数据集成”项目，串联多工具实现离线全量数据与实时增量数据的混合处理。本书适合作为高等学校大数据相关专业的实训教材，也可为数据工程从业者提供实践参考。

你还可能感兴趣

数据科学基础
数据采集技术（初级）
数据科学与大数据技术导论
跨域多维大数据管理模型与方法
分片线性分类器设计的新方法——组合凸线性感知器
数据治理

我要评论