本书以Python作为开发Spark应用程序的编程语言,系统介绍了Spark编程的基础知识。全书共8章,内容包括大数据技术概述、Spark的设计与运行原理、Spark环境搭建和使用方法、RDD编程、SparkSQL、SparkStreaming、StructuredStreaming、SparkMLlib等。
现在已经有越来越多的行业和技术领域需要大数据分析系统,例如金融行业需要使用大数据系统进行信贷风控,零售、餐饮行业需要通过大数据系统进行辅助销售决策,各种物联网场景需要大数据系统持续聚合和分析时序数据,各大科技公司需要建立大数据分析中台等等。《大数据综合应用项目实战/高等职业院校基于工作过程项目式系列教材》为培养和开发大
借鉴现实世界的真实案例,本书将教你会你保护关键基础设施系统所必需的方法和安全措施,同时将有助你加速识别这种特有的挑战。本书首先介绍工业控制系统(ICS)技术,包括ICS架构、通信介质及协议等,接着介绍ICS(不)安全问题,然后剖析了个ICS相关的攻击场景,ICS安全话题亦有涉猎,包括网络分割、深度防御策略及保护方案等。
本书以数据挖掘项目的典型开发过程为线索,对数据挖掘的生命周期中的各个环节,以及其中所涉及的概念、方法、技术和过程模型进行了全面细致的介绍。对于数据挖掘核心部分的典型基础算法,通过细致的阐述、详尽的示例和充分的讨论,深入地展示了数据挖掘算法的内涵,以便读者认知、学习和掌握。本书系统地介绍了数据挖掘原理、算法和应用的相关知
内容介绍这是一本从原理与实践角度全面讲解InfluxDB的著作,由架构师、InfluxDB技术专家撰写,融入了作者构建千亿级监控大数据平台的工程实践经验。从生态、应用场景、功能使用、源码分析等角度对InfluxDB进行了深入的讲解,包含9个企业级实战案例,100余示例,300余条命令和语法详解,能帮助读者从零开始,彻底
本书介绍基于西门子机电一体化概念设计(NXMCD)模块的生产线数字孪生制作与调试技术,主要内容分为两部分:第壹部分(第1~6 章)为机电一体化概念设计建模技术,包括简单几何体的三维建模、机电对象运动设置,以及过程控制与协同设计等技术,涵盖了基本机电对象、运动副、耦合副、传感器、运行时参数、运行时表达式、运行时行为、信
本书的主题是数据压缩,也就是用最紧凑的方式来表示数据。本书先讲解了5类数据压缩算法,即变长编码、统计压缩、字典编码、上下文模型和多上下文模型,然后介绍了香农的信息论,以及怎样通过各种方法来突破熵,如统计编码、自适应统计编码、字典转换、上下文数据转换、数据建模等。本书还讨论了数据压缩中的一些要点,如多媒体数据压缩和通用压
本书结合控制基础、控制技术和控制工程的一体化知识体系,介绍了过程控制基础知识(含控制系统基础、控制建模基础、检测技术基础等)、过程控制主体知识(含检测技术和控制系统)、控制工程应用案例的内容。全书知识点递进关系清晰:控制基础—检测技术—控制建模—简单控制—复杂控制—先进控制—计算机控制—过程案例应用,各章给出思考和练习
重点阐述了数据管理的重要性,数据管理面临的挑战,DAMA的数据管理原则,数据伦理,数据治理,数据生命周期管理的规划及设计,数据赋能和数据维护,使用和增强数据,数据保护、隐私、安全和风险管理,元数据管理,数据质量管理,以及现在应该怎么办,能够帮助企业管理层在了解和执行数据管理的过程中不致迷失在技术术语的迷宫之中。
本教材介绍如何使用Excel软件解决企业会计与财务管理工作中的实际问题。实训单元设计源于企业真实业务背景,内容具体,训练学生合理分析数据并进行辅助性商务决策。可用作高职院校商务类、管理类或经济类专业的高职教学用书和参考用书。