利用这本书,你将学习以下内容:了解如何选择Spark转换实现优化的解决方案。探索强大的转换和归约,包括reduceByKey()、combineByKey()和mapPartitions()。理解数据分区以实现优化查询。使用PySpark设计模式构建和应用模型。对图数据应用motif查找算法。使用GraphFrames
本书从网络化测控系统的实际应用出发,系统地介绍了基于网络的测控系统的核心技术,涉及工业通信与网络基础知识、测控网络分类、硬件技术、软件技术、系统设计方法和应用实例。全书共分9章,内容包括网络化测控系统概述、计算机网络体系结构、有线测控网络、无线测控网络、网络化测控系统硬件开发、网络化测控系统软件开发、工业以太网测控系统
本书共分为10章,主要内容包括概述、传感器的一般工作特性及其校准、常用传感器的工作原理、传感器信号调理与处理、参数检测、传感器智能化的实现、几种新型智能传感器及应用、智能技术在传感器中的应用、通信功能与总线接口、智能传感器的设计与应用。
本书主要介绍一些新的检测技术的相关理论和具体应用,具体包括红外辐射检测技术、微波检测技术、超声波检测技术、声发射检测技术、光纤检测技术、层析成像可视化检测技术、软测量技术和量子传感技术。每一章均各成体系,内容完整,方便学习。
本书以数据中心为线索,根据相关从业经验以及相关技术,以数据中心的发展,多数据中心的类型等为引,引出多站融合数据中心的概念,并从资源协同、运维等场景阐述了相关技术的运用、技术难点以及注意事项,并列举了相关应用案例以帮助读者加以理解。全书共8章,分别是概述、多数据中心、多数据中心场景、多数据中心运维场景使用价值、多数据中心
本教材打破了传统的以知识传授为主线的知识架构,主要以案例、实训任务为载体,对相关知识点、技能点进行剖析、阐述。本教材共7章,主要内容包括暖通空调控制基础知识、多功能通用控制RWG简介、RWG控制器硬件构成、RWG编程工具入门、逻辑功能块、应用案例及实现、RWG控制器与物联网的结合。
本书介绍了克服日常面临的各种挑战的实践知识,以及各种数据科学解决方案,主要包括数据科学概论,机器学习模型测试,人工智能基础,理想的数据科学团队,数据科学团队招聘面试,组建数据科学团队,创新管理,管理数据科学项目,数据科学项目的常见陷阱,创造产品与提升可重用性,实施ModelOps,建立技术栈和结论。本书的目标读者是希望
本书是一本关于数据流挖掘与在线学习算法的著作,该书全面、系统阐述了数据流机器学习的模型、算法、平台与实例。全书共10章,分为4个部分:第1部分包括第1~3章,介绍数据流机器学习基础知识;第2部分(第4~6章)介绍基于频繁模式的数据挖掘与在线学习算法;第3部分是基于模型的在线学习算法,包括第7章在线稀疏学习模型和第8章在
通过本书,你可以了解到:SparkSQL的新接口如何为SQL的RDD数据结构提升性能。SparkCore与SparkSQL中数据join的不同选择方式。充分利用标准RDD转换的技术。如何解决Spark中键值范式的性能问题。不借助Scala或其他JVM语言来编写高性能的Spark代码。采用改进建议后,如何来测试其功能及性
本书的主要内容有:提取API与网页的数据。统计分析和机器学习的文本数据预处理。机器学习分类、主题建模与摘要。解释AI模型与分类的结果。利用单词嵌入,探索及可视化语义相似性。分析产品评论中的客户情感。根据命名实体及其关系创建知识图。JensAlbrecht是纽伦堡理工学院计算机科学系的全职教授。主要从事数据管理与分析领域