本书主要讲解了Hadoop大数据开发基础与实战的相关内容,全书共11章,其中第1章为初识Hadoop,第2章为Hadoop集群的搭建,第3章为分布式协调框架ZooKeeper,第4章为分布式文件系统HDFS,第5章分布式计算框架MapReduce,第6章为YARN框架与HA模式,第7章为数据仓库Hive,第8章为分布式
内容简介这是一本指导各类型组织科学构建数据体系,并通过对数据体系的管理和运营让数据实现价值转化的实战性著作,是作者在数字化领域近20年工作经验的总结。本书深度剖析了数字化时代数据体系建设的关键要素与实施路径,系统而全面地介绍了数据体系建设的方法论、框架与实战案例。从全面认识数据与数据要素的价值出发,逐步深入探讨了数据管
本书是校企合作的成果,以大数据平台运维岗位的实际工作为核心,采用任务驱动方式,全面介绍了Hadoop集群的安装、监控和优化等关键技能。内容涵盖了从集群搭建到节点维护、分布式文件存储操作、计算资源管理,再到集群调优和应用组件调优,以及应用组件的安装与检验等多个方面。本书遵循“实践为主、理论为辅、注重实用性”的教育理念,在
本书从学生的认知规律出发,“由简单到复杂、由单一到综合”循序渐进地编排项目,第一部分为智能控制系统方案设计;第二部分为单机智能控制系统开发,共设有SEEElectrical软件应用、MCGS应用、变频器应用、步进电动机及伺服电动机应用等6个学习型项目;第三部分为联网智能控制系统设计,共设有智能饲喂控制系统安装与调试等6
本书系统地介绍大数据的相关知识,分为大数据基础篇、大数据存储与管理篇、大数据处理与分析篇、大数据应用篇。全书共13章,内容包含大数据概述、大数据处理架构Hadoop、分布式文件系统HDFS、分布式数据库HBase、NoSQL数据库、MapReduce、Hadoop再探讨、数据仓库Hive、Spark、流计算、Flink
本书是基于SparkML和Scala语言编写的机器学习实战书籍。基于目前新版本的Spark框架展开,首先是机器学习准备部分,分别介绍了Spark与大数据技术的基础知识、Spark环境的安装与配置、Scala编程基础、Spark数据结构基础。然后是机器学习核心部分,分别介绍了机器学习基础、线性回归、分类算法及应用、数据降
本书共10章,第1-3章详细说明CyberChef工具使用方法,从搭建CyberChef的使用环境开始,逐步深入介绍编码和解码、数据处理模块的相关内容。第4-10章将介绍使用CyberChef工具实战分析恶意样本的案例,包括批处理BAT、PowerShell、CobaltStrike、VBS、ShellCode、Jav
本书聚焦于模因计算,将其视为下一代搜索和优化设备的黄金标准,为读者提供过去四十年间模因计算不同发展阶段的客观评价。本书分为两部分。第一部分包括第二、三章,给出模因算法的整体概况,以人们最认可的形式,也就是将进化算法与一种或多种搜索机制相结构,形成的混合优化算法。第二部分包括第四至六章,着重关注最新视角和理论进展,其目标
本书旨在帮助数据行业的从业者在AI时代提升数据管理和数据技术认知水平,内容覆盖数据价值创造的理论、技术和实践。 本书共8章。第1章回顾企业数据的发展历史,并讲解现代企业数据组织。第2章从多维度解析数据价值的创造路径,包括从构建数字化决策、加速业务创新和推动AI变革等视角介绍数据价值创造的方法和成果。第3章系统讲解数据管
本书分为三个部分,分别介绍了数据要素市场、数据安全和隐私计算。第一部分介绍了数据要素市场的基本情况,包括数据要素制度体系和数据要素市场发展;第二部分结合数字化转型的背景,讲述了多个具备代表性的数据安全理论及实践框架、数据安全常见风险、数据安全保护最佳实践、代表性行业数据安全实践,以及数据安全技术原理、大模型与数据安全等