本书为国家职业教育大数据技术专业教学资源库配套教材,也是高等职业教育计算机类课程新形态一体化教材。 本书对大数据的发展历史、背景以及Hadoop的基础知识进行了简要的描述。从一个真实的大数据离线分析项目开始,引导读者完成大数据离线分析平台的搭建工作,使得读者对大数据离线分析环境有一个直观的认识。另外,还以工作任务的形式
本书是国家职业教育大数据技术专业教学资源库配套教材。 本书主要介绍Spark分布式计算框架的应用,重点是流式模块SparkStreaming在实际项目中的应用,并通过一个实战项目来辅助读者学习实时数据处理场景。全书共分为6章,主要内容包括绪论、Scala语言应用、SparkStreaming、SparkSQL、数据整合
本书结合典型的数据挖掘案例,详细介绍了若干种重要的数据挖掘算法的实现原理和应用方法。其中,第1、2章介绍了回归、分类、聚类的概念及其实现的主要方法,如线性回归、逻辑回归、K近邻和K均值;第3~5章介绍了数据挖掘的主要策略,如决策树、提升算法和支持向量机;在前述知识的基础上,第6~8章介绍了实现人工智能算法的三种基础网络
本书将以python软件为工具,以统计理论与方法为重点,结合实际应用案例,深入浅出地介绍了数据挖掘基础算法的背景、原理及实现。全书共9章,第1章为绪论,内容包括数据挖掘的基本概念、数据挖掘与统计学的关系、数据挖掘的实现流程、数据挖掘的方法、数据挖掘的典型应用、数据挖掘的工具及软件;第2-7章介绍数据挖掘中的经典多元统计
本书共九章,内容包括:大数据的认知;大数据安全、隐私和合规管理;大数据时代的理解;大数据应用的模式和价值;大数据应用的基本策略;大数据技术与医疗健康;大数据时代下的城市交通等。
本书以数据的处理和使用为重点,介绍了当下随着互联网的快速发展,我国在数据的处理技术和应用方法上所取得的成就和存在的问题。本书包含了,数据处理的基本理论、数据处理发展研究、数据处理模式研究、数据处理的方法、数据处理的创新研究、数据处理的技术、数据处理技术的创新研究、数据处理的实践应用研究等内容。本书理论清晰,具有一定的学
《数据可视化入门与实战》全面系统地介绍了数据可视化的基本知识和应用实例。全书共六章,主要内容包括数据可视化概述、大数据分析与数据可视化、数据可视化技术、数据可视化常用软件分析工具、数据可视化实现流程与步骤、数据可视化应用实例。本书结构完整,内容由基础到实战,语言通俗易懂,结合大量数据、实例帮助读者快速掌握数据可视化技术
擅长使用数据的孩子,将具备未来核心竞争力。《来探索!大数据与物理学》通过收集与孩子们心中疑问相关的大数据,利用科学的分析方法来揭秘大数据背后隐藏的答案,带领孩子们体会大数据和物理学世界的奇妙,教会他们如何正确看待错综复杂的世界,体会科学的特别乐趣。书中近20篇小故事、100幅手绘卡通图,满足孩子的童趣和视觉享受。
信息技术与数据挖掘(新世纪普通高等教育信息管理类课程规划教材)
"本书采用项目式教学模式,以工业网络组建为主线,注重理论与实践的紧密结合,设计了五个项目:走进工业互联网、认知计算机网络体系架构及协议、工业网络技术基础、工业网络组建和工业网络维护。教学内容融入了1+X证书“工业互联网实施与运维”职业技能等级标准的相关技能考核点,以满足课证融合、项目引导、教学一体化的需求。 本书配套