l数据仓库、大数据、数据科学的简单介绍。l了解企业建立数据湖的各种途径。l探索如何构建自助服务模型,以及如何让分析师便捷访问数据的最佳实践。l使用不同的方法来构建数据湖。l了解不同行业专家实现数据湖的方法。
这是一个大数据爆发的时代。面对信息的激流,多元化数据的涌现,大数据已经为个人生活、企业经营,甚至国家与社会的发展都带来了机遇和挑战,大数据已经成为IT信息产业中最具潜力的蓝海。“大数据导论”是一门理论性和实践性都很强的课程。本书是为高等职业院校大数据技术与应用专业“大数据导论”课程全新设计改编的,是一本具有丰富实践特色
近年来,以ApacheSpark为代表的大数据处理框架在学术界和工业界得到了广泛的使用。本书以ApacheSpark框架为核心,总结了大数据处理框架的基础知识、核心理论、典型的Spark应用,以及相关的性能和可靠性问题。本书分9章,主要包含四部分内容。第一部分大数据处理框架的基础知识(第1~2章):介绍大数据处理框架的
本书以独特的方式讲解数据科学,不仅让读者可以轻松学习数据科学理论,又可以动手(手算和机算)进行数据科学实战。本书特色:全彩印刷,图形、表格、思维导图丰富;避免深奥的数学证明,采用简单的数学说明;用各种学习图将本书内容贯穿起来;实战计算,包含小型数据的演算和大型数据的实战程序。 本书共13章,内容涵盖丰富的数据科学
概述了OPCUA;介绍如何操作已经建立好的OPCUA信息模型;OPCA的应用程序架构和系统架构,*后本书对OPCUA协议子集进行介绍,并对OPCUA与传统OPC的性能进行了对比。对于那些需要进一步查询OPCUA详情的读者,本书的附录给出了参考。
本书由国际数据挖掘领域泰斗、UIUC韩家玮教授和其学生张超博士(现为佐治亚理工学院助理教授)合著。介绍了将非结构化文本数据转换为多维知识的数据挖掘技术,并讲解了他们开发的文本多维数据集框架的原理和使用方法。
本书是根据我国当前测控技术与仪器专业教学改革和教材建设的需要而编写的一本关于自动检测技术及仪表的教材。全书共分4篇19章,深入、系统地介绍了自动检测技术及仪表的相关理论、原理、技术及其应用等知识。第1篇介绍了检测技术及仪表的基本概念及基础理论,包括检测技术及仪表概述、检测误差及其处理、信号的描述及其分析、检测系统及其特
《数据清洗》主要介绍数据清洗技术的基本概念与应用。全书共有8章,分别讲述了数据清洗基础、数据清洗方法、文件类型、数据采集与抽取、Excel数据清洗与转换、ETL数据清洗与转换、Python数据清洗、R语言数据清洗。《数据清洗》将理论与实践操作相结合,通过大量的案例帮助读者快速了解和应用大数据清洗的相关技术。针对书中重要
本书根据《教育部关于深化职业教育教学改革全面提高人才培养质量的若干意见》精神编写,以“课程思政”为指导思想,全面介绍了与课程知识体系相关的国家新政策、行业新动态和专业新知识。主要内容包括传感器与智能检测技术基础、电阻式传感器、电容式传感器、电感式传感器、压电式传感器、热电式传感器、光电式传感器、霍尔式传感器与其他磁敏传
在过去几年中,互联网、在线营销以及广告经历了巨大的变革,然而大家处理数据的方式跟几十年前相比还是大同小异。数据分析领域的领跑者(AvinashKaushik)通过《谷歌数据分析方法》提出了下一代数据分析的框架,将能很大程度地帮助你提高组织的能动性和对市场的反应速度。本书阐述了如何去衡量、分析目前互联网上出现的新技术和应