本书系统阐述了人工智能的核心基础理论与前沿技术,构建了从基础到应用的完整知识体系。全书共10章,内容涵盖人工智能发展历程、知识表示与推理、智能搜索算法、机器学习基础、神经网络原理等经典理论,并深入讲解卷积神经网络、循环神经网络、图神经网络等深度学习核心技术。同时专设大语言模型基础章节,详细解析Transformer架构、提示工程、模型微调等热点技术,梳理了GPT系列模型的演进历程。书中还通过百度飞桨平台下的工业缺陷检测案例和能源行业案例,完整呈现AI技术的实际应用全流程。
本书既适合作为高等院校人工智能相关课程的教材,又可供科研人员和工程技术人员参考。
第1章绪论001
1.1什么是人工智能001
1.1.1人工智能的概念001
1.1.2人工智能的定义与内涵002
1.2人工智能的历史002
1.2.1孕育(1943—1955)003
1.2.2诞生期及第一次大发展(1956—1974)004
1.2.3人工智能的第一次低谷(1974—1980)005
1.2.4人工智能的第二次发展(1980—1987)006
1.2.5人工智能的第二次低谷(1987—1993)006
1.2.6人工智能的第三次发展(1993年至今)006
1.3人工智能的主流学派007
1.3.1符号主义学派007
1.3.2连接主义学派008
1.3.3行为主义学派009
1.4人工智能主流方向010
1.4.1基本内容011
1.4.2主要方向011
1.5人工智能的先进技术与应用领域012
1.5.1先进技术012
1.5.2应用领域013
1.6人工智能与安全014
1.6.1安全问题的重要性014
1.6.2道德伦理014
1.6.3个人隐私015
1.7人工智能所需知识体系015
1.7.1数学基础015
1.7.2编程基础016
1.7.3计算机科学基础016
本章小结016
习题017
第2章知识与推理018
2.1知识与知识表示的基本概念018
2.1.1知识表示方法018
2.1.2谓词逻辑表示法020
2.1.3产生式表示法023
2.2推理的基本概念027
2.2.1推理的定义027
2.2.2推理方式与分类028
2.3确定性推理方法029
2.3.1自然演绎推理029
2.3.2归结演绎推理030
2.4不确定性推理方法035
2.4.1不确定性推理方法基本概念035
2.4.2不确定性推理的基本问题035
2.4.3不确定性推理的分类036
2.4.4可信度方法036
2.4.5模糊推理039
2.5案例042
本章小结044
习题044
第3章智能搜索求解046
3.1搜索的基本概念046
3.1.1搜索问题047
3.1.2搜索算法分类048
3.2状态空间的搜索策略049
3.2.1状态空间表示法050
3.2.2状态空间的图描述050
3.3盲目搜索策略052
3.3.1广度优先搜索052
3.3.2深度优先搜索054
3.3.3一致代价搜索056
3.4启发式搜索策略058
3.4.1搜索策略与估价函数058
3.4.2贪心搜索061
3.4.3A*搜索062
3.5复杂搜索与优化算法064
3.5.1爬山搜索064
3.5.2模拟退火067
3.5.3遗传算法068
3.5.4剪枝搜索069
3.6案例072
本章小结075
习题075
第4章机器学习079
4.1概述079
4.1.1机器学习的发展历程079
4.1.2机器学习的应用领域080
4.1.3机器学习的工作原理081
4.2机器学习类型与模型评估083
4.2.1机器学习分类083
4.2.2模型评估086
4.3监督学习092
4.3.1任务与步骤092
4.3.2典型算法:线性回归、决策树模型093
4.3.3集成学习098
4.4无监督学习103
4.4.1任务与步骤103
4.4.2典型算法:k均值、因子分析、主成分分析等104
4.5案例108
本章小结111
习题111
第5章神经网络113
5.1神经网络概述113
5.1.1感知机与多层感知机114
5.1.2生物神经元114
5.1.3人工神经网络116
5.1.4激活函数117
5.1.5分类118
5.2神经网络的学习119
5.2.1学习过程119
5.2.2学习任务120
5.2.3损失函数120
5.2.4学习算法121
5.3误差反向传播121
5.3.1反向传播的过程121
5.3.2链式法则122
5.4学习优化方法123
5.4.1优化的工作原理123
5.4.2常用方法123
5.4.3梯度下降124
5.4.4随机梯度下降125
5.4.5动量法126
5.4.6AdaGrad法128
5.4.7Adam法129
5.4.8正则化130
5.5训练与评估133
5.5.1训练关键要素133
5.5.2训练流程134
5.5.3训练关键挑战134
5.5.4评估指标135
5.5.5评估过程136
5.6案例136
本章小结138
习题138
第6章卷积与循环神经网络140
6.1从全连接网络到结构化数据建模140
6.1.1全连接神经网络的局限性140
6.1.2结构化数据的特点141
6.2卷积神经网络(CNN)基础141
6.2.1CNN的生物学启发与历史发展141
6.2.2卷积操作的数学原理142
6.2.3卷积神经网络的基本结构143
6.2.4卷积层144
6.2.5池化层148
6.3典型卷积神经网络150
6.3.1LeNet150
6.3.2AlexNet151
6.3.3VGGNet152
6.3.4ResNet152
6.4循环神经网络(RNN)基础153
6.4.1序列建模的挑战与RNN动机154
6.4.2RNN的数学表达及概述154
6.4.3循环神经网络的基本结构155
6.4.4前向传播157
6.4.5反向传播157
6.5长短期记忆网络(LSTM)与门控机制158
6.5.1LSTM长短期记忆网络158
6.5.2GRU简化版门控网络161
6.5.3深度循环神经网络161
6.5.4其他门控RNN162
6.6案例163
本章小结166
习题166
第7章图神经网络模型基础168
7.1背景168
7.1.1图结构数据的动机与背景168
7.1.2图神经网络的发展历程169
7.1.3图结构与传统结构数据的对比170
7.2图的基本表示方法172
7.2.1图的定义与类型172
7.2.2邻接矩阵与邻接列表173
7.2.3图拉普拉斯矩阵174
7.2.4节点与边的特征表示175
7.3图神经网络的基本原理177
7.3.1图神经网络的基本概念177
7.3.2图神经网络的结构177
7.3.3前向传播178
7.3.4反向传播179
7.4图的池化与读出机制179
7.4.1图池化的意义与挑战179
7.4.2常用池化方法:TopKPool、SAGPool、DiffPool181
7.4.3全局池化操作181
7.5图神经网络的训练与优化184
7.5.1损失函数与训练目标184
7.5.2邻居采样策略与效率优化185
7.5.3过平滑与梯度消失问题187
7.5.4正则化与归一化技术188
7.6典型图神经网络模型189
7.6.1图卷积网络(GCN)189
7.6.2图注意力网络(GAT)190
7.6.3图同构网络(GIN)191
7.7图神经网络的案例193
本章小结194
习题194
第8章强化学习与迁移学习196
8.1强化学习的基础概念196
8.1.1强化学习的核心逻辑196
8.1.2场景描述197
8.1.3强化学习的关键难点199
8.2强化学习的核心——贝尔曼方程199
8.2.1状态价值函数的贝尔曼方程199
8.2.2动作价值函数的贝尔曼方程200
8.2.3贝尔曼优化方程200
8.3强化学习的基本方法201
8.3.1强化学习的值迭代和策略迭代201
8.3.2Q-learning与DQN203
8.4迁移学习的基础概念213
8.5迁移学习的基本方法214
8.5.1迁移学习的微调214
8.5.2深度网络自适应方法216
8.5.3深度对抗网络迁移2188.6案例221
本章小结222
习题222
第9章大语言模型基础224
9.1大语言模型概述224
9.1.1大语言模型的定义224
9.1.2大语言模型的关键特性225
9.1.3大语言模型与传统AI模型的对比227
9.2Transformer核心架构227
9.2.1Transformer的宏观结构228
9.2.2Transformer的内部模块化设计229
9.2.3Transformer的关键模块解析231
9.2.4Transformer的架构变体239
9.3大语言模型的技术优化241
9.3.1提示词工程241
9.3.2思维链242
9.3.3检索增强生成244
9.3.4量化245
9.4大语言模型生态与开发实践246
9.4.1API接口调用与应用集成246
9.4.2开源模型本地部署与关键考量因素249
9.5大语言模型应用实践251
9.5.1大语言模型的主要优势与应用领域251
9.5.2大语言模型的主要局限与潜在风险252
9.5.3人机协同的最佳实践:从辅助写作到创作伙伴253
9.6案例256
本章小结259
习题260
第10章飞桨深度学习平台及应用261
10.1概述261
10.1.1飞桨平台简介262
10.1.2飞桨的安装264
10.1.3工具组件概述265
10.2AI+工业缺陷检测行业案例267
10.2.1实际问题与任务目标268
10.2.2机理分析与解决方案268
10.2.3模型搭建与训练269
10.2.4场景迁移与验证280
本章小结287
习题287
参考文献288