本书前半部分以重症监护治疗室患者的数据为例介绍如何进行医学数据的预处理,如何使用机器学习模型预测患者的死亡率。本书前半部分的重点在于深度学习,内容包括神经网络的基础知识、利用卷积神经网络分类诱发电位图像、利用递归神经网络预测疾病的复发以及利用自编码算法去除图像噪音以生成新的模拟图像。本书还涉及基础医学中深度学习的应用以及如何解释机器学习模型。然而,医学实践中往往不只需要预测某个患者的某项结局,更需要知道哪些治疗能够改善结局。本书在神经网络模型之后将以脓毒症患者的治疗为例介绍强化学习的概念,从而为进入因果推断搭建桥梁。
本书最后2个专题着重讨论如何通过因果关系图直观地判断因果关系中的混杂因素、如何使用回归控制混杂因素、如何利用倾向得分控制混杂因素以及如何利用逆概率加权控制混杂因素。结合强化学习的概念,最后将讨论如何评估随时间变化的治疗,以及如何建立治疗策略。
本书可作为各级医学研究者、医学院学生和教师的参考用书。
1 机器学习基础 / 1
1.1 数据概况 / 2
1.2 数据的预处理和特征选取 / 3
1.3 缺失值的处理与插补 / 8
1.4 交叉验证 / 12
1.5 模型建立 / 13
1.6 模型比较 / 20
2 梯度提升决策树 / 23
2.1 超参数 / 26
2.2 特征重要性 / 32
2.3 模型的临床应用 / 33
2.4 模型集成 / 35
2.5 机器学习的报告要点 / 38
3 聚类算法 / 41
3.1 各种聚类算法 / 42
3.2 主成分分析 / 46
3.3 聚类算法的直观显示 / 48
4 神经网络 / 51
4.1 感知器 / 52
4.2 全连接神经网络的训练 / 53
4.3 控制过拟合 / 58
4.4 公开数据来源 / 61
5 卷积神经网络 / 67
5.1 卷积运算 / 68
5.2 池化运算 / 71
5.3 简单卷积神经网络的构建和训练 / 71
5.4 图像样本量扩大 / 78
5.5 迁移学习 / 81
5.6 可解释的卷积神经网络 / 86
5.7 开放图像数据库 / 88
5.8 卷积神经网络的意义与不足 / 89
6 自编码和对抗生成神经网络 / 91
6.1 自编码算法基础 / 92
6.2 自编码算法降噪 / 97
6.3 变分自编码算法 / 100
6.4 变分自编码算法生成虚拟图像 / 104
6.5 对抗生成神经网络生成虚拟图像 / 105
7 递归神经网络 / 107
7.1 递归神经网络原理 / 108
7.2 递归神经网络构建 / 109
7.3 长短期记忆网络 / 111
7.4 门控递归神经网络 / 113
7.5 LSTM和GRU的构建 / 113
7.6 卷积神经网络和递归神经网络的叠加 / 115
8 自然语言处理和电子病历 / 119
8.1 从单词到向量 / 120
8.2 利用传统自然语言处理寻找脑外伤患者 / 122
8.3 利用神经网络寻找脑外伤患者 / 125
8.4 电子病历系统中神经网络的应用 / 131
9 可解释的机器学习 / 133
9.1 预测蛋白-蛋白间结合 / 134
9.2 预测基因-蛋白间结合 / 139
9.3 机器学习的解释 / 145