课程导师
安迪老师
现任某行业头部数据分析咨询公司
高级数据建模师
毕业于新加坡国立大学统计系,多年数据分析
领域从业经验,有丰富的数据分析、统计建
模、数据产品研发的实战经验。曾在国际知名
期刊上发表数篇应用统计论文,在2016一
2018年间于某211财经大学统计学院担任硕
士生业界兼职导师。
课程亮点
风控常用分析算法一课搞定
帮助你拓展分析思路和方法
增大能力边界
课程包括:线性回归、广义线性回归、模型性
能评估、决策树与随机森林、ADABOOST模
型和GBDT模型、XGBOOSTING模型和
LIGHTGBM模型、聚类模型、深度学习模
型、风控场景中的前沿模型等。
风控场景案例
快速掌握并直接解决工作问题
每个算法均配合风险场景案例,帮助理解算法
应用;提供代码,赋能学员,直接解决工作中
的问题。如聚类模型中会以「风险中客户分
群」为案例。
成长为offer收割机
包含面试常见问题,提高面试通过率
例如,“缺失值如何处理?”“如何进行客户
分群”“过拟合和欠拟合怎么产生和如何避
免”等高频面试问题都可以在这门课得到答
案。
课程大纲
第一节:概率统计的基础知识
·概率与统计的初窥
·离散型随机变量及其分布
·连续型随机变量及其分布
·条件概率
·全概率公式
·联合分布
·边缘分布
·贝叶斯定理
·参数估计的方法:点估计
·参数估计的方法:极大似然估计
·案例:经典统计学小问题
第一节:概率统计的基础知识
·概率与统计的初窥
·离散型随机变量及其分布
·连续型随机变量及其分布
·条件概率
·全概率公式
·联合分布
·边缘分布
·贝叶斯定理
·参数估计的方法:点估计
·参数估计的方法:极大似然估计
·案例:经典统计学小问题
第二节:线性回归模型
·什么是回归
·一元线性回归模型基本概念
·最小二乘法估计一元线性回归模型
的参数
·极大似然估计法估计一元线性回归
模型的参数
·多元线性回归的基本概念
·多元线性回归的参数估计
·线性回归模型中的假设检验
·逐步回归法挑选变量
·案例:线性回归模型填补缺失值
第三节:广义线性回归模型
·广义线性回归模型的介绍与指数族
分布的概念
·什么是逻辑回归模型
·逻辑回归模型的参数估计
·多分类场景下的逻辑回归模型
·什么是泊松回归
·什么是回归
·一元线性回归模型基本概念
·最小二乘法估计一元线性回归模型
的参数
·极大似然估计法估计一元线性回归
模型的参数
·多元线性回归的基本概念
·多元线性回归的参数估计
·线性回归模型中的假设检验
·逐步回归法挑选变量
·案例:线性回归模型填补缺失值
第三节:广义线性回归模型
·广义线性回归模型的介绍与指数族
分布的概念
·什么是逻辑回归模型
·逻辑回归模型的参数估计
·多分类场景下的逻辑回归模型
·什么是泊松回归
·泊松回归模型的参数估计
·案例:泊松回归模型预测信用卡申
请人数
第四节:模型性能评估
·过拟合与欠拟合
·训练集、测试集、验证集的基本概
念
·K-折交叉验证法
·回归场景下的模型性能度量及损失
函数
·分类场景下的模型性能度量及损失
函数
·案例:逻辑回归模型的性能检验
第五节:决策树与随机森林
·决策树模型基本概念
·基于分而治之法的决策树模型的构
造
·决策树的剪枝
·随机森林模型的基本概念
·随机森林模型的调参
·基于随机森林模型的变量重要性评
估
·延申:模型集成的思想
·案例:随机森林预测客户流失风险
第六节:
AdaBoost模型和GBDT模型
·Boosting模型的介绍
·AdaBoost模型的基本概念与构造
·GBDT模型的基本概念与构造
·GBDT模型的调参
·基于GBDT的变量重要性评估
·AdaBoost模型和GBDT模型的对比
·案例:泊松回归模型预测信用卡申
请人数
第四节:模型性能评估
·过拟合与欠拟合
·训练集、测试集、验证集的基本概
念
·K-折交叉验证法
·回归场景下的模型性能度量及损失
函数
·分类场景下的模型性能度量及损失
函数
·案例:逻辑回归模型的性能检验
第五节:决策树与随机森林
·决策树模型基本概念
·基于分而治之法的决策树模型的构
造
·决策树的剪枝
·随机森林模型的基本概念
·随机森林模型的调参
·基于随机森林模型的变量重要性评
估
·延申:模型集成的思想
·案例:随机森林预测客户流失风险
第六节:
AdaBoost模型和GBDT模型
·Boosting模型的介绍
·AdaBoost模型的基本概念与构造
·GBDT模型的基本概念与构造
·GBDT模型的调参
·基于GBDT的变量重要性评估
·AdaBoost模型和GBDT模型的对比
·案例:GBDT模型预测客户流失风险
第七节:XGBoosting模型和
LightGBM模型
·XGBoosting模型的基本概念与构造
·XGBoosting模型的优缺点
·LightGBM模型的基本概念与构造
·LightGBM模型的技巧
·XGBoosting模型和LightGBM模型
的调参
·XGBoosting模型和LightGBM模型
的对比
·案例:LightGBM模型预测客户违
约概率
第八节:聚类模型
·聚类的三种场景:有监督聚类、无
监督聚类和半监督聚类
·距离的基本概念
第七节:XGBoosting模型和
LightGBM模型
·XGBoosting模型的基本概念与构造
·XGBoosting模型的优缺点
·LightGBM模型的基本概念与构造
·LightGBM模型的技巧
·XGBoosting模型和LightGBM模型
的调参
·XGBoosting模型和LightGBM模型
的对比
·案例:LightGBM模型预测客户违
约概率
第八节:聚类模型
·聚类的三种场景:有监督聚类、无
监督聚类和半监督聚类
·距离的基本概念
·K-均值模型
·K-邻近模型
·KD树的基本概念
·密度聚类模型介绍
·层次聚类模型介绍
·案例:客群分群
第九节:深度学习模型入门
·神经网络模型简介
·常用的激活函数的介绍
·反向传播法
·神经网络模型如何避免过拟合
·卷积神经网络模型简介
·循环神经网络模型简介
·LSTM模型简介
·案例:信用卡客户违约预测
·K-邻近模型
·KD树的基本概念
·密度聚类模型介绍
·层次聚类模型介绍
·案例:客群分群
第九节:深度学习模型入门
·神经网络模型简介
·常用的激活函数的介绍
·反向传播法
·神经网络模型如何避免过拟合
·卷积神经网络模型简介
·循环神经网络模型简介
·LSTM模型简介
·案例:信用卡客户违约预测
第十节:
风控场景中的前沿模型
·生成对抗模型
·迁移学习模型
•小样本学习
·标签不充足问题
·案例:正标签缺失下的违约预测模
型开发
·案例:信用卡客户违约预测
风控场景中的前沿模型
·生成对抗模型
·迁移学习模型
•小样本学习
·标签不充足问题
·案例:正标签缺失下的违约预测模
型开发
·案例:信用卡客户违约预测