说明
机器学习、深度学习、自然语言处理基础知识总结。
目前主要参考李航老师的《统计学习方法》一书,也有一些内容例如XGBoost、聚类、深度学习相关内容、NLP相关内容等是书中未提及的。
由于github的markdown解析器不支持latex,因此笔记部分需要在本地使用Typora才能正常浏览,也可以直接访问下面给出的博客链接。
Document文件夹下为笔记,Code文件夹下为代码,Data文件夹下为某些代码所使用的数据集,Image文件夹下为笔记部分所用到的图片。
由于时间和精力有限,部分代码来自github开源项目,如Seq2Seq、Transformer等部分的代码。
机器学习
- 线性回归(笔记)
- 感知机(笔记+代码)
- KNN(笔记+代码)
- 朴素贝叶斯(笔记+代码)
- 决策树(笔记+代码)
- 逻辑回归(笔记+代码)
- 最大熵(笔记+代码)
- SVM(笔记+代码)
- AdaBoost(笔记+代码)
- GBDT(笔记+代码)
- EM算法(笔记+代码)
- 隐马尔可夫模型(笔记+代码)
- 条件随机场(笔记)
- 随机森林(笔记+代码)
- XGBoost(笔记)
- 聚类(笔记)
- 特征工程之降维算法(笔记)
- 特征工程之特征选择(笔记)
深度学习
自然语言处理
- 词嵌入之Word2Vec(笔记)
- 词嵌入之GloVe(笔记)
- 词嵌入之FastText(笔记)
- TextCNN(笔记+代码)
- Seq2Seq(笔记+代码)
- Transformer(笔记+代码)
- BERT(笔记)
- LSTM+CRF进行序列标注(笔记)
待添加部分
- 主题模型
- LightGBM