基于周志华西瓜书中的数据集和各个机器学习模型的算法原理,采用python编写代码
- 逻辑回归
- 线性判别分析
- 决策树
- 划分选择
- 基于信息增益
- 基于基尼指数
- 剪枝
- 预剪枝
- 后剪枝
- 划分选择
- 神经网络
- 标准BP算法
- 朴素贝叶斯
- 拉普拉斯变换
- (待续)
代码中重要的部分都配有蹩脚的英文注释(T.T苦学英语ing),具体使用的数据集内容请参考代码引用和数据集清单。
- logistic_regression: 逻辑回归实现。
- linear_discriminant_analysis: 线性判别分析实现。
- decision_tree: 决策树实现,集成各个**,包含划分方式有
信息增益
、基尼指数
,连续值的处理方式有平均值法
、二分法
, 以及剪枝方法有预剪枝
、后剪枝
。 - neural_network: 神经网络实现,标准BP算法。
- naive_bayes_classifier: 朴素贝叶斯实现,采用了拉普拉斯变换。
- (待续)
均为csv文件,内容如下
作者才疏学浅,以上资料仅供参考,交流。