基于周志华西瓜书中的数据集和各个机器学习模型的算法原理,采用python编写代码
一. 模型清单
- 逻辑回归
- 线性判别分析
- 决策树
- 神经网络
- 标准BP算法
- (待续)
二. 代码清单
代码中重要的部分都配有蹩脚的英文注释(T.T苦学英语ing),具体使用的数据集内容请参考代码引用和数据集清单。 - logistic_regression: 逻辑回归实现。
- linear_discriminant_analysis: 线性判别分析实现。
- decision_tree: 决策树实现,集成各个思想,包含划分方式有
信息增益
、基尼指数
,连续值的处理方式有平均值法
、二分法
,以及剪枝方法有预剪枝
、后剪枝
。 - neural_network: 神经网络实现,标准BP算法。
- (待续)
三. 数据集清单
均为csv文件,内容如下 - 西瓜数据集3.0alpha
- 西瓜数据集2.0
- 西瓜数据集3.0
才疏学浅,以上资料仅供参考,交流。