(1)ID3和C4.5的最优索引以及决策树形图是相同的,而CART的最优索引以及决策树形图与前面两者不同,这与它们的选择标准以及训练集有关; (2)但同时我们也发现,三种算法对测试集的测试结果是相同的,经过后期手动匹配,结果完全正确,这说明我们的 ...
Find-person-of-interest-from-enron-data 利用公开的安然财务和邮件数据集,利用 PCA 和特征选择分析处理缺失的数据,再通过朴素贝叶斯、决策树、SVM等机器学习构建筛选器,找出有欺诈嫌疑的安然员工 “final_project_dataset.pkl”文件是存储安然数据的字典,由公开信息整理而成。