网站首页 > 技术文章正文

【Python机器学习系列】一文教你实现决策树模型可视化(案例)

btikc 2024-12-19 11:37:22 技术文章 24 ℃ 0 评论

这是我的第335篇原创文章。

决策树是一个有监督分类模型，本质是选择一个最大信息增益的特征值进行输的分割，直到达到结束条件或叶子节点纯度达到阈值。根据分割指标和分割方法，可分为：ID3、C4.5、CART算法。每一种颜色代表一个class，link的宽度表示从一个节点流向另一个节点的items数量。

需要安装第三方库：

pip install pybaobabdt
pip install pygraphviz

data = pd.read_csv(r'Dataset.csv')
df = pd.DataFrame(data)
print(df.head())

df：

target = 'target'
features = df.columns.drop(target)
print(data["target"].value_counts()) # 顺便查看一下样本是否平衡

X_train, X_test, y_train, y_test = train_test_split(df[features], df[target], test_size=0.2, random_state=0)

model = DecisionTreeClassifier(max_depth=5)
model.fit(X_train, y_train)

ax = pybaobabdt.drawTree(model, size=10, dpi=300, features=features) #可视化主函数pybaobabdt.drawTree
plt.show()

结果：

作者简介：读研期间发表6篇SCI数据算法相关论文，目前在某研究院从事数据算法相关研究工作，结合自身科研实践经历持续分享关于Python、数据分析、特征工程、机器学习、深度学习、人工智能系列基础知识与案例。关注gzh：数据杂坛，获取数据和源码学习更多内容。

原文链接：

【Python机器学习系列】一文教你实现决策树模型可视化（案例+源码）