当前位置:Gxlcms > 数据库问题 > 一条SQL搞定信息增益的计算

一条SQL搞定信息增益的计算

时间:2021-07-01 10:21:17 帮助过:15人阅读

数据表结构如下:

技术分享

关键步骤说明:

KeyStep1:各特征的熵计算

技术分享

KeyStep2:各feature下的信息增熵

技术分享

信息增益计算结果:

技术分享

结束语:

以上为信息熵计算过程的SQL版本,其关键点在于使用cube实现了feature和label所需要的汇总计算。需要的同学只需要按照规定的表结构填入数据,修改SQL代码即可计算信息增益。文中如有不足的地方,还请各位指正。

参考文档

[1] 算法杂货铺——分类算法之决策树(Decision tree)

http://www.cnblogs.com/leoo2sk/archive/2010/09/19/decision-tree.html

[2] c4.5为什么使用信息增益比来选择特征?

https://www.zhihu.com/question/22928442

 

相关推荐

 

一条SQL搞定卡方检验计算
【腾讯云的1001种玩法】自建SQL Server迁移云SQL Server过程小记
小菜鸟对周志华大神gcForest的理解


此文已由作者授权腾讯云技术社区发布,转载请注明文章出处
原文链接:https://www.qcloud.com/community/article/826876001491038171
获取更多腾讯海量技术实践干货,欢迎大家前往腾讯云技术社区

 

一条SQL搞定信息增益的计算

标签:count   防止   介绍   ase   大神   不同   计数   影响   干货   

人气教程排行