RandomForest中的feature_importance--688IT编程网

RandomForest中的feature_importance

随机森林算法（RandomForest）的输出有⼀个变量是 feature_importances_ ，翻译过来是特征重要性，具体含义是什么，这⾥试着解释⼀下。

random翻译参考官⽹和其他资料可以发现，RF可以输出两种 feature_importance，分别是Variable importance和Gini importance，两者都是feature_importance，只是计算⽅法不同。

Variable importance

选定⼀个feature M，在所有OOB样本的feature M上⼈为添加噪声，再测试模型在OOB上的判断精确率，精确率相⽐没有噪声时下降了多少，就表⽰该特征有多重要。

假如⼀个feature对数据分类很重要，那么⼀旦这个特征的数据不再准确，对测试结果会造成较⼤的影响，⽽那些不重要的feature，即使受到噪声⼲扰，对测试结果也没什么影响。这就是 Variable importance ⽅法的朴素思想。

[添加噪声：这⾥官⽹给出的说法是 randomly permute the values of variable m in the oob cases，permute的含义我还不是很确定，有的说法是打乱顺序，有的说法是在数据上加⼊⽩噪声。]

Gini importance

选定⼀个feature M，统计RF的每⼀棵树中，由M形成的分⽀节点的Gini指数下降程度（或不纯度下降程度）之和，这就是M的importance。

两者对⽐来看，前者⽐后者计算量更⼤，后者只需要⼀边构建DT，⼀边做统计就可以。从sklearn的官⽅⽂档对feature_importances_参数的描述来看，sklearn应当是使⽤了Gini importance对feature进⾏排序，同时sklearn把所有的Gini importance以sum的⽅式做了归⼀化，得到了最终的feature_importances_输出参数。

发表评论

688IT编程网

RandomForest中的feature_importance

发表评论

推荐文章

试题Python等级考试——第一课word练习

详解Java中while和do-while循环、break的使用

046 C语言《程序设计综合实践I》课程设计报告

基于Labview的函数信号发生器的设计(开放性实验)

常用流程图编程方法

热门文章

pythonwhile循环结构例题

NCT-Python编程一级-模拟卷4(含答案word练习

2019山东省信息技术合格考复习题算法模块(历年真题)

2014计算机二级测试题及答案

软件工程(第五版)--习题及答案

初级python中while语句的例题算式1+2分之1+2分之3 +。。。前20项...

python的while嵌套例题

while循环python题目

选修模块算法与程序设计等级考试试题

软件工程12道习题题目练习(2013～2014-2)

程序流程图基础知识

高中数学二轮复习13 第十三编算法初步、推理与证明、复数(共51页...

英文流程图判断语句和循环语句的描述

C++循环结构实验报告流程图示例

浙教版信息技术九年级《循环结构》优质课教案附教学反思

专升本C语言历年考试题及答案

c语言while语句例题

初中英语介春节教学流程图

LabView试卷

算法与程序设计模拟试卷

最新文章

基于Labview的函数信号发生器的设计(开放性实验)

伪代码和流程图练习题

宏程序while的用法实例

wh程序死循环的语句

循环结构程序代码

编译原理课程设计报告-简单文法的编译器的设计与实现

标签列表

688IT编程网

RandomForest中的feature_importance

发表评论

推荐文章

试题Python等级考试——第一课word练习

详解Java中while和do-while循环、break的使用

046 C语言《程序设计综合实践I》课程设计报告

基于Labview的函数信号发生器的设计(开放性实验)

常用流程图编程方法

热门文章

pythonwhile循环结构例题

NCT-Python编程一级-模拟卷4(含答案word练习

2019山东省信息技术合格考复习题算法模块(历年真题)

2014计算机二级测试题及答案

软件工程(第五版)--习题及答案

初级python中while语句的例题算式1+2分之1+2分之3 +。。。前20项...

python的while嵌套例题

while循环python题目

选修模块算法与程序设计等级考试试题

软件工程12道习题题目练习(2013～2014-2)

程序流程图基础知识

高中数学二轮复习13 第十三编 算法初步、推理与证明、复数(共51页...

英文流程图判断语句和循环语句的描述

C++循环结构实验报告流程图示例

浙教版信息技术九年级《循环结构》优质课教案附教学反思

专升本C语言历年考试题及答案

c语言while语句例题

初中英语介春节教学流程图

LabView试卷

算法与程序设计模拟试卷

最新文章

基于Labview的函数信号发生器的设计(开放性实验)

伪代码和流程图练习题

宏程序while的用法实例

wh程序死循环的语句

循环结构程序代码

编译原理课程设计报告-简单文法的编译器的设计与实现

标签列表

高中数学二轮复习13 第十三编算法初步、推理与证明、复数(共51页...