python计算IV值及使用
发表于:2025-12-02 作者:千家信息网编辑
千家信息网最后更新 2025年12月02日,更多大数据分析、建模等内容请关注公众号《bigdatamodeling》在对变量分箱后,需要计算变量的重要性,IV是评估变量区分度或重要性的统计量之一,python计算IV值的代码如下:def Cal
千家信息网最后更新 2025年12月02日python计算IV值及使用
更多大数据分析、建模等内容请关注公众号《bigdatamodeling》
在对变量分箱后,需要计算变量的重要性,IV是评估变量区分度或重要性的统计量之一,python计算IV值的代码如下:
def CalcIV(Xvar, Yvar): N_0 = np.sum(Yvar==0) N_1 = np.sum(Yvar==1) N_0_group = np.zeros(np.unique(Xvar).shape) N_1_group = np.zeros(np.unique(Xvar).shape) for i in range(len(np.unique(Xvar))): N_0_group[i] = Yvar[(Xvar == np.unique(Xvar)[i]) & (Yvar == 0)].count() N_1_group[i] = Yvar[(Xvar == np.unique(Xvar)[i]) & (Yvar == 1)].count() iv = np.sum((N_0_group/N_0 - N_1_group/N_1) * np.log((N_0_group/N_0)/(N_1_group/N_1))) return iv def caliv_batch(df, Kvar, Yvar): df_Xvar = df.drop([Kvar, Yvar], axis=1) ivlist = [] for col in df_Xvar.columns: iv = CalcIV(df[col], df[Yvar]) ivlist.append(iv) names = list(df_Xvar.columns) iv_df = pd.DataFrame({'Var': names, 'Iv': ivlist}, columns=['Var', 'Iv']) return iv_df其中,df是分箱后的数据集,Kvar是主键,Yvar是y变量(0是好,1是坏)。代码运行结果如下:
变量
重要
代码
数据
重要性
公众
内容
数据分析
更多
结果
区分度
分析
统计
评估
运行
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
杭州康德软件开发有限公司
dell服务器图标
不是数据库安全的一部分
库尔勒存储服务器维保
工业机器人编程软件开发
dz数据库恢复文件夹
四川dell服务器云空间
放心的网络安全零信任安全
使命召唤国际版怎么开服务器
游戏软件开发策划书怎么写
榆树有名的网络技术哪家好
怎么样登录2006数据库
音频网络技术专业
辽宁网络时间服务器批发云主机
长春市应聘软件开发人员信息
java数据库连接池
家庭服务器 影音管理
区块链网络安全测评标准
税务干部网络安全保密承诺书
厦门松霖科技智能互联网
数据库搜索原理
安卓上传视频到服务器
服务器自动生产线哪家服务好
初学计算机网络技术看哪些书
开展网络安全法三周年宣传活动
网络安全不丢包
航瓣网络技术工作室
王者荣耀腾讯官方的服务器
共享足疗仪系统软件开发
小米k30i微信无法连接服务器