如何用几行代码做特征选择
发表于:2025-12-01 作者:千家信息网编辑
千家信息网最后更新 2025年12月01日,from sklearn.feature_selection import RFEfrom sklearn.linear_model import LinearRegression#Load bost
千家信息网最后更新 2025年12月01日如何用几行代码做特征选择
from sklearn.feature_selection import RFEfrom sklearn.linear_model import LinearRegression#Load boston housing dataset as an exampleX = np.array(train1[feature_use].fillna(-1))[1:train1.size,:]Y = np.array(train1['target'])[1:train1.size]#print(X)#print(Y)names = feature_use#use linear regression as the modellr = LinearRegression()#rank all features, i.e continue the elimination until the last onerfe = RFE(lr, n_features_to_select=1)rfe.fit(X,Y)print("Features sorted by their score:")#print(sorted(zip(map(lambda x: round(x, 4), rf.feature_importances_), names), reverse=True))sortedlist = sorted(zip(map(lambda x: round(x, 4), rfe.ranking_), names), reverse=True)print(sortedlist)feature_use = []for index in sortedlist[len(sortedlist)-70 : ]: if index[0]>0: feature_use.append(index[1])print(feature_use)上面的X为数据集的特征集合 Y为标签集合
在sortlist里对特征的重要性进行了排序
最近做机器学习的一点感悟是,特征的影响远比模型参数来的大,特征是现实世界在算法中的倒影。
在特征工程中要对业务有非常深的理解,强调返璞归真,删除无效特征,减少引起干扰的特征。
加特征的过程需要一个一个来,还要多思考这些特征之间的关系,是否是强烈线性相关的。
# random forest select features'''from sklearn.ensemble import RandomForestRegressorimport numpy as np#Load boston housing dataset as an exampleX = np.array(train1[feature_use].fillna(-1))[1:train1.size,:]Y = np.array(train1['target'])[1:train1.size]print(X)print(Y)names = feature_userf = RandomForestRegressor()rf.fit(X, Y)print("Features sorted by their score:")print(sorted(zip(map(lambda x: round(x, 4), rf.feature_importances_), names), reverse=True))'''
特征
重要
返璞归真
世界
业务
之间
倒影
参数
工程
数据
机器
标签
模型
现实
算法
线性
过程
重要性
面的
加特
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
武汉供应管理系统软件开发公司
滕道数据库
服务器人员面试题
5g网络安全社会意义
网络安全法第十条
罗永浩谈网络技术
魔兽怀旧哪个服务器比较挣钱
网络安全对青少年的教育意义
堡垒之夜服务器返回配置查询
网络安全与执法可以考一建吗
12306站点数据库
商加互联网科技有限公司
邯郸进销存软件开发多少钱
pg数据库接口封装开源
数据库的介绍
安捷伦软件开发
手机网络安全动漫图
人渣怎么在游戏里看服务器
拓维信息 鸿蒙服务器
梦幻西游服务器排名阶梯2021
嵌入式系统软件开发的就业
网站架构服务器
查看运行web服务器的账号
网警开展网络安全检查的举措
自购服务器怎样搭建
龙岗软件开发找健亚网络科技
滨海新区网络技术售后保障
有数据库中级证能评职称吗
浙江英雄联盟服务器云主机
虚拟主机可以开mc服务器吗