python怎么实现随机森林
发表于:2025-12-02 作者:千家信息网编辑
千家信息网最后更新 2025年12月02日,这篇文章主要介绍了python怎么实现随机森林的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇python怎么实现随机森林文章都会有所收获,下面我们一起来看看吧。背景介绍随
千家信息网最后更新 2025年12月02日python怎么实现随机森林
这篇文章主要介绍了python怎么实现随机森林的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇python怎么实现随机森林文章都会有所收获,下面我们一起来看看吧。
背景介绍
随机森林是一组决策树的商标术语。在随机森林中,我们收集了决策树(也称为"森林")。为了基于属性对新对象进行分类,每棵树都有一个分类,我们称该树对该类"投票"。森林选择投票最多的类别(在森林中的所有树木上)。
每棵树的种植和生长如下:
如果训练集中的案例数为N,则随机抽取N个案例样本,但要进行替换。 该样本将成为树木生长的训练集。
如果有M个输入变量,则指定数字m << M,以便在每个节点上从M个中随机选择m个变量,并使用对这m个变量的最佳分割来分割节点。在森林生长期间,m的值保持恒定。
每棵树都尽可能地生长。没有修剪。

入门示例
python代码实现:
'''The following code is for the Random ForestCreated by - ANALYTICS VIDHYA'''# importing required librariesimport pandas as pdfrom sklearn.ensemble import RandomForestClassifierfrom sklearn.metrics import accuracy_score# read the train and test datasettrain_data = pd.read_csv('train-data.csv')test_data = pd.read_csv('test-data.csv')# view the top 3 rows of the datasetprint(train_data.head(3))# shape of the datasetprint('\nShape of training data :',train_data.shape)print('\nShape of testing data :',test_data.shape)# Now, we need to predict the missing# target variable in the test data# target variable - Survived# seperate the independent and target variable on training datatrain_x = train_data.drop(columns=['Survived'],axis=1)train_y = train_data['Survived']# seperate the independent and target variable on testing datatest_x = test_data.drop(columns=['Survived'],axis=1)test_y = test_data['Survived']'''Create the object of the Random Forest modelYou can also add other parameters and test your code hereSome parameters are : n_estimators and max_depthDocumentation of sklearn RandomForestClassifier:https://scikit-learn.org/stable/modules/generated/sklearn.ensemble.RandomForestClassifier.html'''model = RandomForestClassifier()# fit the model with the training datamodel.fit(train_x,train_y)# number of trees usedprint('Number of Trees used : ', model.n_estimators)# predict the target on the train datasetpredict_train = model.predict(train_x)print('\nTarget on train data',predict_train)# Accuray Score on train datasetaccuracy_train = accuracy_score(train_y,predict_train)print('\naccuracy_score on train dataset : ', accuracy_train)# predict the target on the test datasetpredict_test = model.predict(test_x)print('\nTarget on test data',predict_test)# Accuracy Score on test datasetaccuracy_test = accuracy_score(test_y,predict_test)print('\naccuracy_score on test dataset : ', accuracy_test)
运行结果:
Shape of training data : (712, 25)Shape of testing data : (179, 25)Number of Trees used : 10Target on train data [0 1 1 0 0 0 0 0 0 0 0 1 1 1 0 0 1 0 0 1 0 0 1 0 0 0 0 0 0 1 1 0 0 1 0 0 01 0 0 0 1 0 1 0 1 1 0 1 0 1 0 0 0 0 0 0 0 1 0 1 1 1 0 0 1 0 01 0 0 0 0 00 1 1 0 0 1 0 0 1 1 1 0 0 0 1 0 1 0 0 1 0 0 0 1 1 0 0 1 0 1 11 0 1 0 0 00 0 0 1 1 0 0 1 0 1 0 1 1 0 0 0 1 0 0 1 0 0 0 1 0 1 0 1 0 0 00 1 0 1 1 00 0 0 1 1 0 0 1 0 0 0 0 1 0 0 1 1 0 1 1 0 0 0 0 0 0 0 1 0 0 00 0 1 0 0 10 1 1 1 1 0 0 1 0 1 0 0 1 1 1 1 0 0 0 1 1 1 1 0 0 0 0 1 1 0 00 1 0 0 0 00 0 0 0 1 0 0 0 1 0 1 0 0 0 0 1 0 0 0 1 0 1 0 1 0 0 0 1 1 1 01 0 0 0 1 00 1 1 0 1 1 1 0 1 1 0 0 1 0 0 1 1 1 1 0 0 1 0 0 0 1 1 0 0 1 10 0 0 0 0 00 0 1 1 0 1 1 0 1 0 1 1 1 0 0 0 1 0 1 1 0 0 0 0 1 0 1 0 0 0 00 0 0 0 0 11 0 0 1 1 0 1 0 0 0 1 0 1 0 0 0 1 0 1 0 0 1 0 1 0 0 0 1 0 1 00 0 0 0 1 00 0 0 0 0 0 1 0 0 1 0 1 0 0 1 0 0 1 1 0 0 0 0 1 0 0 1 1 1 1 01 1 0 1 1 10 1 1 1 0 0 0 0 0 0 0 0 1 1 1 1 0 0 1 0 1 1 0 0 1 0 1 0 1 1 11 0 0 1 0 00 1 0 0 0 0 0 1 1 0 0 1 1 0 1 0 1 0 1 0 1 0 0 0 0 0 0 0 1 1 10 0 0 0 0 00 0 1 1 1 0 0 1 0 1 1 0 1 0 0 0 1 1 1 0 1 0 0 0 0 0 0 0 0 0 00 0 0 1 0 11 0 0 0 0 1 0 0 0 1 0 1 0 1 1 1 0 0 0 0 0 0 1 1 1 0 0 1 1 1 01 0 1 0 0 10 0 0 1 1 0 0 1 0 0 1 0 1 0 0 1 0 0 1 1 0 0 1 1 0 1 0 0 0 0 11 0 1 1 1 01 0 1 0 1 1 0 1 0 1 0 0 1 0 0 1 0 1 1 0 1 0 0 0 1 0 1 0 0 0 00 0 0 0 0 10 0 0 1 0 1 1 1 1 0 1 1 0 0 1 0 1 0 0 1 0 0 1 1 1 1 0 1 0 0 01 0 1 1 1 01 0 0 0 1 0 0 1 0 0 1 0 1 0 0 1 1 0 0 1 0 0 0 0 0 0 1 0 0 0 00 0 1 0 1 01 0 1 1 1 0 0 1 0]accuracy_score on train dataset : 0.973314606741573Target on test data [0 0 0 1 1 0 0 0 0 0 0 1 1 0 0 0 0 0 0 0 01 1 1 1 0 0 1 0 1 1 0 1 0 1 1 00 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 1 1 1 0 1 1 0 0 1 1 1 0 0 0 00 1 0 0 0 01 0 0 0 0 0 0 0 0 1 0 0 1 1 0 1 0 0 1 0 1 0 0 0 1 0 0 0 0 0 11 0 1 1 0 10 1 0 0 0 1 1 1 1 1 0 1 1 0 1 1 0 0 1 1 0 0 1 1 0 0 0 1 0 1 00 0 0 0 0 00 0 0 1 1 0 0 0 0 1 0 0 1 1 0 0 0 0 1 0 1 0 1 1 0 1 0 0 0 0 0]accuracy_score on test dataset : 0.8156424581005587
关于"python怎么实现随机森林"这篇文章的内容就介绍到这里,感谢各位的阅读!相信大家对"python怎么实现随机森林"知识都有一定的了解,大家如果还想学习更多知识,欢迎关注行业资讯频道。
森林
变量
知识
内容
树木
样本
篇文章
节点
决策
分类
投票
训练
选择
恒定
代码
价值
商标
对象
尽可能
属性
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
天希网络安全教育
秦皇岛共享折叠床软件开发
飘零服务器怎么搭建
万户网络技术有限公司食堂
沙坪坝区企业网络技术服务礼仪
cnki数据库教程ppt
广州蜂巢互联网科技
成都苹果手机软件开发收费多少
软件开发硬件开发是什么
数据库用户权限修改
软件开发哪个研究生学校好
金山区创新数据库服务商前景
百度软件开发产品经理
供电所网络安全整治排查
vfstpd服务器安全
汕头通讯软件开发价格比较
数据库18 1 字节
服务器的任务管理器没有
网络安全手抄报漫画版
文件存储的数据库
软件开发的原型过程模型
服务器如何设置防护
苹果id账号密码数据库
服务器上的hdd亮红灯
电子商务网络安全支付问题
金山区创新数据库服务商前景
一个数据库有多少主键
软件开发远程培训
销售软件开发票开什么类目
战地五为什么连接不上ea服务器