spark mllib 分类预测之如何实现逻辑回归
发表于:2025-12-02 作者:千家信息网编辑
千家信息网最后更新 2025年12月02日,这篇文章主要为大家展示了"spark mllib 分类预测之如何实现逻辑回归 ",内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下"spark mllib 分类预
千家信息网最后更新 2025年12月02日spark mllib 分类预测之如何实现逻辑回归
这篇文章主要为大家展示了"spark mllib 分类预测之如何实现逻辑回归 ",内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下"spark mllib 分类预测之如何实现逻辑回归 "这篇文章吧。
胃癌转移数据说明
肾细胞癌转移情况(有转移 y=1,无转移 y=2)x1:确诊时患者年龄(岁)x2:肾细胞癌血管内皮生长因子(VEGF),其阳性表述由低到高共3个等级x3:肾细胞癌组织内微血管数(MVC)x4:肾癌细胞核组织学分级,由低到高共4级x5:肾细胞癌分期,由低到高共4级y x1 x2 x3 x4 x50 59 2 43.4 2 1
运行代码如下
package spark.logisticRegressionimport org.apache.spark.mllib.classification.LogisticRegressionWithSGDimport org.apache.spark.mllib.evaluation.MulticlassMetricsimport org.apache.spark.mllib.linalg.Vectorsimport org.apache.spark.mllib.regression.LabeledPointimport org.apache.spark.mllib.util.MLUtilsimport org.apache.spark.{SparkConf, SparkContext}/** * MLLib分类,逻辑回归,是分类,不是回归 * 胃癌转移判断 * Created by eric on 16-7-17. */object LogisticRegression4 { val conf = new SparkConf() //创建环境变量 .setMaster("local") //设置本地化处理 .setAppName("LogisticRegression4")//设定名称 val sc = new SparkContext(conf) def main(args: Array[String]) { val data = MLUtils.loadLibSVMFile(sc, "./src/main/spark/logisticRegression/wa.txt") //读取数据文件,一定注意文本格式 val splits = data.randomSplit(Array(0.7, 0.3), seed = 11L) //对数据集切分 val parsedData = splits(0) //分割训练数据 val parseTtest = splits(1) //分割测试数据 val model = LogisticRegressionWithSGD.train(parsedData,50) //训练模型 val predictionAndLabels = parseTtest.map {//计算测试值 case LabeledPoint(label, features) => //计算测试值 val prediction = model.predict(features)//计算测试值 (prediction, label) //存储测试和预测值 } val metrics = new MulticlassMetrics(predictionAndLabels)//创建验证类 val precision = metrics.precision //计算验证值 println("Precision = " + precision) //打印验证值 val patient = Vectors.dense(Array(70,3,180.0,4,3)) //计算患者可能性 val prediction = model.predict(patient) if(prediction == 1) println("患者的胃癌有几率转移。")//做出判断 else println("患者的胃癌没有几率转移。") //做出判断 //Precision = 0.3333333333333333 //患者的胃癌没有几率转移。 }}wa.txt
0 1:59 2:2 3:43.4 4:2 5:10 1:36 2:1 3:57.2 4:1 5:10 1:61 2:2 3:190 4:2 5:11 1:58 2:3 3:128 4:4 5:31 1:55 2:3 3:80 4:3 5:40 1:61 2:1 3:94 4:4 5:20 1:38 2:1 3:76 4:1 5:10 1:42 2:1 3:240 4:3 5:20 1:50 2:1 3:74 4:1 5:10 1:58 2:2 3:68.6 4:2 5:20 1:68 2:3 3:132.8 4:4 5:21 1:25 2:2 3:94.6 4:4 5:30 1:52 2:1 3:56 4:1 5:10 1:31 2:1 3:47.8 4:2 5:11 1:36 2:3 3:31.6 4:3 5:10 1:42 2:1 3:66.2 4:2 5:11 1:14 2:3 3:138.6 4:3 5:30 1:32 2:1 3:114 4:2 5:30 1:35 2:1 3:40.2 4:2 5:11 1:70 2:3 3:177.2 4:4 5:31 1:65 2:2 3:51.6 4:4 5:40 1:45 2:2 3:124 4:2 5:41 1:68 2:3 3:127.2 4:3 5:30 1:31 2:2 3:124.8 4:2 5:3
结果如图
以上是"spark mllib 分类预测之如何实现逻辑回归 "这篇文章的所有内容,感谢各位的阅读!相信大家都有了一定的了解,希望分享的内容对大家有所帮助,如果还想学习更多知识,欢迎关注行业资讯频道!
分类
患者
数据
细胞
胃癌
测试
逻辑
内容
几率
篇文章
验证
学习
帮助
训练
代码
内皮
分期
变量
可能性
名称
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
服务器连接显示屏
超级人类哪个服务器
互联网科技有限公司职位
数据库落地
吉天下网络技术有限公司
网络安全的安全教育论文
网络安全到基层工作
全国网络安全空间学院
竞技世界网络技术公司旗下游戏
智慧食堂整体解决方案软件开发
关于网络安全管理的请示
天津网络安全实验室
数据库db2备份
宁波掌上联英科创网络技术
数据库计算一阶差分
网络技术应用教案广教版
中国网络安全法英文版
福建定制软件开发服务商
海康服务器激活反馈文件下载不了
网络安全巡演
区块链竞拍软件开发
幸运方块无法连接至服务器
新招录辅警网络安全
服务器异常500ml有哪些原因
织密网络安全防火墙
战争前线哪个服务器
中职学什么以后可以学软件开发
使用者从软件开发工具得到
易语言远程数据库操作
网络技术英文专业术语