spark mllib分类之如何支持向量机
发表于:2025-12-03 作者:千家信息网编辑
千家信息网最后更新 2025年12月03日,小编给大家分享一下 spark mllib分类之如何支持向量机,希望大家阅读完这篇文章之后都有所收获,下面让我们一起去探讨吧!胃癌转移数据说明肾细胞癌转移情况(有转移 y=1,无转移 y=2)x1:确
千家信息网最后更新 2025年12月03日spark mllib分类之如何支持向量机
小编给大家分享一下 spark mllib分类之如何支持向量机,希望大家阅读完这篇文章之后都有所收获,下面让我们一起去探讨吧!
胃癌转移数据说明
肾细胞癌转移情况(有转移 y=1,无转移 y=2)x1:确诊时患者年龄(岁)x2:肾细胞癌血管内皮生长因子(VEGF),其阳性表述由低到高共3个等级x3:肾细胞癌组织内微血管数(MVC)x4:肾癌细胞核组织学分级,由低到高共4级x5:肾细胞癌分期,由低到高共4级y x1 x2 x3 x4 x50 59 2 43.4 2 1
运行代码如下
package spark.logisticRegressionimport org.apache.spark.mllib.classification.{SVMWithSGD}import org.apache.spark.mllib.evaluation.MulticlassMetricsimport org.apache.spark.mllib.linalg.Vectorsimport org.apache.spark.mllib.regression.LabeledPointimport org.apache.spark.mllib.util.MLUtilsimport org.apache.spark.{SparkConf, SparkContext}/** * MLLib分类,逻辑回归,是分类,不是回归 * 支持向量机分析胃癌转移判断 * Created by eric on 16-7-17. */object SVMTest { val conf = new SparkConf() //创建环境变量 .setMaster("local") //设置本地化处理 .setAppName("LogisticRegression4") //设定名称 val sc = new SparkContext(conf) def main(args: Array[String]) { val data = MLUtils.loadLibSVMFile(sc, "./src/main/spark/logisticRegression/wa.txt") //读取数据文件,一定注意文本格式 val splits = data.randomSplit(Array(0.7, 0.3), seed = 11L) //对数据集切分 val parsedData = splits(0) //分割训练数据 val parseTtest = splits(1) //分割测试数据 val model = SVMWithSGD.train(parsedData,50) //训练模型 val predictionAndLabels = parseTtest.map { //计算测试值 case LabeledPoint(label, features) => //计算测试值 val prediction = model.predict(features) //计算测试值 (prediction, label) //存储测试和预测值 } val metrics = new MulticlassMetrics(predictionAndLabels) //创建验证类 val precision = metrics.precision //计算验证值 println("Precision = " + precision) //打印验证值 val patient = Vectors.dense(Array(70,3,180.0,4,3)) //计算患者可能性 if(patient == 1) println("患者的胃癌有几率转移。") //做出判断 else println("患者的胃癌没有几率转移。") //做出判断 //Precision = 0.5555555555555556 //患者的胃癌没有几率转移。 }}wa.txt
0 1:59 2:2 3:43.4 4:2 5:10 1:36 2:1 3:57.2 4:1 5:10 1:61 2:2 3:190 4:2 5:11 1:58 2:3 3:128 4:4 5:31 1:55 2:3 3:80 4:3 5:40 1:61 2:1 3:94 4:4 5:20 1:38 2:1 3:76 4:1 5:10 1:42 2:1 3:240 4:3 5:20 1:50 2:1 3:74 4:1 5:10 1:58 2:2 3:68.6 4:2 5:20 1:68 2:3 3:132.8 4:4 5:21 1:25 2:2 3:94.6 4:4 5:30 1:52 2:1 3:56 4:1 5:10 1:31 2:1 3:47.8 4:2 5:11 1:36 2:3 3:31.6 4:3 5:10 1:42 2:1 3:66.2 4:2 5:11 1:14 2:3 3:138.6 4:3 5:30 1:32 2:1 3:114 4:2 5:30 1:35 2:1 3:40.2 4:2 5:11 1:70 2:3 3:177.2 4:4 5:31 1:65 2:2 3:51.6 4:4 5:40 1:45 2:2 3:124 4:2 5:41 1:68 2:3 3:127.2 4:3 5:30 1:31 2:2 3:124.8 4:2 5:3
结果如图
看完了这篇文章,相信你对" spark mllib分类之如何支持向量机"有了一定的了解,如果想了解更多相关知识,欢迎关注行业资讯频道,感谢各位的阅读!
患者
数据
细胞
胃癌
测试
分类
向量
支持
几率
验证
篇文章
训练
代码
内皮
分期
变量
可能性
名称
因子
完了
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
sql怎么看存储数据库
齐齐哈尔图书馆数据库
谜语服务器
软件开发中如何量化任务
几个亿的数据用什么数据库
数据库导入无效
阿里云服务器vpc
即年指数可以在哪个数据库
沈阳新华互联网科技学校电竞
自由好玩沙雕的我的世界服务器
网络服务器建设阿帕奇错误
网络技术工程师工资多少
数据库加载模型
软件开发课程展板装饰
个人如何做好网络安全工作
如何把意识传到服务器上
合肥超盟网络技术有限公司
数据库前台开发工具
excel大量导入数据库
手游开服服务器炸了
网络安全教育团课讲义
普陀区方便软件开发服务保障
db2备份分区数据库
计算机三级网络技术自学难吗
资料库数据库
湖南智能边缘计算服务器多少钱
网信办网络技术局王崧
全市网络安全宣传视频
信息化和网络安全十四五规划
象棋对局软件开发