spark mllib如何实现快速迭代聚类
发表于:2025-12-02 作者:千家信息网编辑
千家信息网最后更新 2025年12月02日,小编给大家分享一下spark mllib如何实现快速迭代聚类,希望大家阅读完这篇文章之后都有所收获,下面让我们一起去探讨吧!运行代码如下package spark.clusteringimport o
千家信息网最后更新 2025年12月02日spark mllib如何实现快速迭代聚类
小编给大家分享一下spark mllib如何实现快速迭代聚类,希望大家阅读完这篇文章之后都有所收获,下面让我们一起去探讨吧!
运行代码如下
package spark.clusteringimport org.apache.spark.mllib.clustering.{PowerIterationClustering}import org.apache.spark.{SparkConf, SparkContext}/** * 快速迭代聚类 * 基本原理:使用含有权重的无向线将样本数据连接在一张无向图中,之后按照相似度划分, * 使得划分后的子图内部具有最大的相似度二不同的子图具有最小的相似度从而达到聚类的效果. * 数据源要求 RDD[(Long), (Long), (Double)] * 第一个参数和第二个参数是第一个点和第二个点的编号,即其之间 ID,第三个参数是相似度计算值. * Created by eric on 16-7-21. */object PIC { val conf = new SparkConf() //创建环境变量 .setMaster("local") //设置本地化处理 .setAppName("pic") //设定名称 val sc = new SparkContext(conf) def main(args: Array[String]) { val data = sc.textFile("./src/main/spark/clustering/pic.txt") val similarities = data.map { line => val parts = line.split(" ") (parts(0).toLong, parts(1).toLong, parts(2).toDouble) } val pic = new PowerIterationClustering() .setK(2) //设置聚类数 .setMaxIterations(10) //设置迭代次数 val model = pic.run(similarities) model.assignments.foreach {a => println(s"${a.id} -> ${a.cluster}") } }}pic.txt
0 1 1.00 2 1.00 3 1.01 2 1.01 3 1.02 3 1.03 4 0.14 5 1.04 15 1.05 6 1.06 7 1.07 8 1.08 9 1.09 10 1.010 11 1.011 12 1.012 13 1.013 14 1.014 15 1.0
结果如下
看完了这篇文章,相信你对"spark mllib如何实现快速迭代聚类"有了一定的了解,如果想了解更多相关知识,欢迎关注行业资讯频道,感谢各位的阅读!
迭代
相似
参数
数据
篇文章
无向
不同
最大
最小
三个
之间
代码
原理
变量
名称
完了
效果
数据源
更多
权重
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
互联网新科技名词
魔兽世界正式服阵营服务器
腾讯安全数据库
晋宁区信息化软件开发咨询报价
苏州金融软件开发公司
同花顺服务器太忙点不开
杭州斑马网络技术有限公司
普通主板装服务器系统没有驱动
深圳关于民宿的软件开发公司
网络安全答题竞赛
佛山手机软件开发费用
网络安全基金排行
岁月如歌服务器怎么样
数据库开发工程师 面试题
德国网络安全性
网络安全专业包括计算机专业吗
网络安全开发工程师认证
数据库提示媒体结构不正确
数据库的组成有哪两部分
网络安全知识拼图手法
网络安全手机抄报
防沉迷网络安全教育视频
现场总线与网络技术
网络安全策略布控
泸州名思网络技术有限公司
数据库技术和网络技术一起考
数据库表怎么更新时间
电话突然无法连接到服务器
支部分软件开发费怎么做账
押韵网络安全顺口溜