spark mlilib 聚类 KMeans怎么用
发表于:2025-12-03 作者:千家信息网编辑
千家信息网最后更新 2025年12月03日,这篇文章主要为大家展示了"spark mlilib 聚类 KMeans怎么用",内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下"spark mlilib 聚类
千家信息网最后更新 2025年12月03日spark mlilib 聚类 KMeans怎么用
这篇文章主要为大家展示了"spark mlilib 聚类 KMeans怎么用",内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下"spark mlilib 聚类 KMeans怎么用"这篇文章吧。
聚类使用场景
数据聚类是对于静态数据分析的一门技术,在许多领域内都被广泛地应用,包括机器学习、数据挖掘、模式识别、图像分析、信息检索以及生物信息等
运行代码如下
package spark.clusteringimport org.apache.spark.mllib.clustering.KMeansimport org.apache.spark.mllib.linalg.Vectorsimport org.apache.spark.{SparkContext, SparkConf}/** * 一般来说,分类是指有监督的学习,即要分类的样本是有标记的,类别是已知的; * 聚类是指无监督的学习,样本没有标记,根据某种相似度度量,将样本聚为 K类. * * 聚类KMEANS * 基本思想和核心内容就是在算法开始时随机给定若干(k)个中心,按照距离原则将样本点分配到各个中心点, * 之后按照平均法计算聚类集的中心点位置,从而重新确定新的中心点位置.这样不断地迭代下去直至聚类集内的样本满足一定的阈值为止. * * Created by eric on 16-7-21. */object Kmeans { val conf = new SparkConf() //创建环境变量 .setMaster("local") //设置本地化处理 .setAppName("KMeans") //设定名称 val sc = new SparkContext(conf) def main(args: Array[String]) { val data = sc.textFile("./src/main/spark/clustering/kmeans.txt") val parsedData = data.map(s => Vectors.dense(s.split(' ').map(_.toDouble))) .cache() val numClusters = 2 //最大分类数 val numIterations = 20 //迭代次数 val model = KMeans.train(parsedData, numClusters, numIterations) model.clusterCenters.foreach(println)//分类中心点 //[1.4000000000000001,2.0] //[3.6666666666666665,3.6666666666666665] }}kmeans.txt
1 21 11 32 23 44 32 24 4
结果如下

以上是"spark mlilib 聚类 KMeans怎么用"这篇文章的所有内容,感谢各位的阅读!相信大家都有了一定的了解,希望分享的内容对大家有所帮助,如果还想学习更多知识,欢迎关注行业资讯频道!
样本
学习
中心点
内容
分类
数据
篇文章
位置
信息
标记
分析
帮助
监督
迭代
相似
一般来说
不断
代码
原则
变量
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
数据库账号是那个
护苗网络安全教育班会教案
潮州自主可控软件开发报价行情
科密a1 支持数据库
万博伦互联网科技
网易云音乐服务器机房
四川省信用社软件开发
重庆忠县众道生鲜软件开发
网络安全一般损害
数据库拿数据到页面
姓名数据库查询系统
美橙互联数据库用户名
软件开发阶段硬件需求
超市管理软件开发
江西通用软件开发市场报价
新建数据库无权限
网络技术方面需要考证吗
网络安全 警察 知乎
可以选服务器的传奇
互联网黑科技赚钱的软件
电话拉黑会显示服务器错误
数据库打开怎么用
网络舆情网络安全领导组
web数据库开发平台
学数据库的想租一个笔记本
快消品管理软件开发公司
数据库的英文叫什么
国际游戏代理服务器
现在学软件开发有前景吗
数字货币的网络安全