• 首页 首页 icon
  • 工具库 工具库 icon
    • IP查询 IP查询 icon
  • 内容库 内容库 icon
    • 快讯库 快讯库 icon
    • 精品库 精品库 icon
    • 问答库 问答库 icon
  • 更多 更多 icon
    • 服务条款 服务条款 icon

层次聚类、k_means聚类-python源码

武飞扬头像
我也想搞机器学习
帮助1

聚类就是对大量未知标注的数据集,按数据的内在相似性将数据集划分为多个类别,使类别内的数据相似度较大而类别间的数据相似度较小。以空间中k个点为中心进行聚类,对最靠近他们的对象归类。逐次计算各簇中心的值为新的中心值,迭代更新,直至簇中心位置不再改变或者达到最大迭代次数。由这个定义,我们便可以知道,数据集并没有目标值。因此聚类算法属于无监督算法。

三特征值输入,单结果输出聚类。内含数据集、代码,可直接运行。

内含注释,结构清晰,代码简单,傻瓜式操作。

部分数据集:

学新通

部分代码:

  1.  
    #聚类总程序,可以用于k_means聚类、层次聚类
  2.  
    import pandas
  3.  
    from sklearn.metrics import silhouette_score
  4.  
    from XJ_machine_learning1 import *
  5.  
     
  6.  
    xj_plt_init()
  7.  
    jl_type='kmeans';test_num=500;open_save=1
  8.  
    filename_xlsx= 'jldata.xls'
  9.  
    filename_savetraintest='jl' jl_type '_1_0.csv';filename_savetrain= 'jl' jl_type '_1_1.csv';filename_savetest= 'jl' jl_type '_1_2.csv'
  10.  
    data=pandas.read_excel(filename_xlsx , header=0)
  11.  
    #1计算距离
  12.  
    data_distance=sch.distance.pdist(data,'euclidean')#欧氏距离产计算距离矩阵
  13.  
    Z=sch.linkage(data_distance,'average')
  14.  
    #1寻找最优分类数量
  15.  
    class_list=[2, 3, 4, 5, 6, 7]
  16.  
    class_scores=[]
学新通

 数据原图:

学新通

聚类结果图:

学新通

源码下载地址: 

链接:https://pan.百度.com/s/1Hzk0trmkdHr0GfmBjk2KGA 
提取码:6666

-------------------------------------------------------我的其他代码--------------------------------------------------------

粒子群算法优化BP神经网络-matlab源码

粒子群算法优化BP和Elman神经网络-matlab源码

头脑风暴算法优化BP神经网络-matlab源码

Adaboost-python手推源码不调用库-有手就会

这篇好文章是转载于:学新通技术网

  • 版权申明: 本站部分内容来自互联网,仅供学习及演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,请提供相关证据及您的身份证明,我们将在收到邮件后48小时内删除。
  • 本站站名: 学新通技术网
  • 本文地址: /boutique/detail/tanhghfekc
系列文章
更多 icon
同类精品
更多 icon
继续加载