关于JMP聚类使用过程出现的两个疑问
我正在使用JMPpro进行一项样本量约10000份、包含20个变量的无监督机器学习聚类分析。在使用过程中出现了一些疑问,特此前来请教其他使用者或工程师,感谢你们能够抽出宝贵的时间阅读并耐心分析解答我的问题! 疑问一:我已认真阅读该软件聚类分析功能介绍,JMP中的层次聚类适用于小样本的任意数据类型。那么,若数据中的20个变量分别属于混合型数据(包含连续型变量、离散型变量、有序型变量、名义型变量),请问我在进行层次聚类时是否需要事先把连续型变量和离散型变量进行标准化处理,随后在【标准化依据】选择“未标准化”呢?还是选择“未标准化”后软件会自动识别连续型变量和离散型变量并进行标准化处理,且有序型变量和名义型变量保持原始值呢(即无需在层次聚类前事先手动标准化处理)? 疑问二:聚类分析属于机器学习中的无监督学习,若将19个变量进行层次聚类时,并在【依据】设置了某个(1个)二元名义型变量。那么,此次分...