孤立森林因其在不同基准测试中的普遍有效性和强大的可扩展性而成为近年来最受欢迎的异常检测器之一。它具有计算效率,并且已被证明在异常检测中非常有效。

孤立森林与其他森林的比较( src )
该算法通过随机选择一个特征,然后在所选特征的最大值和最小值之间随机选择一个分割值来隔离观察值。因此,该实现与分区树和引导树相同,不同之处在于目标函数应该是均匀的(尝试用恒定的 Y 值分割变量)。
然而,如果你在 JMP 中尝试这个,它不起作用。
通过在 JMP 中加入孤立森林,类似预测因子筛选,用户可以使用强大的工具来检测数据中的异常。这可以帮助他们识别可能需要进一步调查的异常模式或行为。
本文研究了 IForest 的工作原理并改进了它的一些局限性(即扩展隔离森林)
https://hal.science/hal-03537102/document
Scikit-learn 文档
https://scikit-learn.org/stable/modules/outlier_detection.html