КЛАСТЕРНЫЙ АНАЛИЗ
(англ. cluster расти пучками, скапливаться) — один из
видов многомерного анализа, предназначенный для группировки (кластеризации) в
многомерном пространстве признаков совокупности произведенных наблюдений в
подгруппы («кластеры») согласно определенным правилам вычисления «близости»
двух групп друг к другу и определения понятия расстояния между отдельными
объектами. Методы К. а. делятся на неиерархические, позволяющие разбить весь
набор объектов на заранее определенное число классов так, что объекты одного
класса имеют большее сходство друг с другом, чем объекты разных классов, и
иерархические, с помощью которых можно последовательно установить степень
близости каждого объекта или группы объектов к одному из ранее образованных
классов и построить «дерево» (дендрограмму) последовательных объединений
объектов на разных уровнях близости. Методы К. а. оказываются весьма полезны
при проверке однородности исходной совокупности наблюдений, при попытках
упростить описание имеющейся информации путем описания «типичных»
представителей каждого кластера и сравнения их между собой и т.
д. В настоящее
время многие методы К. а. носят полуэмпирическнй характер, а результаты
группирования в значительной мере зависят от выбранного частного метода
классификации (большинство из которых имеет тенденцию к лучшему выделению
сферических скоплений точек в пространстве признаков), однако применение К.
а.
в качестве предварительного метода обработки крупных массивов наблюдений с
тщательной проверкой содержательного смысла полученных группировок может
оказаться для исследователя весьма перспективным.