ГЛАВНЫХ КОМПОНЕНТ МЕТОД
— один
из вариантов факторного анализа, используемый для «сжатия» информации,
содержащейся в выборке многомерных данных при условии сохранения большей части
их дисперсии. Сущность метода сводится к тому, что в многомерном пространстве
признаков, где каждая точка соответствует наблюдению, вводятся новые оси координат
так, что дисперсия проекций наблюдений на первую ось максимальна, вторая ось
перпендикулярна к первой и дисперсия проекций на нее максимальна из всех
оставшихся вариантов и т. д. Математический смысл этой операции состоит в том,
что вместо старых, непосредственно наблюдаемых и коррелированных друг с другом
переменных вводятся новые, являющиеся комбинациями старых, но уже независимые
друг от друга, и каждая следующая из них менее информативна, чем предыдущая,
так что отбрасывание последних Г. к. (упрощая описание выборки) не приводит к
существенной потере полезных сведений. В биологических приложениях часто
делаются попытки интерпретировать новые переменные как отражение влияния
некоторых не наблюдаемых непосредственно и независимых друг от друга «факторов»,
в чем иногда помогает операция вращения полученных осей так, чтобы они были
максимально близки к группам — пучкам высококоррелированных исходных признаков.
Однако всегда следует иметь в виду, что Г. к. м. сам по себе является лишь
набором математических преобразований, применяемых в предположении выполнения
определенных предпосылок (напр., линейности связей) безотносительно к
содержательному смыслу рассматриваемых признаков. Недостатком Г.
к. м. является
то, что он плохо объясняет корреляции между наблюдаемыми признаками, и не
эффективен в том случае, если каждый из измеряемых признаков в отдельности
слабо информативен (сильно «зашумлен»). В этих случаях лучше пользоваться
методом истинного факторного анализа.