Кластерный анализ

Используется для технических процедур; используется для классификации людей и объектов по нескольким признакам одновременно. Цель - объединить объекты так, чтобы в одну группу попали насколько возможно однородные объекты и чтобы различные группы отличались существенно между собой.

Существует несколько процедур кластеризации, но все они базируются на использовании мер или критериев близости. Наиболее распространенным кри-терием близости является среднеквадратическая разность.

Евклидово расстояние - расстояние между объектами

d (Xi; Xj) = [ (Xik - Xjk)2 ]2

Суть в том, что последовательно объединяются объекты сначала более близкие, а затем все более отдаленные друг от друга. Работа алгоритма закан-чивается, когда все объекты будут объединены в один класс. Результатом обычно является графическое изображение, иллюстрирующее вид иерархического дерева (дендрограмма).

Описанный алгоритм не имеет четких правил остановки на каком-то этапе кластеризации. Обычно исследователи принимают во внимание устойчивость групп на протяжении нескольких шагов алгоритма. В кластерном анализе не рекомендуется использовать большое количество факторов. Существует зави-симость между количеством объектов и количеством факторов.

lg n
L max = lg 2

Иногда используются многомерные средние (объединение нескольких признаков в общий).

Powered by Drupal - Design by artinet