Дискретный анализ

Дискретный анализ является статистическим методом, который позволяет изучить различия между двумя и более группами объектов, по нескольким переменным одновременно. Он схож с множественно-регрессионным анализом, однако существует различие:
при регрессионном анализе зависимая переменная является количественной, а в дискретном анализе - качественной.

Цели дискретного анализа:
1. Определение значимости различий между двумя и более группами.
2. Построение модели, позволяющей классифицировать респондентов или объектов между группами на основании независимых переменных
3. Проверка соответствия фактического дискретного множества расчетному, полученному по независимой переменной.

Для проведения дискретного анализа необходимо образовать две обучающие выборки Z1 и Z2 (может быть больше) - пользователи и непользователи.

1
Z1 = n1 * ( А0 + B1*X1 +B2*X2 + Bn*Xn)

Предположим, что во множестве Z1 будут включены все покупатели данного продукта .
1
Z2 = n2 * ( А0 + B1*X1 +B2*X2 + Bn*Xn)
(никогда не покупают данного продукта)

Если индивидуальные значения ответов какого-либо респондента будут больше, чем полусумма (Z1i + Z2i), то такого респондента следует относить к пользователям, иначе к лицам, которые не покупают данный продукт.

Дискретный анализ может быть использован для ответа на вопросы:
 как потребители какого-либо товара отличаются от тех, кто не покупает этот продукт.
 как потенциальные потребители новых товаров, показывающие большую вероятность покупки данного товара отличается по демографическим признакам от тех, для кого характерна низкая вероятность покупки данного товара.

Плохо 1 2 3 4 5 6 7 8 9 10 Отлично

1. Общее качество приготовленных блюд
2. Расположенность недалеко от дома
3. Близко от работы
4. Качество обслуживания
5. Скорость обслуживания.

Следующей важной задачей является классификация объектов или людей. При этом используются данные о реальной и смоделированной совокупности.
Данные свидетельствуют о том, что 80,3 % из числа лиц, не являющихся посетителями, отнесены к той же группе, а 19,7 % ошибочно были отнесены к посетителям.
Проблема в том, чтобы определить, являются ли данные моделирования достаточными для принятия решения. При этом для оценки используются критерии случайной пропорциональности:
с= р2 + (1 - р)2

р- доля лиц, попавших в группу 1
(1 - р) - доля лиц, попавших в группу 2.

Мы правильно классифицировали 80,3 %, т.о. наша модель позволяет классифицировать людей на посетителей и непосетителей.

Powered by Drupal - Design by artinet