Продемонстрировать, что такое распределения мы бы хотели на нескольких примерах.

Часто ошибочно распределением называют то, что им не является. Например, посмотрите на температурную карту Москвы.

(Разворачивается по клику)

Может сложится впечатление, что подобная карта отражает информацию о распределении температуры в течении года.

Однако, на самом деле, это лишь обычный график температур с привязкой к месяцам.

Например, для средней температуры график будет следующий:

Однако, как же тогда понять, что такое распределение. Давайте теперь посмотрим на этот график под другим углом. Первое, что необходимо сделать, это определиться с переменной. Определим, что переменной будет средняя месячная температура.

А зависимой величиной будет количество месяцев с указанной температурой.

Далее делим температуру на интервалы. Например, ниже нуля и выше нуля. График будет такой:

Можно увеличить количество интервалов и через это сделать график более подробным. Например, шагом интервала можно сделать 5 градусов:

Таким образом, распределение характеризует частоту попадания показателя (например, средней температуры за месяц) в интервалы.

Как мы видим, в данном графике участвует лишь 1 показатель: температура. И этот показатель является переменной. Функцией же является показатель количества попаданий в интервал переменной. Такой прием дает возможность анализировать входящий поток исходных данных, понимая какой характер имеет распределение.

Давайте с вами рассмотрим следующий пример.

На фрезерном станке производится изготовление детали. После чего каждая деталь проходит контрольное измерение и результаты отражаются в форме учета.

Данные по последним 100 замерам отражены ниже:

Это такой же график с данными, как и график средних месячных температур. Распределением такой график не является, но на его основе распределение можно построить.

Итак, первое, что необходимо сделать, это разбить переменное значение на интервалы. Точность измерений: 1 мм.

Максимальное значение: 118

Минимальное значение: 104

Для начала, зададим интервал с шагом в 5мм, начиная с 100мм до 120мм.

Для облегчения понимания можно сделать такую форму:

Правила следующие:

Мы начинаем фиксировать с первого (крайнего левого) значения и последовательно закрашивать каждую ячейку в форме.

Итак, первое значение: 104. 104 – это интервал «101-105». Закрашиваем первую ячейку этого интервала.

Следующее значение: 110. 110 – это интервал «106-110». Закрашиваем первую ячейку этого интервала.

Следующее значение: опять 110. Закрашиваем следующую (вторую) ячейку соответствующего интервала.

Принцип понятен. Нанеся все 100 значений в эту таблицу получим следующую картину.

А теперь представьте, если мы уменьшим шаг процесса до 1мм. Получится следующее:

Если наложить основной график с данными на частотную диаграмму распределения, то получится следующее:

Данный график демонстрирует, что такое распределение, и чем оно отличается от обычного представления данных.