Элементы статистики
Определение генеральной совокупности и выборки
Многие сферы нашей жизни связаны со статистическими исследованиями. Например, перепись населения страны связана с подготовкой разнообразной документации, обучением переписчиков, сбором и анализом информации
Иногда бывает сложно провести сплошное исследование, тогда его заменяют выборочным исследованием. Вся совокупность данных, подлежащая изучению, называется генеральной совокупностью. Часть объектов, которая отобрана для непосредственного изучения из генеральной совокупности, называется выборочной совокупностью или выборкой
Суть выборочного метода: По свойствам выборки объективно оценить свойства генеральной совокупности. Для этого выборка должна быть представительной (репрезентативной).
Виды выборки
Различают следующие виды выборок:
- Собственно-случайная, то есть образованная случайным образом, без выделения каких-либо групп
- Механическая, то есть элементы отбираются через определенный интервал
- Типическая, то есть в выборку случайным образом попадают элементы из типических групп, на которые по некоторым признакам разбивается генеральная совокупность
- Серийная (гнездовая), то есть отбираются не отдельные элементы, а целые группы
Таблица частот
Рассмотрим пример. Студентам был предложен тест, содержащий 7 вопросов. Тестирование выполняли 25 учащихся. При проверке учитель отмечал число верно выполненных заданий. В результате была составлена таблица, в которой для каждого числа верно выполненных заданий, записанного в верхней строке, а нижней строке указывалось соответствующее число учащихся, выполнивших столько заданий, то есть указывалась частота появления этого числа в общем ряду полученных данных
Такую таблицу называют таблицей частот
В рассмотренном примере сумма частот равна 25, то есть общему числу проверяемых работ. Вообще, если результат исследования представлен в виде таблицы частот, то сумма частот равна общему числу данных в ряду
Найдем среднее арифметическое данного ряда:
Значит, в среднем учащийся выполнили по 5 заданий
Наибольшее число выполненных заданий равно 7, а наименьшее 1, значит размах ряда равен 7-1=6, то есть различие в верно выполненных заданиях велико
Из таблицы видно, что чаще всего встречаются работы с, верно, выполненными четырьмя заданиями, значит мода ряда равна 4
Найдем медиану ряда, так как ряд содержит 25 членов, то для нахождения медианы нам нужен тринадцатый член. Вычислим группу, к которой относится тринадцатый член. , следовательно, тринадцатый член попадает в группу, которая выполнила пять заданий, значит медиана равна 5.
таблица относительных частот
Относительной частотой называется отношение частоты к общему числу данных в ряду. Относительная частота выражается в процентах
Составим таблицу относительных частот для рассмотренной задачи
Для этого найдем сначала все относительные частоты:
Сумма относительных частот всегда дает 100%
Интервальный ряд
Если в ряду имеется большое число данных и одинаковые значения встречаются редко, то таблицы частот или относительных частот теряют наглядность. В таких случаях для анализа данных строят интервальный ряд. Для этого разность между наибольшим и наименьшим значениями делят на несколько равных частей (5-10) и, округляя полученный результат, определяют длину интервала. За начало первого интервала часто выбирают наименьшее данное или ближайшее к нему целое число, его не превосходящее. Для каждого интервала указывают число данных, которые попадают в этот интервал
Например, в партии из 50 электроламп изучали продолжительность их горения (в часах). По результат составили таблицу
Интервальный ряд
Пользуясь таблицей, найдем среднюю продолжительность горения, но сначала найдем середины интервалов и составим новую таблицу
Найдем среднее арифметическое:
Таким образом, можно сделать вывод, что средняя продолжительность горения электроламп равна 870 ч
Наглядное представление статистической информации
Столбчатую диаграмму используют, когда хотят проиллюстрировать динамику изменения данных во времени или распределения данных, полученных во время статистического исследования
Наглядное представление статистической информации
Круговую диаграмму используют, когда хотят наглядно показать разницу между данными
Наглядное представление статистической информации
Динамику изменения статистических данных во времени часто иллюстрируют с помощью полигона
Наглядное представление статистической информации
Гистограмма представляет собой ступенчатую фигуру, составленную из сомкнутых прямоугольников. Ее отличие от столбчатой диаграммы в том, что основание каждого столбца равно длине интервала, а высота – частоте
Дисперсия и среднеквадратическое отклонение
Определение. Дисперсией ряда чисел называется среднее арифметическое квадратов их отклонений от среднего арифметического этого ряда
Пример: дан ряд 5, 10,9, 4,
Найдем его среднее арифметическое
Найдем отклонение каждого элемента ряда от среднего:
Найдем дисперсию данного ряда:
Определение. Среднеквадратическим отклонением числового ряда называется квадратный корень из дисперсии этого ряда
Найдем среднее квадратичное данного ряда: