Выборкой называется последовательность X ,X ,...,X1 2 n независимых одинаково распределённых с.в., распределение каждой из которых совпадает с распределением генеральной совокупности, n−объём выборки.
Конкретные значения выборки, полученные в результате наблюдений (испытаний) называют реализацией выборки и обозначают x1 2,x ,...,xn .
Метод статистического исследования, состоящий в том, что на основе изучения выборки делается заключение обо всей генеральной совокупности, называется выборочным.
Для получения хороших оценок выборка должна быть репрезентативной (или представительной), т.е. достаточно полно представлять изучаемые признаки генеральной совокупности. Условием обеспечения репрезентативности выборки служит соблюдение случайности отбора, т.е. равные вероятности для каждого объекта генеральной совокупности попасть в выборку.
Выборки бывают повторные (когда отобранный объект возвращается в генеральную совокупность перед извлечением следующего) и бесповторные (если не возвращается). На практике чаще используют бесповторные выборки. Если объём выборки значительно меньше объёма генеральной совокупности, то различие между повторной и бесповторной выборками очень мало и его можно не учитывать.
В зависимости от конкретных условий для обеспечения репрезентативности применяют различные способы отбора:
• простой, при котором из генеральной совокупности извлекают по одному объекту;
• типический, при котором генеральную совокупность делят на «типические» части и отбор осуществляется из каждой части (например, мнение о референдуме спросить у случайно отобранных людей, разделённых по признаку пола, возраста, профессии,...);
• механический, при котором отбор производится через определённый интервал (например, спросить мнение у каждого десятого...) ;
• серийный, при котором объекты из генеральной совокупности отбираются «сериями», которые должны исследоваться при помощи сплошного обследования.
На практике пользуются сочетанием вышеупомянутых способов отбора.
Пример 1. Десять студентов проходят тестирование по математике. Каждый может набрать от 0 до 5 баллов включительно. Обозначим Xi – количество баллов, набранных i -м студентом (i = 1,2,...,10) .
Значения 0, 1, 2, 3, 4, 5 – все возможные количества баллов, набранных одним студентом, образуют генеральную совокупность.
Выборка X ,X ,...,X1 2 10 – результат тестирования десяти студентов.
Реализациями выборки могут быть следующие наборы чисел:
{5,3,0,1,4,2,5,4,1,5} или {4,4,5,3,3,1,5,5,2,5} или {3,4,5,0,1,2,3,4,5,4} и т.д.
Статистическое распределение выборки. Вариационный ряд. Статистический ряд
Изучается некоторая с.в. Х. С этой целью над Х производят ряд независимых опытов (наблюдений). В каждом из этих опытов с.в. Х принимает то или иное значение.
Пусть она приняла n1 раз значение x1, n2 раз – значение x2,..., nk раз – значение xk . При этом n1 + n2 +...+ nk = n – объём выборки. Значения x1 2,x ,...,xk называются ва-
риантами с.в. Х. Вся совокупность значений с.в. Х представляет собой первичный статистический материал, подлежащий дальнейшей обработке, прежде всего – упорядочению. Операция расположения значений с.в. в неубывающем порядке называется ранжированием статистических данных, а полученная в результате последовательность значений с.в. Х называется вариационным рядом. Числа ni , показывающие, сколько раз встречаются варианты xi в выборке, называются частотами, а величины
pi∗ = ni /n
называются относительными частотами или частостями.
Статистическим рядом или статистическим распределением выборки называется перечень вариантов и соответствующих им частот или частостей. Записывают статистический ряд в виде таблицы. Первая строка содержит варианты, вторая – их частоты ni или частости pi∗.
Пример 2. В результате тестирования (см. пример 1) группа из 10 студентов набрала баллы: 5, 3, 0, 1, 4, 2, 5, 4, 1, 5. Записать полученную выборку в виде: а) вариационного ряда, б) статистического ряда.
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.