Первичная обработка статистических данных. Практическое пособие, страница 4

Определение 1.5 Случайной выборкой из генеральной совокупности называется выборка, образованная таким способом, при котором каждый элемент генеральной совокупности имеет равную вероятность быть выбранным.

Отсюда следует, что все случайные выборки объема n из данной генеральной совокупности имеют одинаковую вероятность быть выбранными. В дальнейшем мы будем  рассматривать только случайные выборки, называя их кратко выборками.

Определение 1.6 Число элементов генеральной совокупности или выборки называется объемом генеральной  совокупности или выборки, соответственно.

Очевидно, что чем больше объем выборки, тем точнее она  отражает свойства генеральной совокупности. Известно, что предельная ошибка выборки относительно всей совокупности обратно пропорциональна квадрату объёма выборки n. Это означает, что при необходимости удвоения точности выборки её объём должен быть увеличен в 22 = 4 раза. В математической статистике принято считать большим объём выборки, содержащей более 30 элементов          (n> 30). Методы исследования малых и больших выборок могут существенно отличаться.

1.2  Сбор статистических данных

Сбор статистических данных является одной из первых задач статистики. Объективная статистическая информация может дать точные характеристики исследуемых явлений. При использовании недостоверной статистической информации трудно получить верные выводы и прогнозы.

Получение правильных данных для статистического анализа является трудоемким процессом, состоящим из нескольких последовательных этапов:

– осознание и формулировка конкретной цели наблюдения эксперимента;

– выделение соответствующей генеральной совокупности и         определение результирующей случайной величины;

– описание способа образования выборки, подлежащей обследованию, определение необходимого объема выборки и единицы измерения;

– подбор необходимой формы представления выборочных        данных.

Разнообразные статистические данные имеют огромное информационное значение, поэтому существует регламентированная система государственных и частных структур, занимающихся сбором статистической информации. Библиотеки таких данных используются для анализа и прогнозирования природных, экономических, общественных и многих других явлений. Отметим, что данные, собранные другими людьми, называются вторичными. К таким данным всегда надо относится с определенной долей недоверия, так как условия, методы и цели собирания таких данных обычно остаются неизвестными. Для получения достоверных        научных результатов преимущественно используются первичные статистические данные, которые получают для конкретной цели при контролируемых условиях сами исследователи.

Выделяют два основных метода сбора данных: наблюдение и эксперимент. Однако разница между ними довольно условная. Считается, что при проведении эксперимента контролируются определенные условия, а при простом наблюдении такой контроль отсутствует. Существуют определенные требования, предъявляемые к любому методу получения статистических          данных. Одним из них является условие многократной повторяемости случайного эксперимента в относительно одинаковых            условиях. Единичный эксперимент не может считаться достаточным доказательством правильности статистических выводов. Наиболее существенным является требование соблюдения условия случайности выборочного процесса, так как именно тенденциозно организованная выборка чаще всего оказывается источником ошибочных выводов.

В математической статистике разработан ряд процедур и методов, которые в определенных условиях обеспечивают случайность отбора объектов из генеральной совокупности при формировании случайной выборки.

Самым распространенным способом получения выборочных данных является простой случайный выбор без возвращения, когда каждый случайно отобранный объект в исследуемую генеральную совокупность обратно не возвращается. Полученные таким способом выборки называются бесповторными. Такой выбор, например, используется для контроля качества однородных промышленных изделий.