Описание данных. Основные понятия проверки статистических гипотез

Страницы работы

Уважаемые коллеги! Предлагаем вам разработку программного обеспечения под ключ.

Опытные программисты сделают для вас мобильное приложение, нейронную сеть, систему искусственного интеллекта, SaaS-сервис, производственную систему, внедрят или разработают ERP/CRM, запустят стартап.

Сферы - промышленность, ритейл, производственные компании, стартапы, финансы и другие направления.

Языки программирования: Java, PHP, Ruby, C++, .NET, Python, Go, Kotlin, Swift, React Native, Flutter и многие другие.

Всегда на связи. Соблюдаем сроки. Предложим адекватную конкурентную цену.

Заходите к нам на сайт и пишите, с удовольствием вам во всем поможем.

Содержание работы

Лекция 1

Описание данных Основные понятия проверки статистических гипотез

Методы статистики позволяют:

  • доказывать правильность и обоснованность используемых методов;
  • обосновывать план эксперимента;
  • обобщать данные эксперимента;
  • находить зависимости;
  • выявлять наличие различий;
  • строить статистические предсказания и др.

Пример вероятностного характера статистических выводов

Описательная статистика

  • Распределение
  • Вариационный ряд
  • Генеральная совокупность
  • Выборка
  • Представительность выборки:
    • случайность выбора;
    • независимость результатов наблюдений;
    • правильное определение объема.

Табличное представление результатов

  • где N – объем выборки, k – количество вариант (k≤N).

Пример:

20 студентов получили следующие оценки по тесту: 61 62 63 63 69 72 72 76 76 77 78 78 81 83 85 85 85 86 93 97 Таблица частот

Гистограмма

Параметры распределения

  • главная тенденция (среднее, мода, медиана)
  • разброс (дисперсия, стандартное отклонение, размах вариации, коэффициент вариации)
  • асимметрия
  • эксцесс
  • модальность

Асимметрия

отрицательная положительная нулевая асимметрия асимметрия асимметрия

Эксцесс, модальность

Отрицательный Положительный Бимодальное эксцесс эксцесс распределение

Среднее значение

Сумма значений признака для всех элементов совокупности, деленная на число элементов совокупности.

  • Медиана (Ме) – это значение признака, которое делит распределение пополам: половина значений будет больше медианы, половина – меньше.
  • Процентиль – значение признака, который делит распределение на соответствующие доли (25%, 75% и т.д.)
  • Мода (Мо) – это наиболее часто встречающееся значение признака, т.е. значение признака, наиболее характерное для данной совокупности.

Показатели разброса

  • Размах вариации – это разность между максимальным и минимальным значением признака.
  • Дисперсия - средний квадрат отклонения от среднего:

  • Стандартное (среднеквадратическое) отклонение:
  • Коэффициент вариации (в однородной совокупности не превышает 33%):

Нормальное (гауссово) распределение

  • Плотность распределения:
  • Полностью определяется:
    • средним значением μ (положение кривой распределения и место ее максимума);
    • стандартным отклонением σ (форма кривой).

Правило «трех сигма»

  • При отклонении распределения от нормального лучше использовать медиану, моду и процентили
  • Соответствие между процентилями и числом стандартных отклонений (для проверки распределения на нормальность:

Расположение моды медианы и среднего в разных распределениях

Нормальное Положительное Отрицательное распределение смещение смещение

Выборочные оценки параметров распределения

  • Выборочное среднее:
  • Выборочное стандартное отклонение:
  • Стандартная ошибка среднего:

Критерии значимости

  • Нулевая гипотеза (Н0): исследуемые факторы не оказывают никакого влияния на исследуемый параметр; между сравниваемыми группами нет различий
  • Альтернативная гипотеза (Н1): определяется формулировкой задачи
  • Критическая величина: получают из набора статистических таблиц

  • Проверку гипотез осуществляют на основании результатов выборки.
  • Если статистика критерия превышает критическую величину:
    • нулевая гипотеза отклоняется;
    • различия признаются статистически значимыми.

Сочетания объективного состояния гипотезы и субъективных действий:

  • Вероятность ошибки первого рода равна α - уровень значимости критерия
  • Максимальная приемлемая вероятность α=0,05
  • Вероятность ошибки второго рода равна β
  • Величина 1-β называется мощностью критерия

Похожие материалы

Информация о работе

Уважаемые коллеги! Предлагаем вам разработку программного обеспечения под ключ.

Опытные программисты сделают для вас мобильное приложение, нейронную сеть, систему искусственного интеллекта, SaaS-сервис, производственную систему, внедрят или разработают ERP/CRM, запустят стартап.

Сферы - промышленность, ритейл, производственные компании, стартапы, финансы и другие направления.

Языки программирования: Java, PHP, Ruby, C++, .NET, Python, Go, Kotlin, Swift, React Native, Flutter и многие другие.

Всегда на связи. Соблюдаем сроки. Предложим адекватную конкурентную цену.

Заходите к нам на сайт и пишите, с удовольствием вам во всем поможем.