Статистика и STATISTICA. Почему STATISTICA называется интегрированной системой обработки. Некоторые факты о системе STATISTICA

Страницы работы

Фрагмент текста работы

описательную статистику, полную таблицу дисперсионного анализа и многое другое. Интеллектуальную поддержку процессу анализа обеспечивают большое число специализированных графиков и широкий выбор интерактивных процедур типа "что-если".

 Модуль Кластерный анализ

Если вы хотите произвести сложную иерархическую классификацию данных или выделить в них кластеры, обратитесь к модулю Кластерный анализ.

Модуль содержит всесторонний инструментарий для кластеризации (метод к-средних, иерархическая классификация и др.). Возможные метрики: евклидова, манхэттенская, чебышевская и др. Средствами модуля может быть реализован чрезвычайно объемный кластерный анализ. Например, иерархическая классификация может быть выполнена для стольких переменных, сколько содержит ваш файл данных (до 90.000 расстояний); также с помощью метода к-средних можно кластеризировать 2100 объектов размерности 600.

В дополнение к стандартному выводу кластерного анализа предлагается исчерпывающее множество описательных статистик.

 Модуль Лог-линейный анализ

Если вам нужно проанализировать сложные многоуровневые таблицы,  как это бывает, например, в социологии при анализе массовых опросов,  воспользуйтесь модулем Лог-линейный анализ.

Модуль содержит полный инструментарий лог-линейных процедур для многоуровневых таблиц частот. Могут быть проанализированы оба типа таблиц - полные и неполные (с структурными нулями). Таблицы частот могут быть построены из необработанных данных или непосредственно введены в систему. В процессе обработки пользователь может просматривать как исходную таблицу, так и маргинальные таблицы. Также имеется процедура автоматического выбора наилучшей модели.

Вывод результатов включает в себя G-квадрат, стандартный пирсоновский хи-квадрат с подходящими степенями свободы и уровнями значимости, наблюдаемые и ожидаемые таблицы, маргинальные таблицы и другие характеристики. Графические возможности, доступные в модуле, включают разнообразные 2-х и 3-х мерные графики, спроектированные для визуализации таблиц частот (включая интерактивные, управляемые пользователем каскады гистограмм, 3-х мерные гистограммы, позволяющие просматривать послойно таблицы с несколькими входами), графики наблюдаемых и подогнанных частот, разнообразные графики остатков  и многое другое.   

 Модуль Нелинейное оценивание

Если вы хотите определить нелинейные зависимости в данных, подогнать к ним функциональные кривые, обратитесь к модулю Нелинейное оценивание.

Модуль предоставляет возможность осуществить подгонку к наблюдаемым данным кривой, по существу, любого типа.

Одна из уникальных возможностей модуля (в отличие от традиционных программ нелинейного оценивания) в том, что здесь не накладываются ограничения на размер файла обрабатываемых данных.

Оценки могут быть построены с помощью оценок метода наименьших квадратов, метода максимального правдоподобия или заданной пользователем функции потерь.

Пользователь может выбрать одну из четырех вычислительных процедур: квазиньютоновский метод, симплекс метод, метод Хука-Дживса, метод Розенброка. Пользователь может определить любой тип нелинейной модели, набрав соответствующее уравнение в редакторе. Кроме того, допускается использование логических операторов, и таким образом могут быть оценены разрывные регрессионные модели и модели, включающие индикаторные переменные.

Программа осуществляет полный контроль за всеми аспектами вычислительных процедур (начальное значение, размер шага, критерий сходимости и т.д.). Большинство обычных нелинейных регрессионных моделей заранее задано в модуле и их можно просто выбирать из меню.

 Модуль Каноническая корреляция

Модуль включает в себя широкий набор процедур канонического корреляционного анализа для исследования связи между двумя множествами переменных. Модуль может обрабатывать векторные данные или корреляционные матрицы и вычислять все стандартные канонические корреляционные статистики (включая собственные вектора, собственные значения, коэффициенты избыточности, канонические веса, нагрузки, критерии значимости для каждого корня и т.д.)

 Модуль Анализ длительностей жизни

Если ваши данные представляют собой таблицы жизней,  как, например, в медицине или страховании,  и вы хотите проанализировать их,  воспользуйтесь модулем Анализ длительностей жизни.

Модуль предлагает обширный набор методов анализа цензурированных данных из социологии, биологии, медицины, а также методы, используемые в инженерии и маркетинге (например, контроль качества, оценка надежности и др.). Дополнительно вычисляются таблицы жизни с различными описательными статистиками и оценками Каплана-Мейера. 

Программа обеспечивает полную поддержку 4-х основных разведочных моделей анализа: модель Кокса пропорциональных рисков, экспоненциальную регрессионную модель, логнормальную и нормальную регрессионные модели с расширенными диагностиками.

Так же как во всех модулях STATISTICA, пользователь имеет возможность изменить параметры во всех вычислительных процедурах. В модуле также содержится широкий выбор графиков и специализированных диаграмм, предназначенных для интерпретации результатов (включая графики накопленных частот  благоприятных/неблагоприятных исходов, образцы цензурированных данных, функции риска и кумулятивные функции

Похожие материалы

Информация о работе