Варианты заданий по ИР для студентов 4 курса ФПМИ
по курсу «Статистические методы анализа данных»
(Типовые задания №1)
Часть 1
Изучить основные положения факторного анализа данных:
1. Основные уравнения факторного анализа (ФА). Основные понятия.
2. Схема решения и основные проблемы ФА.
3. Проблема факторов. Метод главных компонент.
4. Проблема факторов. Центроидный метод.
5. Значимость факторов. Критерии оценки значимости.
6. Проблема общностей. Способы вычисления оценок общностей.
7. Проблема вращения. Понятие простой структуры.
8. Аналитические методы вращения при поиске простой структуры.
9. Измерение факторов.
10. Оценка точности решений в ФА.
Часть 2
1. Разработать тестовый пример и осуществить генерацию данных для последующей их обработки методами ФА.
2. Программно реализовать один из методов получения простой структуры.
3. Провести анализ тестовых данных, используя реализованный метод ФА.
4. Провести оценку точности полученного решения.
Варианты тестов:
1. 8 наблюдаемых и 5 скрытых факторов (линейная зависимость).
2. 9 наблюдаемых и 6 скрытых факторов (нелинейная зависимость).
3. 9 наблюдаемых и 5 скрытых факторов (линейная зависимость).
4. 7 наблюдаемых и 4 скрытых факторов (нелинейная зависимость).
5. 7 наблюдаемых и 4 скрытых факторов (линейная зависимость).
6. 6 наблюдаемых и 3 скрытых факторов (нелинейная зависимость).
7. 10 наблюдаемых и 4 скрытых факторов (линейная зависимость).
8. 9 наблюдаемых и 4 скрытых факторов (линейная зависимость).
9. 8 наблюдаемых и 3 скрытых факторов (нелинейная зависимость).
10. 7 наблюдаемых и 3 скрытых факторов (линейная зависимость).
11. 6 наблюдаемых и 4 скрытых факторов (нелинейная зависимость).
12. 5 наблюдаемых и 3 скрытых факторов (линейная зависимость).
13. 7 наблюдаемых и 4 скрытых факторов (дробно-линейная зависимость).
14. 6 наблюдаемых и 3 скрытых факторов (дробно-линейная зависимость).
15. 10 наблюдаемых и 4 скрытых факторов (дробно-линейная зависимость).
16. 9 наблюдаемых и 4 скрытых факторов (дробно-линейная зависимость).
17. 8 наблюдаемых и 3 скрытых факторов (дробно-линейная зависимость).
18. 7 наблюдаемых и 3 скрытых факторов (дробно-линейная зависимость).
19. 6 наблюдаемых и 4 скрытых факторов (дробно-линейная зависимость).
20. 5 наблюдаемых и 3 скрытых факторов (дробно-линейная зависимость).
Содержание отчета
1. Результаты моделирования тестовых данных.
2. Листинг программы ФА.
3. Анализ тестовых вычислений.
При защите отчета проводится собеседование по теории ФА (см. Часть 1). Программирование осуществить индивидуально в системе MathCad.
Литература: Иберла. Факторный анализ.
Варианты заданий по ИР для студентов 4 курса ФПМИ
по курсу «Статистические методы анализа данных»
(Типовые задания №2)
Ваpианты заданий
1. Ваpианты 1-4. Реализовать один из иеpаpхических алгоpитмов кластеpного анализа.
2. Ваpианты 5-8. Реализовать одну из пpоцедуp типа упоpядочения кластеpного анализа.
3. Ваpианты 9-12. Реализовать одну из пpоцедуp эталонного типа кластеpного анализа.
4. Ваpианты 13-16. Реализовать один из алгоpитмов типа pазpезания гpафа, комбиниpованного или пpочих.
Пеpечень вопpосов для pазpаботки
1. Ознакомиться с основными идеями кластеpного анализа. (1 нед.).
2. Подобрать литературу с изложением выбранного метода кластеризации. (1 нед.).
3. Выполнить математическое и алгоpитмическое описание алгоpитма кластеpизации. Для каждой из 4-х гpупп ваpиантов заданий выбpать несколько "своих" кpитеpиев качества кластеpизации. ( 1 нед.).
4. Выбpать и подготовить несколько тестовых пpимеpов с известными pешениями. (1 нед.).
5. Выполнить стpуктуpное пpоектиpование и pазpаботать I/O интеpфейс пpогpаммы. (2 нед.).
6. Выполнить пилотную pеализацию пpоекта. (2 нед.).
7. Пpовести доводку системы с pешением тестовых пpимеpов. (2 нед.).
9. Офоpмить и защитить работу.
ЗАМЕЧАHИЕ
К защите пpинимаются только оpигинальные pазpаботки.
Л И Т Е Р А Т У Р А
1. И.Д. Мандель. Кластеpный анализ. - М. 1988.
2. Айвазян С.А., Бежаева З.И., Староверов О.В. Классификация многомерных наблюдений. - М., 1974.
3. Дюран Б., Оделл П. Кластерный анализ. -М., 1977.
4. Классификация и кластер/ Под ред. Дж. Вэн Райзина. - М., 1980.
5. Статистические методы для ЭВМ/ Под ред. К. Энслейна, Э. Рэлстона. - М., 1986.
6. Прикладная статистика.Классификация и снижение размерности/ Под ред. Айвазяна С.А. - М.,1989.
7. Миркин Б.Г. Группировки в социально-экономических исслеованияхю - М.,1985.
8. Дж. Ту, Р. Гонсалес. Принципы распознавания образов. - М., 1978.
9. Список литературы в [1].
Варианты заданий по ИР для студентов 4 курса ФПМИ по курсу «Статистические методы анализа данных» (Исследовательские проекты по проблемам анализа данных)
1. Задачи классификации
1. Распознавание образов с использованием линейных решающих функций.
2. Распознавание образов посредством построения деревьев решений.
3. Распознавание образов с использованием потенциальных функций или с использованием RBF нейронной сети.
4. Распознавание образов с использованием многослойного персептрона (MLP нейронная сеть) или нейронных сетей другого типа.
5. Выявление знаний (Data Mining) в базах данных посредством построения деревьев решений (логических решающих функций).
6. Выявление знаний (Data Mining) в базах данных посредством контрастирования нейронной сети.
7. Обнаружение закономерностей во временных последовательностях.
8. Поиск ассоциаций в БД.
9. Алгоритмы классификации для сверх больших БД.
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.