Кислова О. М. Курс «Методи комп'ютерної обробки соціологічної інформації »
Лекція 1. Сучасні інформаційні технології обробки й аналізу соціологічної інформації.
План лекції:
1. Варіативність даних, що використовуються у соціологічних дослідженнях (квантифіковані, тексти, фото…).
2. Статистичні пакети для обробки соціологічних даних.
3. Приклади застосування різних програм для обробки текстових даних
Методи комп'ютерної обробки можна класифікувати за критерієм «вигляд даних». Для кожного виду даних існують специфічні комп'ютерні програми їх обробки.
• Внаслідок формалізованих опитувань (кількісна методологія) отримують квантифіковані дані (тобто представлені у вигляді чисел).
• У наслідок використання якісної методології, соціологи отримують дані, представлені у вигляді текстів.
• Сьогодні соціологічна спільнота розглядає можливості застосування зображень (фото) у якості емпіричного матеріалу. Крім того йде мова про можливості соціологічного аналізу мультимедійних, відео та інших масивів.
Комп'ютерні програми обробки числових даних − це різноманітні пакети статистичного аналізу даних. В наш час в ці пакети містять також різні НЕ статистичні методи, розроблені в процесі розвитку теорії штучного інтелекту. Наприклад, дерева класифікації, нейронні мережі тощо.
Усі методи аналізу даних, які передбачають використання комп'ютерних технологій, прийнято називати методами інтелектуального аналізу даних.
Універсальні статистичні пакети загального призначення: SAS ; SPSS; SYSTAT; MINITAB; Statgraphics; BMDP Dynamic; STATISTICA;Stat View и Super ANONA.
Пакети програм обробки й аналізу соціологічної інформації в українських реаліях
Два основні пакети програм обробки й аналізу первинної соціологічної інформації: SPSS та ОСА.
Програма SPSS є найбільш поширеною програмою аналізу первинної соціологічної інформації на міжнародному ринку соціологічних досліджень. Дана програма містить основні методи статистичного аналізу, що використовуються в роботі з первинною соціологічною інформацією. Крім того, саме цей формат є найбільш поширеною формою обміну соціологічною інформацією з міжнародними партнерами.
Програма ОСА
(Обробка Соціологічних Анкет), розроблена київським вченим А. П. Горбачиком, є основною комп'ютерною програмою аналізу первинної
соціологічної інформації, яка використовується практично всіма провідними
соціологічними центрами України. Вона компактна, зручна в роботі, проста у
вивченні.
Суттєвою перевагою цієї програми є її сумісність з програмою SPSS: дані,
введені в комп'ютер за допомогою програми ОСА, за необхідністю легко переводяться у формат SPSS.
SPSS: історія, поняття, модулі
• Statistical Package for the Social Science (англомовна програма);
• Розробка програми – 60-ті роки ХХ ст.;
• Подальший розвиток – розробка вже 17 версій пакету програми;
• Основою програми SPSS є SPSS Base (базовий модуль), що надає різноманітні можливості доступу до даних й керування даними. Він містить методи анализу, які використовуються найчастіше.
ОСА: аспекти функціональності
• Діалоговий пакет прикладних програм ОСА (абревіатура від «Обробка Соціологічних Анкет») призначений для статистичної обробки та аналізу результатів соціологічних опитувань.
Пакет забезпечує виконання наступних функцій:
• Формування паспорту масиву анкет;
• Ввод анкет (результатів опитування) і контроль вводу;
• Роботу з ознаками різних типів шкал (номінальних, порядкових, метричних);
• Розрахунок одновимірних і двовимірних розподілів;
• Формування додаткових ознак у таблиці анкет;
• Побудова фільтрів для відбору анкет з масиву;
• Пакет забезпечений системою оперативної підказки. Пакет орієнтований на широке коло користувачів, які займаються обробкою результатів соціологічних опитувань.
Комп'ютерні програми обробки текстових даних
• У наш час багато провідних розробників програмного забезпечення пропонують свої продукти та рішення в області Text mining. Як правило − це масштабовані системи, в яких реалізовані різні математичні та лінгвістичні алгоритми аналізу текстових даних. Вони мають розвинені графічні інтерфейси, багаті можливості візуалізації і маніпулювання даними. Ось кілька прикладів таких систем:
• Intelligent Miner for Text (IBM);
• TextAnalyst, WebAnalyst (Мегапьютер Інтеллідженс) ;
• Text Miner (SAS);
• SemioMap (Semio Corp.);
• Oracle Text (Oracle);
• Knowledge Server (Autonomy);
• Galaktika-ZOOM (корпорація "Галактика") ;
• InfoStream (Інформаційний центр "ЕЛВІСТІ").
Приклади застосування різних програм для обробки текстових даних
Text Analysis представляє собою засіб формалізації неструктурованих текстових полів в базах даних. Він може бути використаний для кращого розуміння текстових даних завдяки автоматичному виділенню ключових понять.
Link Terms (LT) - зв'язок понять. Цей модуль Text Analysis дозволяє виявити зв'язки між поняттями, які зустрічаються в текстових полях бази даних, і представляти їх у вигляді графа.
• Цей граф може бути використаний для виділення записів, що реалізують обраний зв'язок.
Інтерактивна візуалізація кластерів текстової інформації в Інтернеті за допомогою комп'ютерної системи Grokker
Тотожність та відмінність головних світових релігій у Holy Books (християнство, іслам, індуїзм, буддизм та іудаїзм)
Візуалізація тексту Біблії (Biblical Social Network - люди та географічні місця)
Візуалізація текстової інформації у політичній блогосфері США (Вибори Президента США у 2008 р.)
Візуалізація мережі наукових знань
(http://www.visualcomplexity.com/vc/index.cfm?domain=Knowledge%20Networks )
Висновки:
• У практиці соціологічних досліджень використовують різни види соціологічних даних (числові, текстові, фото, відео і т.д.).
• Одним з ключових етапів дослідження є обробка даних, яка здійснюється за допомогою сучасних комп′ютерних програм (зокрема, ОСА, SPSS).
• Але ці пакети не обмежують діапазон методів обробки та аналізу даних, які слід використовувати у соціологічних дослідженнях.
Рекомендована література
1. Борисова С.Ф. Компьютер и Интернет для социолога. [Электронный ресурс] : учеб. пособие-справочник / С.Ф. Борисова. - Н. Новгород, 2002. – Доступно на: http://www.unn.ru/rus/f14/k2/courses/borisova.htm.
2. Крыштановский А.О. Анализ социологических данных с помощью пакета SPSS. – М.: ГУ ВШЭ, 2007.
3. Бююль А., Цёфель П. SPSS: искусство обработки информации. Анализ статистических данных и восстановление скрытых закономерностей. – СПб.: ООО «ДиаСофтЮП», 2002.
Лекція 2. Специфіка подання, зберігання й обробки даних у пакетах ОСА й SPSS
План лекції
• Презентація даних у пакеті ОСА: типи файлів паспорту, масиву та текстової інформації.
• Створення, зберігання та перевірка паспорту в ОСА.
• Презентація даних у пакеті SPSS: діалогові вікна, ввод та імпорт даних.
Головні поняття: Масив даних
• Масив даних − матриця, рядки якої є відповідями кожного респондента на всі запитання анкети, а стовпці − відповідями всіх респондентів на конкретне запитання.
Презентація даних у пакеті ОСА
Результати соціологічного опитування у пакеті
ОСА представляють й зберігають у вигляді
массиву анкет.
Массив анкет зберігається у двух файлах:
• 1) Файл, що містить паспорт (має розширення: *.DCL);
• 2) Файл, що містить коди відповідей респондентів на питання анкети (розширення: *.FRM).
Створення паспорту масиву анкет у пакеті ОСА
• Паспорт массиву анкет – це текст анкети, за якою проводилося опитування респондентів, що міститься в комп′ютері у спеціальному форматі.
• Для створення паспорту необхідно:
1) запустити пакет ОСА;
2) обрати у головному меню пункт "11. ВВОД нового ПАСПОРТУ масиву анкет";
3) задати ім′я паспорту (не більше 8-ми символів, розширення зазначати не слід, пакет самостійно його присвоїть);
4) заповнити усі поля, послуговуючись підсказками пакету ОСА.
Особливості мовної розкладки у пакеті ОСА
• Одночасне натискання комбінації клавіш Shift + Ctrl на правій частині клавіатури дає можливість використовувати англомовний текст;
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.