Изучение методов визуализации и кластеризации многомерных данных, страница 3

Многомерное шкалирование

Построим проекцию исследуемой совокупности многомерных наблюдений на плоскость с помощью метода многомерного шкалирования:

 Можно выделить 4 кластера:

1.  I + UK + A + B + F + EU

2.  IRL + DK + NL + D

3.  EL + P + E

4.  S + FIN

Данный результат совпадает с результатом иерархической кластеризации

Метод главных компонент

Построим проекцию исследуемой совокупности многомерных наблюдений на плоскость с помощью метода главных компонент:

 Можно выделить 4 кластера:

1.  DK + D + UK + A + B + F + EU

2.  I + EL + P + E

3.  S + FIN

Т. к. проецирование осуществляется на плоскость, то выделяются две главные компоненты, которые вместе объясняют 63,74% исходной дисперсии, что говорит о не слишком большой точности метода.

Взаимосвязь между полученными главными компонентами и исходными признаками:

Factor 1

Factor 2

Factor 3

Factor 4

Factor 5

Factor 6

New S&E grads

-0,458929

0,764178

0,215826

0,122732

0,047260

0,185937

Pop with 3-rd education

-0,819324

0,023440

0,330668

0,136538

0,409439

0,074673

Lifelong learning

-0,832964

-0,207176

0,099128

-0,268816

-0,012084

-0,251130

Empl med/high-tech manufacturing

-0,534060

0,196737

-0,488519

0,294305

-0,007499

0,503979

Empl high-tech services

-0,911162

0,161601

-0,024070

-0,176985

0,149713

0,009901

Publik R&D/GDP

-0,749214

-0,507596

0,063324

0,124809

-0,294214

0,002875

Buisness R&D/GDP

-0,912931

-0,116901

0,046599

0,278231

-0,085235

0,201890

EPO high-tech patents/pop

-0,842765

-0,108500

0,275850

0,163626

-0,254028

0,097660

USPTO high-tech parents/pop

-0,932603

-0,198011

0,158402

0,105590

-0,176222

0,033469

SMEs innov in-hous

-0,390160

0,212205

-0,806993

-0,288084

0,046659

0,057617

SMEs innov co-op

-0,797788

0,188579

-0,223392

-0,203940

0,092455

-0,274350

Innovation expenditure

-0,876088

-0,116631

-0,185593

-0,140002

-0,172199

0,163494

High-tech venture capital/GDP

-0,732691

0,213177

0,397943

0,001330

0,048342

-0,222666

New capital

0,093610

-0,328147

0,412809

-0,509428

0,441634

0,479556

New-to-market products

0,281382

0,283685

0,315796

-0,554852

-0,585526

0,226367

Home Internet access/household

-0,831954

-0,061294

-0,235079

-0,392706

0,017442

-0,076808

ICT expenditures/GDP

-0,791714

-0,353708

-0,092445

-0,005365

0,105503

-0,074108

Manuf high-tech value-added share

-0,566743

0,717002

0,212562

-0,000271

-0,001407

-0,120030