Изучение методов визуализации и кластеризации многомерных данных, страница 4

Factor 7

Factor 8

Factor 9

Fact.10

Fact.11

Fact.12

New S&E grads

0,255772

0,063146

-0,041940

-0,089032

-0,140262

-0,089294

Pop with 3-rd education

-0,023982

-0,069302

-0,021643

-0,089945

-0,032287

0,108972

Lifelong learning

0,075744

-0,165064

0,069912

-0,258447

0,098563

0,013198

Empl med/high-tech manufacturing

-0,085216

-0,272683

0,057271

-0,094517

0,042829

0,007953

Empl high-tech services

0,119837

-0,233237

0,026292

0,122425

-0,057122

0,036736

Publik R&D/GDP

0,097459

0,084919

0,039675

0,003996

-0,231133

0,054031

Buisness R&D/GDP

-0,075396

0,039642

0,004910

0,062675

0,083237

-0,060081

EPO high-tech patents/pop

-0,126258

0,223184

0,163560

-0,069651

0,015417

0,043967

USPTO high-tech parents/pop

-0,084094

0,042723

-0,061415

0,026468

0,084027

-0,024500

SMEs innov in-hous

-0,091978

0,152000

0,119970

0,091834

-0,031174

0,081858

SMEs innov co-op

-0,238090

0,038599

-0,269963

-0,121823

-0,065781

-0,004629

Innovation expenditure

-0,035458

0,093588

-0,302476

0,054405

0,026683

-0,030625

High-tech venture capital/GDP

-0,321596

-0,220938

0,093751

0,205925

-0,043610

-0,039778

New capital

-0,081077

0,146615

-0,005692

0,018558

-0,001062

-0,011688

New-to-market products

0,032785

-0,183538

-0,034286

0,006042

0,008072

0,048696

Home Internet access/household

0,059805

0,073282

0,247498

-0,041804

-0,013886

-0,124011

ICT expenditures/GDP

0,429153

-0,077118

-0,076666

0,141272

0,071924

0,010794

Manuf high-tech value-added share

0,107248

0,260525

0,033364

0,056019

0,130076

0,067244

Fact.13

Fact.14

New S&E grads

-0,015008

0,001358

Pop with 3-rd education

-0,001918

-0,010057

Lifelong learning

-0,057710

0,007935

Empl med/high-tech manufacturing

0,028170

0,015319

Empl high-tech services

0,001925

-0,014047

Publik R&D/GDP

-0,014776

0,002917

Buisness R&D/GDP

-0,050733

-0,031019

EPO high-tech patents/pop

0,036793

0,012650

USPTO high-tech parents/pop

0,036463

-0,016374

SMEs innov in-hous

-0,030448

-0,005183

SMEs innov co-op

0,048324

-0,008989

Innovation expenditure

-0,042255

0,023131

High-tech venture capital/GDP

-0,012503

0,019226

New capital

0,002137

0,005002

New-to-market products

0,012842

-0,010111

Home Internet access/household

0,029692

-0,002917

ICT expenditures/GDP

0,039412

0,009177

Manuf high-tech value-added share

-0,000851

0,007048

Анализируя полученные данные можно отметить, что с уменьшением номера главной компоненты влияние на нее исходных данных ослабевает.

Неиерархическая кластеризация

Произведем неиерархическую кластеризацию с помощью центроидного метода k-средних для случая трех и четырех классов

а)  в случае 3 классов:

CLUSTER

DISTANCE

EU

2

2,80586609

A

2

5,26018658

B

2

5,95440219

D

2

4,8827687

DK

2

7,16634538

E

3

2,81424699

EL

3

3,88263728

F

2

5,4614138

FIN

1

5,77593174

I

3

5,11940725

IRL

2

6,15110634

NL

2

8,12905583

P

3

2,13594892

S

1

5,77593174

UK

2

4,50924687

б)  в случае 4 классов:

CLUSTER

DISTANCE

EU

2

2,36

A

3

5,48

B

2

2,65

D

3

4,57

DK

3

5,53

E

4

2,81

EL

4

3,88

F

2

2,99

FIN

1

5,78

I

4

5,12

IRL

3

5,69

NL

3

6,98

P

4

2,14

S

1

5,78

UK

2

4,08

При увеличении количества выделяемых классов произошло разбиение более крупного класса на два более мелких.

Результаты, полученные в данном пункте схожи с полученными ранее.