Использование метрики, основанной на угловом расстоянии, для задач классификации

Страницы работы

Содержание работы

3.2 Использование метрики, основанной на угловом расстоянии, для задач классификации

Необходимо классифицировать данные о доле отраслей в объеме промышленного выпуска.

Таблица 2.1 Доля отраслей в  объеме промышленного выпуска

Электроэнергетическая

Машиностроительная

ось x

ось y

1

Гродненская

6,9

11,5

2

Витебская

11,1

20,1

3

Минск и Минская область

21,3

34,2

4

Гомельская

20,5

22,1

5

Брестская

9,7

13,4

6

Могилевская

18,2

29,4

R

Радиус

14,1

22,9

Примечание —  Источник: [18]

Переведем данные в полярные координаты:

Таблица 3.2 Данные в полярных координатах

Полярные координаты

r

y/x

угол(рад)

угол(град)

13,411

1,667

1,030

59,036

22,961

1,811

1,066

61,091

40,291

1,606

1,014

58,085

30,144

1,078

0,823

47,151

16,542

1,381

0,944

54,100

34,577

1,615

1,016

58,241

26,850

1,621

1,018

58,323

Примечание —  Источник: собственная разработка

d=√(〖(x_2^ -x_1^ )〗^2+〖(y_2^ -y_1^ )〗^2 )Вычисляя расстояние между объектами для каждого возможного случая по формуле

(1)

Получим следующие результаты:

Таблица 2.3 Суммы расстояний групп по три объекта

Евклидова метрика

Точки

Расстояние

Случай

Представление

Сумма первой скобки

Сумма второй скобки

Сумма общая

1,2

9,571

1

{(1,2,3);(4,5,6)}

53,856

39,640

93,495

1,3

26,882

2

{(1,2,4);(3,5,6)}

36,424

47,648

84,072

1,4

17,243

3

{(1,2,5);(3,4,6)}

19,799

25,494

45,293

1,5

3,384

4

{(1,2,6);(3,4,5)}

42,440

49,811

92,250

1,6

21,168

5

{(1,3,4);(2,5,6)}

56,252

36,663

92,914

2,3

17,403

6

{(1,3,5);(2,4,6)}

54,082

28,965

83,046

2,4

9,610

7

{(2,3,5);(1,4,6)}

48,063

46,065

94,128

2,5

6,845

8

{(2,3,6);(1,4,5)}

34,817

34,495

69,312

2,6

11,700

9

{(2,4,5);(1,3,6)}

30,323

53,765

84,088

3,4

12,126

10

{(2,3,4);(1,5,6)}

39,139

42,670

81,809

3,5

23,816

3,6

5,714

4,5

13,868

4,6

7,654

5,6

18,118

Примечание —  Источник: собственная разработка

Используем формулу  (2) для нахождения разности расстояний между кластерами, используя угловую метрику.

Таблица 2.4 Классификация объектов на основе угловой метрики

Угловая метрика

Точки

Расстояние

Случай

Представление

Сумма первой скобки

Сумма второй скобки

Разность по модулю

R,1

13,476

1

{(R1,R2,R3);(R4,R5,R6)}

30,969

21,587

9,382

R,2

4,015

2

{(R1,R2,R4);(R3,R5,R6)}

20,931

31,625

10,694

R,3

13,478

3

{(R1,R2,R5);(R3,R4,R6)}

27,848

24,709

3,139

R,4

3,440

4

{(R1,R2,R6);(R3,R4,R5)}

25,283

27,273

1,990

R,5

10,356

5

{(R1,R3,R4);(R2,R5,R6)}

30,393

22,163

8,230

R,6

7,792

6

{(R1,R3,R5);(R2,R4,R6)}

37,310

15,246

22,063

7

{(R2,R3,R5);(R1,R4,R6)}

27,849

24,707

3,142

8

{(R2,R3,R6);(R1,R4,R5)}

25,285

27,272

1,987

9

{(R2,R4,R5);(R1,R3,R6)}

17,811

34,745

16,935

10

{(R2,R3,R4);(R1,R5,R6)}

20,932

31,624

10,692

Примечание —  Источник: собственная разработка

Таким образом, как видно из таблиц (2.3) и (2.4) оптимальный случай классификации, при котором попарное Евклидово расстояние между объектами минимально (случай 3) не всегда соответствует минимальному расстоянию между объектами, рассчитанному в метрике, основанной на угловом расстоянии. Такое заключение позволяет нам более гибко подходить к задаче анализа и классификации объектов по определенному признаку.  Данный метод может оказаться полезным также в задачах размещения.

Похожие материалы

Информация о работе