Основні положення комплексного статистичного аналізу даних у правовій статистиці

За допомогою таких групувань можна вивчити зв`язок між злочинністю і “фоновими” явищами (алкоголізмом, наркоманією, розпутством тощо), між злочинністю неповнолітніх та їх сімейно-побутовими умовами життя, між злочинністю і рівнем освіти осіб, які вчинили злочини, і т.п. Цей метод дає змогу встановити наявність чи відсутність зв`язку між явищами, а також загальну тенденцію цієї залежності. Для проведення таких групувань є достатньо даних в статистичній звітності правоохоронних органів.

Наприклад, ми маємо такі дані про роботу 15 суддів місцевого суду (табл. 3).

Таблиця 3. Відомості про кількість розглянутих справ і якість їх розгляду

№ судді

Кількість розглянутих справ

% нескасованих вироків

1

201

79,2

2

183

76,3

3

154

90,2

4

128

88,4

5

113

100

6

98

96,0

7

94

100

8

86

91,0

9

80

100

10

79

100

11

72

83,2

12

68

100

13

49

94,1

14

31

94,2

15

26

100

Використовуючи метод групування, розіб'ємо усі дані на п`ять груп з рівними інтервалами. Для цього від максимальної кількості розглянутих справ (201 справа) віднімемо мінімальну кількість розглянутих справ (26 справ) і одержаний результат поділимо на 5. Інтервали дорівнюватимуть 35 справам. Після цього шляхом нескладних арифметичних розрахунків одержимо такі дані, які будуть наглядно свідчити про залежність якості розгляду справ від завантаженості суддів. Зростання кількості розглянутих справ призводить до зниження якості судочинства і, як наслідок, до зростання питомої ваги скасованих вироків (табл. 4).

Таблиця 4. Залежність якості судочинства від завантаженості суддів.

Групи суддів за кількістю розглянутих справ

Число суддів

Середній відсоток нескасованих вироків на одного суддю

25 - 60

3

95

61 - 95

6

96

96 - 130

3

94

131 - 165

1

90

Більше 165

2

78

Всього:

15

90

Метод групувань, як й інші методи, дає змогу встановити наявність чи відсутність залежності між явищами, а також встановити загальний напрямок цієї залежності.

За допомогою статистичних групувань можна встановити вплив двох і більше факторів на зміну результативної ознаки (комбінаційні групування). Групування важливі і для вивчення зв'язків між якісними та кількісними показниками. Але метод групувань та інші розглянуті методи не дають змоги і не ставлять своїм завданням числове вираження щільності зв'язку. Це питання розв'язується в статистиці лише за допомогою методів кореляції, розроблених математичною статистикою.

Графічний метод. Він використовується для попереднього встановлення наявності зв`язку між явищами та розкриття характеру цього зв'язку, а також для вибору форми зв`язку. У статистиці його застосовують таким чином, на прямокутній системі координат наносяться індивідуальні значення ознаки (факторної) і відповідних йому значень результативної у вигляді окремих точок. (рис 1). На даному рисунку нанесені одночасно вік злочинців і кількість вчинених ними фактів хуліганства в окремих районах міста. Для умовного приклада ми взяли чотири райвідділи міста. Як видно з графіку, ця залежність є оберненою, чим старше злочинці, тим менше фактів хуліганства вони вчиняють . (Приклад умовний, дані наведені в табл. 5).

Таблиця 5. Дані про кількість виявлених осіб, які вчинили хуліганство

№ райвідділу

Вік, кількість років

Всього

16

20

24

28

32

36

40

1

20

17

11

11

9

11

4

83

2

18

15

12

11

10

6

3

75

3

16

14

10

12

9

6

4

71

4

14

8

13

12

10

6

2

65

Всього

68

54

46

46

38

29

13

294

Середня кількість

17

13,5

11,5

11,5

9,5

7,25

3,25

73,5

Рис. 1. Залежність кількості виявлених хуліганств від віку осіб, які їх вчинили.

З графіку (рис. 1) видно, що точки кореляційного поля лежать ні на одній лінії, вони витягнуті смугою зліва направо. Можна згрупувати ці дані по кожній віковій групі і знайти середні значення. (останній рядок табл. 5). Після цього нанести ці середні значення на графік і з`єднуючи їх послідовно відрізками прямих ліній , побудувати так звану емпіричну лінію зв`язку (на графіку 1 - перервна лінія).

Якщо ця емпірична лінія зв`язку по вигляду наближається до прямої лінії, то можна припустити наявність прямолінійної кореляційної залежності між факторною та результативною ознаками. На графіку 1 вона побудована, як лінія неперервна. Якщо ж є тенденція нерівномірної зміни значень результативної ознаки, і емпірична крива наближується до якої-небудь кривої, то це може бути пов`язано з наявністю криволінійної кореляційної залежності.

Регресійний та дисперсійний метод аналізу зв'язків. Цей метод покликаний вирішити три основних завдання:

1) в результаті економічного аналізу встановити форму зв'язку і дати його математичне вираження за допомогою кореляційних рівнянь;

2) встановити щільність зв'язку між факторною (х) і результативною ознакою (у);

3) встановити ті фактори, які в даних конкретних умовах є головними щодо формування результативного фактору.

Перше завдання вирішується в ході аналізу того чи іншого явища. Залежно від форми зв'язку, який визначено на основі попереднього якісного аналізу, кореляційні рівняння можуть мати різний вигляд. У статистиці використовуються прямолінійні та криволінійні кореляційні рівняння.

Теоретичної лінією регресії називають ту лінію, навколо якої групуються точки кореляційного поля і яка вказує основний напрямок, основну тенденцію зв`язку. Теоретична лінія регресії повинна відображувати зміни середніх величин результативної ознаки ух відповідно до зміни факторної ознаки х.

Якщо попередній аналіз явищ, зв'язок між якими вивчається, показує, що рівним змінам середніх значень факторної ознаки відповідають приблизно рівні зміни середніх значень результативної ознаки, то для вираження форми кореляційного зв'язку можна використати прямолінійне кореляційне рівняння:

ух = а0 + а1х,

де ух - ординати шуканої прямої, або вирівнюванні значення результативної ознаки; х - факторна ознака; а0 і а1 - параметри рівняння.

Перший параметр рівняння а0 - ордината лінії при х = 0. Параметр а1, який називається коефіцієнтом регресії, - це показник середньої зміни ознаки у на одиницю ознаки х в межах даного дослідження.

Якщо ми маємо обернену залежність між результативною та факторною ознакою, то рівняння лінійної залежності буде мати вигляд:

ух = а0 - а1х,.

Така лінія регресії нами побудована на рисунку 1. Її параметри будуть мати вигляд: y = 24,438-0,4978x.

Для знаходження параметрів рівняння а0 і а1 застосовують спосіб найменших квадратів. Цей спосіб полягає в тому, що знаходять такі значення коефіцієнтів рівняння, при яких сума відхилень фактичних значень результативної ознаки від обчислених за допомогою рівняння буде найменша з усіх можливих, тобто сума відхилень точок кореляційного поля від відповідних точок теоретичної лінії регресії дорівнює нулю.

Якщо попередній аналіз досліджуваних явищ, зв'язок між якими вивчається, показує, що рівним змінам середніх значень факторної ознаки відповідають нерівні зміни середніх значень результативної ознаки, то для вираження загального характеру зв'язку застосовують криволінійні форми кореляційних рівнянь, з яких найбільш частіше використовуються вирівнювання за параболою і гіперболою.

Прямолінійне кореляційне рівняння має більш широке застосування, тому що його параметри легше обчислити, хоча в реальному житті лінійний зв'язок між явищами суспільного життя зустрічається дуже рідко. Але якщо вибрати не тривалий термін часу, то яка завгодно крива лінія обов`язково наближується до прямої лінії. Тому вибір прямої лінії можна розглядати як деяке спрощення дійсної залежності між явищами і істотного спрощення усіх розрахунків.

Друге завдання кореляційного аналізу - це вимірювання щільності зв'язку, тобто ступеня впливу х на варіацію ознаки у. Щільність кореляційного зв'язку оцінюється за допомогою коефіцієнта кореляції та кореляційного відношення. Коефіцієнт кореляції - це числова характеристика, що виражає взаємозв'язок і спільний розподіл двох випадкових величин. Він достатньо точно оцінує ступінь щільності взаємозв`язку при наявності лінійної залежності між факторними та результативною ознаками. При наявності криволінійної залежності він недооцінює ступінь щільності зв`язку, тому рекомендується використовувати у якості показника ступеню щільності зв`язку кореляційне відношення. Обчислення кореляційного відношення можливо лише при наявності достатньо великої кількості даних, які наведені, як правило, у вигляді групової таблиці. Обчислення кореляційного відношення при великій кількості груп і малої кількості одиниць у кожній групі позбавлено сенсу.

Індекс кореляції завжди повинен знаходитися в межах від нуля до одиниці. Якщо індекс кореляції дорівнює нулю, то немає ніякого взаємозв`язку між досліджуваними явищами, інакше кажучи, результативна ознака не залежить зовсім від зміни цієї факторної ознаки. Якщо індекс кореляції дорівнює одиниці, то це свідчить про наявність повного, функціонального зв`язку між явищами, про те, що результативна ознака повністю залежить від зміни факторної ознаки.

Чим ближче одержаний результат до одиниці, тим більш щільно результативна ознака залежить від факторної, і навпаки.

Індекс кореляції може мати як знак плюс, так і знак мінус. Якщо залежність між показниками пряма, то індекс кореляції має знак плюс; якщо залежність між показниками обернена, то індекс кореляції матимемо знак мінус.

Оцінити щільність взаємозв`язку можна лише за допомогою законів математичної статистики. З цією метою застосовуються спеціальні таблиці. На практиці для більшості економічних розрахунків вважається, що він обов`язково повинен бути більше 0,75, щоб більше, ніж на три четверті зміна результативної ознаки складалась під впливом факторної.

За прикладом (табл. 5) коефіцієнт кореляції дорівнює -0,97247, тобто на 97,2 % вчинення злочину залежить від віку злочинців. (Умовний приклад). Якщо в дійсності коефіцієнт кореляції має таке значення, то слід мати на увазі, що в цьому випадку можна казати про те, що між показниками існує дуже щільний зв`язок, який наближує його до функціонального.

В юридичній науці була зроблена спроба розробити спеціальний коефіцієнт кореляції між показниками судимості та покарання, але ця формула не знайшла розповсюдження, тому ми її не наводимо.