1. Правова система ipLex360
  2. Законодавство
  3. Наказ


ДЕРЖАВНИЙ КОМІТЕТ СТАТИСТИКИ УКРАЇНИ
Н А К А З
13.08.2003 N 263
( Наказ втратив чинність на підставі Наказу Державної служби статистики N 82 від 08.04.2011 )
Про затвердження Методики формування вибіркової сукупності звітуючих одиниць в обстеженні малих підприємств
Відповідно до статті 14 Закону України "Про державну статистику" та з метою здійснення аналізу діяльності малих підприємств на підставі відібраної для спостереження вибіркової сукупності
НАКАЗУЮ:
1. Затвердити схвалену методичною комісією Держкомстату Методику формування вибіркової сукупності звітуючих одиниць в обстеженні малих підприємств (додається).
2. Управлінню структурної статистики Головного управління статистики підприємств (Книшенко І.Ф.):
2.1. Здійснювати організаційне керівництво щодо застосування у практичній роботі зазначеної методики на державному рівні.
2.2. Направити у десятиденний термін затверджену даним наказом Методику формування вибіркової сукупності звітуючих одиниць в обстеженні малих підприємств Головному управлінню статистики в Автономній Республіці Крим, обласним, Київському та Севастопольському міським управлінням статистики до відома.
3. НДІ статистики Держкомстату (Гладуну О.М.) здійснювати методологічний супровід застосування зазначеної методики та подальший розвиток математико-статистичних методів в проведенні вибіркових обстежень малих підприємств.
4. Контроль за виконанням цього наказу покласти на першого заступника Голови Комітету Головка В.А.
Голова Комітету О.Г.Осауленко
ЗАТВЕРДЖЕНО
Наказ Держкомстату України
13.08.2003 N 263
СХВАЛЕНО
Протокол вченої ради
НДІ статистики
Держкомстату України
29.03.2001 N 1,
Рішення методичної комісії
Держкомстату України
03.06.2003
МЕТОДИКА
ФОРМУВАННЯ ВИБІРКОВОЇ СУКУПНОСТІ ЗВІТУЮЧИХ ОДИНИЦЬ В ОБСТЕЖЕННІ МАЛИХ ПІДПРИЄМСТВ
1. Загальні положення
1.1. Вступ
Важливим фактором перебудови економіки країни шляхом реформування відносин власності та запровадження ринкових методів господарювання є активізація діяльності малих підприємств. Підтримка та сприяння подальшому розвитку малого підприємництва визначені Урядом країни як одне з найважливіших завдань державної політики.
В Україні на сьогодні функціонує майже 250 тис. малих підприємств - юридичних осіб і протягом останніх років спостерігається стійка тенденція до зростання їх кількості.
Для систематичного відстеження діяльності малих підприємств прийнятним є вибірковий метод статистичного спостереження. Вибір такого методу статистичного спостереження обґрунтовується, по-перше, невиправданістю значних матеріальних, фінансових і трудових витрат, яких потребує суцільне обстеження малих підприємств, беручи до уваги їх велику кількість, а, по-друге, необхідністю зменшення звітного навантаження на підприємство.
Метою вибіркового обстеження є здійснення аналізу діяльності малих підприємств(*), на підставі відібраної для спостереження вибіркової сукупності.
---------------
(*) визначених відповідно до чинного законодавства.
Проведення вибіркового спостереження малих підприємств передбачає виконання таких етапів:
- формування основи вибірки;
- формування вибіркової сукупності малих підприємств;
- збір первинної інформації від відібраних до вибіркової сукупності малих підприємств, введення цієї інформації;
- проведення контролів, коригування та збереження інформації;
- розповсюдження даних вибіркової сукупності на генеральну та розрахунок характеристик точності отриманих результатів, формування підсумків обстеження у всіх необхідних для аналізу розрізах.
Предметом даної методики є визначення цільової сукупності малих підприємств, формування основи вибірки та вибіркової сукупності малих підприємств.
1.2. Основні поняття та визначення
Ознака - характеристика одиниці спостереження, яка підлягає реєстрації в процесі статистичного спостереження. Наприклад, якщо одиницею спостереження є промислове підприємство, то його ознаками можуть бути: середньооблікова кількість штатних працівників облікового складу, вартість основних виробничих фондів, а також форма власності, належність до того чи іншого виду економічної діяльності тощо.
Одиниця спостереження (ОС) - первинний елемент об'єкту статистичного спостереження, що характеризується сукупністю ознак. В обстеженні малих підприємств одиницею спостереження є мале підприємство, визначене як таке законодавчо.
Цільова (досліджувана) сукупність - сукупність одиниць спостереження, що складає об'єкт дослідження і підлягає статистичному вивченню.
Генеральна сукупність (основа вибірки) - сукупність одиниць спостереження за реєстром підприємств.
Вибіркова сукупність (вибірка) - сукупність одиниць спостереження, яка для проведення обстеження відібрана за певними правилами із основи вибірки.
Одиниці відбору - частини основи вибірки, що являються елементами відбору. Вони можуть співпадати з одиницями спостереження, а можуть і не співпадати. Наприклад, у певному обстеженні одиницею спостереження визначається одиниця виду економічної діяльності, а одиницею основи вибірки є підприємство. За таких обставин респондент при складанні звітності має виділити окремі одиниці виду економічної діяльності та надати інформацію щодо них.
План вибірки - організаційно-логічна модель структури вибіркової сукупності.
Стратифікований (типовий, районований) відбір - це спосіб формування вибірки з урахуванням структури генеральної сукупності. Цей відбір передбачає попередню структуризацію генеральної сукупності і незалежний відбір одиниць у кожній складовій, яку називають стратою (групою, типом, районом тощо). При стратифікованому відборі генеральна сукупність ділиться на страти (групи, типи, райони тощо). Страти не мають спільних одиниць і разом вичерпують усю генеральну сукупність.
Оптимальний стратифікований (типовий, районований) відбір - відбір одиниць у визначених стратах пропорційний середньому квадратичному відхиленню та кількості одиниць у цих стратах.
Розповсюдження (екстраполяція) - розрахунок даних генеральної сукупності за вибірковими даними.
Репрезентативна (представницька) вибірка - вибірка, яка адекватно відображає систему ознак обстежуваної сукупності. Мірою репрезентативності вибірки є похибки репрезентативності вибірки.
Похибка вибірки (репрезентативності) - різниця між істинним значенням статистичного показника та його значенням, розрахованим у вибірці. Найчастіше використовують такі показники похибки вибірки: "стандартна похибка", "коефіцієнт варіації".
1.3. Система позначень
N - загальна кількість одиниць, обсяг генеральної сукупності;
n - кількість одиниць у вибірці, обсяг вибірки;
f - вибіркова пропорція, частка відбору (n/N);
H - кількість страт;
h - номер страти;
Yh - генеральне значення i-ї одиниці у страті h;
i
N - розмір генеральної сукупності у страті h;
h
n - кількість одиниць вибірки у страті h;
h
n
h
f = -- - частка відбору у страті h;
h N
h
N
h
W = -- - вага страти h;
h N
y - вибіркове значення i-ї одиниці у страті h;
hi
N
h
Z Y
- i=1 hi
Y = ------- - істинне середнє генеральної сукупності
h N
h
(генеральне середнє) у страті h;
n
h
Z y
- i=1 hi
y = ------- - вибіркове середнє у страті h;
h n
h
N
h -- 2
Z (Y - Y )
2 i=1 hi h
S = ---------------- - істинна дисперсія генеральної
h N - 1
h
сукупності (генеральна дисперсія) у страті h.
n
h -- 2
Z (y - y )
2 i=1 hi h
s = ---------------- - вибіркова дисперсія в страті h.
h n - 1
h
Z - знак суми.
2. Вибіркове обстеження: постановка задачі та етапи її розв'язання
2.1. Визначення основи вибірки
Основа вибірки (генеральна сукупність) формується на основі даних річного структурного обстеження підприємств за формами N 1-підприємництво (річна) та N 1-підприємництво (коротка) - річна "Звіт про основні показники діяльності підприємства" та Єдиного державного реєстру підприємств та організацій України (ЄДРПОУ) відповідно до законодавчих критеріїв визначення малих підприємств.
Технологія формування основи вибірки передбачає два етапи:
1) Із бази даних структурного обстеження, останнього за часом проведення, відбираються малі підприємства і включаються до генеральної сукупності за наступними показниками:
- ідентифікаційний код підприємства за ЄДРПОУ;
- територія за Класифікатором об'єктів адміністративно-територіального устрою України (КОАТУУ);
- основний вид економічної діяльності підприємства за Класифікацією видів економічної діяльності (КВЕД);
- форма власності за Класифікацією форм власності (КФВ);
- організаційно-правова форма господарювання за Класифікацією організаційно-правових форм господарювання (КОПФГ);
- обсяг виробленої продукції (робіт, послуг) у вартісному вимірюванні;
- обсяг реалізованої продукції (робіт, послуг) у вартісному вимірюванні;
- середньооблікова кількість штатних працівників облікового складу;
- фонд заробітної плати.
2) На підставі реєстраційних відомостей ЄДРПОУ відібрана сукупність підприємств коригується на підприємства, що ліквідовані за період до початку звітного періоду та новостворені у звітному періоді.
2.2. Побудова плану вибірки, визначення обсягу вибірки та формування вибіркової сукупності
При проведенні вибіркових спостережень діяльності малих підприємств, як свідчить вітчизняний і міжнародний досвід, для отримання репрезентативної вибірки, формування вибіркової сукупності здійснюється шляхом стратифікованого (типового, районованого) пропорційного відбору.
Формування вибіркової сукупності із застосуванням стратифікованого відбору передбачає вирішення наступних завдань.
I. Визначення основних та додаткових показників стратифікації та побудова страт за визначеними показниками стратифікації.
II. Визначення обсягу вибірки на підставі даних структурного обстеження і ЄДРПОУ із застосуванням методів багатовимірного статистичного аналізу (розвідувального аналізу даних, дисперсійного, регресивного та факторного аналізу тощо) та враховуючи обмеження в фінансових коштах.
III. Побудова плану вибіркового обстеження та здійснення відбору одиниць спостереження, які будуть залучатися до статистичного спостереження.
I. Першим етапом формування вибіркової сукупності є стратифікація (розшарування, групування). При цьому, слід відзначити, що для кожної одиниці спостереження значення ознаки, за якою здійснюється стратифікація, повинно бути присутнім у генеральній сукупності і актуалізуватись незалежно від того, чи були дані підприємства відібрані до вибіркової сукупності.
Стратифікація одиниць спостереження генеральної сукупності здійснюється за основними та додатковими показниками на відповідне число страт.
Визначення основних показників стратифікації проводиться із застосуванням однофакторного дисперсійного аналізу. Результати однофакторного дисперсійного аналізу для основних показників стратифікації подані у таблицях 4 - 7, на рисунках 1 - 4 додатка 1.
Із використанням лінійного регресивного аналізу досліджувався
зв'язок між основними характеристиками підприємств малого бізнесу:
y - обсяг виробленої продукції, робіт та послуг (у діючих цінах),
i
x - середньооблікова кількість штатних працівників облікового
i
складу для i-того підприємства. Результати статистичного аналізу
регресивної моделі зв'язку цих характеристик y (регресанд -
залежна змінна), x (регресор - незалежна змінна) представлені у
таблиці 9 додатка 1.
Факторний аналіз дозволяє знижувати розмірність простору вхідних змінних та проводити класифікацію вимірюваних ознак та досліджуваних об'єктів в просторі головних компонент. За методом факторного аналізу була опрацьована галузева структура підприємств промисловості для інтерпретації розподілу підприємств за регіонами України. Результати статистичного аналізу факторної моделі за показниками КВЕД (за підсекціями секції D) та КОАТУУ методом головних компонент у просторі двох перших головних факторів подані на рисунку 5 додатка 1.
Отже, на першому етапі формування вибіркової сукупності за результатами статистичного аналізу генеральної сукупності методами однофакторного дисперсійного, регресивного та факторного аналізу визначено наступні основні та додаткові показники стратифікації (розшарування).
Основні показники стратифікації:
- основний вид економічної діяльності підприємств для промислових та будівельних підприємств (визначено 17 страт на рівні секцій та підсекцій за КВЕД (при цьому секція C - без розподілу за підсекціями));
- середньооблікова кількість штатних працівників облікового складу, що є характеристикою розміру підприємств для промислових та будівельних підприємств (визначено 7 страт: 1 страта - 0 осіб і нульовий обсяг виробленої продукції, робіт та послуг; 2 страта - 0-4 осіб та ненульовий обсяг виробленої продукції, робіт та послуг; 3 страта - 5-9 осіб та ненульовий обсяг виробленої продукції, робіт та послуг; 4 страта - 10-19 осіб; 5 страта - 20 і більше 20 осіб; 6 страта - 1-9 осіб та нульовий обсяг виробленої продукції, робіт та послуг; 7 страта - 1-49 осіб (нетипові підприємства)).
Додатковий показник стратифікації:
- територіальна належність підприємства (27 страт на рівні регіонів України: Автономна Республіка Крим, 24 області, м. Київ і м. Севастополь).
II. Кількість підприємств у вибірці за стратами визначається відповідно до алгоритму оптимального розміщення Неймана:
N S
h h
n = n --------- , (1)
h H
Z N S
h=1 h h
N
h -- 2
Z (Y - Y )
2 i=1 ni h
де S = ---------------- - дисперсія генеральної сукупності Y
h N - 1
h
у страті h,
Z - знак суми;
n - кількість ОС, які вибираються із h страти, N - обсяг h
h h
страти, H - кількість страт, Y - базове значення ознаки Y ОС у
hi
страті h (наприклад, обсяг виробленої продукції, робіт та послуг
(у діючих цінах), середнє значення ознаки Y генеральної сукупності
N
h
Z Y
- i=1 hi
страти h: Y = ------- .
h N
h
Тобто, розмір вибірки у страті h повинен бути пропорційним
N S . У деяких випадках формула дає n > N . Тоді розмір вибірки у
h h h h
страті h дорівнює розміру сукупності у страті h: n = N .
h h
Надлишкову кількість одиниць розподіляємо на інші страти з
розміром вибірки n - N .
h h
Кількість одиниць спостереження - підприємств, які підлягають
обстеженню (загальна кількість підприємств у вибірці), буде
визначатися, виходячи з того, що значення коефіцієнта варіації
S
(K = --- ) за показником "обсяг виробленої продукції, робіт та
var -
Y
послуг" підприємства, не повинен перевищувати 5 (значення
коефіцієнта варіації "5" приймається за критичне, у випадку його
перевищення необхідно здійснювати постстратифікацію).
За результатами досліджень із врахуванням оцінок точності
параметрів загальний обсяг вибіркової сукупності не повинен
перевищувати 20% від обсягу генеральної сукупності.
III. На третьому етапі формування вибіркової сукупності план вибірки формується у табличному вигляді за основними і додатковими показниками стратифікації (табл. 2).
Таблиця 2. Основні та додаткові показники стратифікації ОС плану вибіркової сукупності
--------------------------------------------------------------------------------------
|Ідентифікаційний|Код за|Код| Код за | Обсяг | Обсяг |Середньооблікова|
|код підприємства|КОАТУУ|за | КВЕД |виробленої|реалізованої| кількість |
| за ЄДРПОУ | |КФС| ( v0441217-96 )|продукції,| продукції, | штатних |
| | | | | робіт та | робіт та | працівників |
| | | | | послуг у | послуг у | облікового |
| | | | | діючих | діючих | складу, осіб |
| | | | | цінах, | цінах, | |
| | | | | тис.грн. | тис.грн. | |
|----------------+------+---+---------------+----------+------------+----------------|
| - | - | - | - | - | - | - |
--------------------------------------------------------------------------------------
Додаткові умови здійснення відбору.
- Для кожної страти кількість ОС має бути не менше 5.
- Для кожної h страти ОС, для яких ознака обсягу виробленої
продукції, робіт та послуг підприємства Y попадає за межі
hi
інтервалу:
Y
- hi
|Y - Y | >= 3 * S , i = ------ (2)
| hi h| h 1, N ,
h
враховується індивідуально (без поширення) з нульовою дисперсією.
- Страти з кількістю підприємств до 10 у вибіркову сукупність включаються у повному складі.
- Розмір вибірки в страті коригується на відсоток невідповідей (за результатами попередньо проведеного обстеження), а саме збільшується (зменшується) при високому (низькому) значенні відсотку невідповідей.
- Попередньо перед відбором в кожній із страт одиниці спостереження упорядковуються за кодом території за КОАТУУ.
- Нетипові підприємства групуються в окрему страту або в декілька в разі їх неоднорідності і включаються до вибіркової сукупності у повному складі з вагою, що дорівнює одиниці.
- Розмір вибіркових страт коригується в залежності від статистичних характеристик, а саме збільшується (зменшується) в стратах з високим (низьким) показником варіації при незмінному загальному розмірі вибіркової сукупності.
- Підприємства з нульовою кількістю штатних працівників та нульовим обсягом виробленої продукції (робіт, послуг) групуються в окрему страту і не обстежуються, а їх показники обчислюються за результатами попередніх обстежень.
- Підприємства, у яких відсутні штатні працівники, але обсяг виробленої продукції (робіт, послуг) є ненульовим, групуються в окрему страту з низьким відсотком відбору.
- Новостворені підприємства року r (які не обстежувались у ньому) в обстеженні року r + 1 за відсутності даних про середньооблікову кількість штатних працівників облікового складу стратифікуються за одним показником заявленого виду економічної діяльності.
- Новостворені підприємства звітного року залучаються до обстеження за заявленим видом економічної діяльності із встановленим низьким відсотком відбору.
План вибірки залишається стабільним як мінімум протягом двох - трьох років і може бути модифікований у разі зміни характеристик вибіркової сукупності.
План вибірки за основними показниками стратифікації ( КВЕД та середньооблікова кількість штатних працівників облікового складу) та додатковим показником стратифікації (КОАТУУ) представлено у таблицях 10 - 15, на рисунках 6 - 8 додатка 2.
3. Побудова статистичних оцінок характеристик генеральної сукупності
3.1. Точкові та інтервальні оцінки за основними показниками стратифікації
Методика побудови статистичних прогнозних оцінок показників
малих підприємств на базі статистичних даних, відомостей ЄДРПОУ за
основними показниками стратифікації базується на використанні
апарату математичних методів вибіркових досліджень, зокрема,
методу стратифікованого опитування.
Для кожної страти будуються точкові оцінки середнього і
загального, відповідні 95% довірчі інтервали, оцінюються
інтегральні характеристики України з поширенням середнього основи
вибірки (генеральної сукупності). При цьому індекси h та i
позначають відповідно номер страти та номер одиниці всередині
страти.
Для оцінки середнього значення на одиницю для сукупності при
стратифікованому опитуванні використовується Y:
H -
Z N Y
- h=1 h h H -
Y = --------- = Z W Y . (3)
N h=1 h H
Z - знак суми.
При стратифікованому випадковому відборі дисперсія оцінки Y
має вигляд
2
S
H h
Z N (N - n ) -- 2
h=1 h h h n S
2 - h H 2 h
S (Y) = ------------------- = Z W -- (1 - f ), (4)
2 h=1 h n h
N h
Z - знак суми;
2
де S - дисперсія для h-ої страти генеральної сукупності.
h
-
Незміщеною оцінкою дисперсії s(y) є статистика:
H 2 2
Z N (N - n ) s s
2 - h=1 h h h h H 2 h
s (y) = ---------------- -- = Z W -- (1 - f ), (5)
2 n h=1 h n h
N h h
Z - знак суми;
2
де s - вибіркова дисперсія для h-ої страти.
h
Довірчі інтервали для середнього значення, що обчислюються з
використанням дисперсії для h-ої страти генеральної сукупності
мають вигляд:
- -
Y +- t S (Y) (6)
p
і відповідно для сумарного (загального) значення:
- -
N Y +- t N S (Y) (7)
p
Довірчі інтервали для середнього значення, що обчислюються з
використанням вибіркової дисперсії для h-ої страти мають вигляд:
- -
y +- t s (y), (8)
p
і відповідно для сумарного (загального) значення:
- -
N y +- t N s (y). (9)
p
-
У цих формулах допускається, що y має нормальний розподіл, де
t - квантиль стандартного нормального розподілу або розподілу
p
Стьюдента, який відповідає довірчій імовірності p. Якщо обсяг
вибірки більше 30, тоді t береться із таблиць стандартного
p
нормального розподілу, інакше t знаходиться за таблицею розподілу
p
Стьюдента.
3.2. Точкові та інтервальні оцінки за додатковими показниками стратифікації
Точкові та інтервальні оцінки за додатковими показниками
розраховуються відповідно до нижченаведених формул.
Наступні позначення відносяться до одиниць із страти h, які
належать під страті i, y - поточні значення ознаки:
кількість одиниць у генеральній сукупності: N , Z N = N ;
hj j hj h
кількість одиниць у вибірці: n , Z n = n ;
hj j hj h
результат спостереження для окремої одиниці: y ,
hji
вибіркове середнє:
n y
- hj hji
y = Z ---- , (10)
hj i=1 n
hj
середнє за генеральною сукупністю:
N Y
- hj hji
Y = Z ---- , (11)
hj i=1 N
hj
загальне та середнє значення по всіх стратах для підстрати j,
відповідно:
Y
- - j
Y = Z N Y , Y = -- , (12)
j h hj hj j N
j
де N = Z N . (13)
j h hj
Виходячи з того, що в нашому випадку n та n - випадкові
hj h
змінні, то оцінкою загального значення ознаки (показника) для
підстрати j є:
N n
h hj
y = Z -- Z y . (14)
j h n i=1 hji
h
Оцінка дисперсії:
2 2
N n (Z y )
h - hj 2 hji -
s (y ) = Z ----------- (1 - f ) | Z y - --------- |, (15)
j h n (n - 1) h - i=1 hji n -
h h h
де f частка відбору з h-ої страти: f = n / N . (16)
n h h h
N
^ h
Вибіркова оцінка числа ОС j-ої підстрати: N = Z -- n . (17)
j h n hj
h
Z - знак суми.
Оцінка середнього значення ознаки для j-ої підстрати:
- ^
Y = y / N (18)
j j j
Коефіцієнт варіації загального значення ознаки:
--------
\| s (y )
j
k = --------- (19)
var y
j
Довірчі інтервали для загального значення ознаки:
--------
y +- t \| s (y ) , (20)
j p j
де t - квантиль стандартного нормального розподілу або
p
розподілу Стьюдента, який відповідає довірчій імовірності p. Якщо
обсяг вибірки більше 30, тоді t береться з таблиць стандартного
p
нормального розподілу, інакше t знаходиться за таблицею розподілу
p
Стьюдента з числом степенів свободи m у кожній страті:
H 2 2 H 2 4
m = ( Z a s ) / ( Z a s (n - 1)),
h=1 h h h=1 h h h
де a = N (N - n ) / n .
h h h h h
Z - знак суми.
Результати обчислень оцінок вартості обсягу виробленої
продукції, робіт та послуг промислових та будівельних підприємств
у діючих цінах та їх довірчих інтервалів за даними суцільного
статистичного спостереження 2001 р., планом вибірки і відгуками
підприємств за I півріччя 2002 р. подано у таблиці 16 додатка 3.
Література
1. Закон України від 19 жовтня 2000 року N 2063-III "Про державну підтримку малого підприємництва".
2. Товмаченко Н.М., Парфенцева Н.О. Методологічні основи проведення статистичного аналізу структури економіки України за класифікацією видів економічної діяльності. К., 1999. - 49 с.
3. Програма реформування державної статистики на період до 2002 року. Постанова Кабінету Міністрів України від 27 червня 1998 року N 971.
4. Державний класифікатор України. Класифікація видів економічної діяльності. ДК 016-97. - Держстандарт України. - 1996. - 249 с.
5. Державний класифікатор України. Класифікатор об'єктів адміністративно-територіального устрою України. ДК 014-97. - Держстандарт України. - 1997. - 1196 с.
6. Кокрен У. Методы выборочного исследования. - М.: Статистика, 1976. - 440 с.
7. Мостеллер Ф., Тьюки Дж. Анализ данных и регрессия: В 2-х вып. Вып. 1-М.: Финансы и статистика, 1982. - 317 с.
8. Мостеллер Ф., Тьюки Дж. Анализ данных и регрессия: В 2-х вып. Вып. 2-М.: Финансы и статистика, 1982. - 239 с.
9. Харман Г. Современный факторный анализ. - М.: Статистика, 1972. - 486 с.
10. Шеффе Г. Дисперсионный анализ. - М.: Наука, 1980. - 512 с.
11. Черняк О.І. Техніка вибіркових досліджень.- К.: МІВВЦ, 2001. - 248 с.
12. А.Виллебоордсе. Руководство по планированию и проведению статистических обследований предприятий. - Люксембург: Евростат, 2000. - 209 с.
13. Статистика предприятий. - Штуттгарт: Метцлер-Пэшель, 1996. - 272 с.
Додаток 1
Визначення основних та додаткових показників стратифікації за методами однофакторного дисперсійного, регресивного та факторного аналізу
Однофакторний дисперсійний аналіз
При однофакторному дисперсійному аналізі вимірюється лише
один фактор, незалежно від того, чи є його рівні якісними чи
кількісними, фіксованими чи випадковими. Для позначення ефекту
j-рівня використовують символ альфа . Припускається, що головний
j
фактор можна вважати визначною причиною змін досліджуваної
змінної. Модель такого експерименту можна навести так:
X = мю + альфа + кси ,
ij j ij
де X позначає i-е спостереження на j-ому рівні ( j = 1,...,
ij
k, i = 1,..., n ), (мю - загальний ефект всього експерименту,
j
альфа - ефект j-го рівня, кси - випадкова похибка i-го
j ij
спостереження на j-ому рівні).
Результати однофакторного дисперсійного аналізу представляють
за схемою, приведеною в таблиці 1.
Таблиця 1. Результати однофакторного дисперсійного аналізу
---------------------------------------------------------------------------------------------------------------------
| Джерело | Кількість | Сума квадратів SS | Середній | F-критерій | Гіпотеза |
| дисперсії | ступенів свободи | | квадрат MS | |H : альфа = 0 |
| | | | | | 0 j |
|-------------+------------------+-------------------------------+-----------------+--------------+-----------------|
|Міжгрупова |k - l = n | k - - 2 |MS = SS /n |F = MS /MS |Гіпотеза |
|дисперсія | 1 |SS = Z n (x - G ), (1) | a a 1 | p a кси|H : альфа = 0, |
|(обумовлена | | a j=1 j j | | | 0 j |
|дією фактора)| | | | |якщо: |
|-------------+------------------+-------------------------------+-----------------| |F <= F |
|Внутрішньо | k | n |MS = SS /n | | p kp |
|групова | Z (n - 1) = n | k j - 2 | кси кси 2| | |
|(дисперсія |j=1 j 2 |SS = Z Z (x - x ), (2)| | |(альфа/2, n , n )|
|відтворення) | | кси j=1 i=1 ij j | | | 1 2 |
| | |-------------------------------| | | |
| | | n | | | |
| | | j | | | |
| | | Z x | | | |
| | |- i=1 ij | | | |
| | |x = -------- , (3) | | | |
| | | j n | | | |
| | | j | | | |
|-------------+------------------+-------------------------------+-----------------+--------------+-----------------|
|Загальна | k | n | | | |
|дисперсія |N - 1 = Z n - 1| k j - 2 | | | |
| | j=1 j |SS = Z Z (x - G ), (4) | | | |
| | | 0 j=1 i=1 ij | | | |
| | |-------------------------------| | | |
| | | n | | | |
| | | k j | | | |
| | | Z Z x | | | |
| | |- j=1 i=1 ij | | | |
| | |G = ----------- , (5) | | | |
| | | k | | | |
| | | Z n | | | |
| | | j=1 j | | | |
---------------------------------------------------------------------------------------------------------------------
Z - знак суми.
Перевірка статистичної значущості впливу фактора здійснюється
за F-критерієм Фішера. В однофакторному дисперсійному аналізі
гіпотеза H : альфа = 0 перевіряється для всіх j. Якщо гіпотеза
0 j
приймається, то ніяких ефектів рівнів немає і кожне спостереження
X подається середнім сукупності мю із випадковою похибкою кси .
ij ij
Для перевірки гіпотези H : альфа = 0 застосовується критерій
0 j
Фішера (F-критерій). Для цього розраховується значення F-критерія
F (таблиця 1) та знаходиться його критичне значення F із
p kp
таблиці розподілу Фішера з відповідними параметрами. Якщо
виконується нерівність F > F , то гіпотеза H : альфа = 0
p kp 0 j
відхиляється, - це означає, що ефекти рівнів існують. В противному
випадку гіпотеза приймається.
З використанням пакета статистичних програм SPSS отримані
наступні результати дисперсійного аналізу.
Таблиця 2. Одновимірні статистики (мінімальне та максимальне значення, кількість підприємств в страті) за 4 стратами КВЕД для генеральної сукупності (ідентифікатор G2001 - обсяг виробленої продукції, робіт та послуг (у діючих цінах, тис.грн.); ідентифікатор G5101 - середньооблікова кількість штатних працівників облікового складу (осіб)
------------------------------------------------------------------
| SKVP | | G2001 | G5101 |
|---------------+----------------+----------------+--------------|
| C |Minimum | ,0 | 0 |
| |----------------+----------------+--------------|
| |Maximum | 1609,2 | 50 |
| |----------------+----------------+--------------|
| |N | 546 | 546 |
|---------------+----------------+----------------+--------------|
| D |Minimum | -306,2 | 0 |
| |----------------+----------------+--------------|
| |Maximum | 7074,0 | 50 |
| |----------------+----------------+--------------|
| |N | 36326 | 36326 |
|---------------+----------------+----------------+--------------|
| E |Minimum | -5,3 | 0 |
| |----------------+----------------+--------------|
| |Maximum | 2143,6 | 50 |
| |----------------+----------------+--------------|
| |N | 954 | 954 |
|---------------+----------------+----------------+--------------|
| F |Minimum | -69,8 | 0 |
| |----------------+----------------+--------------|
| |Maximum | 21005,0 | 50 |
| |----------------+----------------+--------------|
| |N | 19966 | 19966 |
|---------------+----------------+----------------+--------------|
| Total |Minimum | -306,2 | 0 |
| |----------------+----------------+--------------|
| |Maximum | 21005,0 | 50 |
|---------------+----------------+----------------+--------------|
| |N | 57792 | 57792 |
------------------------------------------------------------------
Таблиця 3. Одновимірні статистики (мінімальне та максимальне значення, кількість підприємств у страті) за 7 стратами розміру за середньообліковою кількістю штатних працівників облікового складу для генеральної сукупності (ідентифікатор G2001 - обсяг виробленої продукції, робіт та послуг (у діючих цінах, тис.грн.); ідентифікатор G5101 - середньооблікова кількість штатних працівників облікового складу (осіб)
------------------------------------------------------------------
| SZ | | G2001 | G5101 |
|---------------+----------------+----------------+--------------|
| 1 |Minimum | ,0 | 0 |
| |----------------+----------------+--------------|
| |Maximum | ,0 | 0 |
| |----------------+----------------+--------------|
| |N | 4315 | 4315 |
|---------------+----------------+----------------+--------------|
| 2 |Minimum | -34,9 | 0 |
| |----------------+----------------+--------------|
| |Maximum | 2398,3 | 4 |
| |----------------+----------------+--------------|
| |N | 22037 | 22037 |
|---------------+----------------+----------------+--------------|
| 3 |Minimum | -306,2 | 5 |
| |----------------+----------------+--------------|
| |Maximum | 2384,3 | 9 |
| |----------------+----------------+--------------|
| |N | 10527 | 10527 |
|---------------+----------------+----------------+--------------|
| 4 |Minimum | -40,1 | 10 |
| |----------------+----------------+--------------|
| |Maximum | 2430,3 | 19 |
| |----------------+----------------+--------------|
| |N | 10184 | 10184 |
|---------------+----------------+----------------+--------------|
| 5 |Minimum | -69,8 | 20 |
| |----------------+----------------+--------------|
| |Maximum | 2495,0 | 50 |
| |----------------+----------------+--------------|
| |N | 9561 | 9561 |
|---------------+----------------+----------------+--------------|
| 6 |Minimum | ,0 | 1 |
| |----------------+----------------+--------------|
| |Maximum | ,0 | 9 |
| |----------------+----------------+--------------|
| |N | 1152 | 1152 |
|---------------+----------------+----------------+--------------|
| 7 |Minimum | 2515,5 | 1 |
| |----------------+----------------+--------------|
| |Maximum | 21005,0 | 49 |
| |----------------+----------------+--------------|
| |N | 16 | 16 |
|---------------+----------------+----------------+--------------|
| Total |Minimum | -306,2 | 0 |
| |----------------+----------------+--------------|
| |Maximum | 21005,0 | 50 |
| |----------------+----------------+--------------|
| |N | 57792 | 57792 |
------------------------------------------------------------------
Таблиця 4. Результати однофакторного дисперсійного аналізу за стратами КВЕД (C, D, E, F) щодо обсягу виробленої продукції, робіт та послуг (у діючих цінах, тис.грн.) для генеральної сукупності
---------------------------------------------------------------------------------
| Джерело |Кількість|Сума квадратів| Середній |Значення| Імовірність |
| дисперсії |ступенів | SS | квадрат MS| F- | прийняття |
| |свободи | | |критерію| гіпотези |
| | | | | |H : альфа = 0|
| | | | | | 0 j |
|-----------------+---------+--------------+-----------+--------+---------------|
|Міжгрупова | 3 | 5647312,061 |1882437,354| 18,37 | ,000 |
|дисперсія | | | | | |
|(обумовлена дією | | | | | |
|фактора) | | | | | |
|-----------------+---------+--------------+-----------+--------+---------------|
|Внутрішньогрупова| 57788 |5921805678,51 | 102474,66 | | |
|дисперсія | | | | | |
|(дисперсія | | | | | |
|відтворення) | | | | | |
|-----------------+---------+--------------+-----------+--------+---------------|
|Загальна | 57791 |5927452990,57 | | | |
|дисперсія | | | | | |
---------------------------------------------------------------------------------
Рисунок 1. Середні значення за стратами КВЕД (C, D, E, F) щодо обсягу виробленої продукції, робіт та послуг (у діючих цінах, тис.грн.) для генеральної сукупності
Таблиця 5. Результати однофакторного дисперсійного аналізу за стратами КВЕД (C, D, E, F) щодо обсягу виробленої продукції, робіт та послуг (у діючих цінах, тис.грн.) для вибіркової сукупності
---------------------------------------------------------------------------------
| Джерело |Кількість|Сума квадратів| Середній |Значення| Імовірність |
| дисперсії |ступенів | SS | квадрат MS| F- | прийняття |
| |свободи | | |критерію| гіпотези |
| | | | | |H : альфа = 0|
| | | | | | 0 j |
|-----------------+---------+--------------+-----------+--------+---------------|
|Міжгрупова | 3 | 3859127,925 |1286375,975| 4,961 | ,002 |
|дисперсія | | | | | |
|(обумовлена дією | | | | | |
|фактора) | | | | | |
|-----------------+---------+--------------+-----------+--------+---------------|
|Внутрішньогрупова| 13307 |3450551830,055|259303,512 | | |
|дисперсія | | | | | |
|(дисперсія | | | | | |
|відтворення) | | | | | |
|-----------------+---------+--------------+-----------+--------+---------------|
|Загальна | 13310 |3454410957,980| | | |
|дисперсія | | | | | |
---------------------------------------------------------------------------------
Рисунок 2. Середні значення за стратами КВЕД (C, D, E, F) щодо обсягу виробленої продукції, робіт та послуг (у діючих цінах, тис.грн.) для вибіркової сукупності

................
Перейти до повного тексту