1. Правова система ipLex360
  2. Законодавство
  3. Наказ


ДЕРЖАВНИЙ КОМІТЕТ СТАТИСТИКИ УКРАЇНИ
Н А К А З
05.06.2008 N 178
Про затвердження Методологічних положень з підготовки стандартних звітів щодо якості результатів державних вибіркових обстежень населення (домогосподарств)
Відповідно до статті 14 Закону України "Про державну статистику" та з метою забезпечення доступності, гласності та відкритості статистичної інформації, її джерел та методології складання
НАКАЗУЮ:
1. Затвердити схвалені методичною комісією Держкомстату Методологічні положення з підготовки стандартних звітів щодо якості результатів державних вибіркових обстежень населення (домогосподарств) (далі - Методологічні положення), що додаються.
2. Департаменту обстежень домогосподарств (Осипова І.І.):
2.1. Здійснювати методологічну координацію впровадження системи стандартних звітів щодо якості результатів державних вибіркових обстежень населення (домогосподарств) в органах державної статистики України.
2.2. Впровадити підготовку "Базового звіту" та "Підсумкового звіту" щодо якості результатів вибіркового обстеження умов життя домогосподарств, починаючи з IV кварталу 2008 року.
2.3. Направити Методологічні положення, затверджені цим наказом, головним управлінням статистики в Автономній Республіці Крим, областях, місті Києві та Управлінню статистики у місті Севастополі.
3. Департаментам статистики праці (Григорович Н.В.) та статистики сільського господарства та навколишнього середовища (Прокопенко О.М.) забезпечити поетапне впровадження базового та підсумкового звітів щодо якості результатів вибіркових обстежень економічної активності населення та сільськогосподарської діяльності населення, починаючи з 2009 року.
4. Контроль за виконанням цього наказу покласти на заступників Голови Держкомстату Власенко Н.С., Остапчука Ю.М. згідно з розподілом функціональних повноважень.
Голова О.Г.Осауленко
ЗАТВЕРДЖЕНО
Наказ Державного комітету
статистики України
05.06.2008 N 178
МЕТОДОЛОГІЧНІ ПОЛОЖЕННЯ
з підготовки стандартних звітів щодо якості результатів державних вибіркових обстежень населення (домогосподарств)
ПЕРЕДМОВА
Забезпечення якості статистичної продукції - один з основних напрямів сучасного етапу розвитку загальноєвропейської та багатьох національних статистичних систем. Це зумовлено як необхідністю більш повного задоволення потреб користувачів усіх рівнів у достовірних, своєчасних і зрозумілих даних, так і задачами стандартизації, гармонізації та оптимізації процесів підготовки статистичних даних.
Головною метою розроблення цих Методологічних положень є забезпечення методологічної бази для запровадження в органах державної статистики України звітів щодо якості за результатами вибіркових обстежень населення (домогосподарств). Ця робота призначена сприяти забезпеченню користувачів різного рівня адекватною інформацією щодо якості результатів вибіркових обстежень, а також створенню інформаційно-аналітичної бази для дослідження напрямів подальшого розвитку цих статистичних спостережень для поліпшення їх якості.
При підготовці методологічних положень використані офіційні рекомендації Євростату з питань звітування щодо якості статистичної продукції та відповідні регламенти Офісу національної статистики Сполученого Королівства Великої Британії та Північної Ірландії.
Методологічні положення складаються з семи розділів.
У першому розділі наведені основні визначення та терміни, які застосовуються у сфері аналізу питань якості статистичної продукції, в т.ч. - у галузі вибіркових обстежень населення (домогосподарств).
У другому розділі розглядаються основні принципи вимірювання якості статистичної продукції, зміст окремих вимірів та характеристики якості, рекомендовані Євростатом, а також надано огляд особливостей вимірювання якості результатів вибіркових обстежень населення (домогосподарств).
Система звітів щодо якості, розроблена згідно з рекомендаціями Євростату, а також стисла характеристика окремих типів цих звітів за призначенням та побудовою розглянута у третьому розділі.
Четвертий розділ висвітлює особливості звітування за окремими вимірами якості: надані системи характеристик якості по кожному виміру для використання у всіх вибіркових обстеженнях населення.
П'ятий розділ присвячено питанням формування першого типу звіту - "Базового звіту щодо якості". Розглянуто призначення цього звіту, його зміст та особливості надання користувачам.
У шостому розділі наведено рекомендації з підготовки другого типу звіту - "Підсумкового звіту щодо якості". Надано характеристику цього звіту, наведено опис його програми з акцентом на специфіку вибіркових обстежень населення (домогосподарств).
У сьомому розділі надано стислий опис третього типу звітів - "Повного звіту щодо якості".
Методологічні положення містять приклади складання базового та підсумкового звітів щодо якості для вибіркового обстеження умов життя домогосподарств.
Цей документ призначений для використання фахівцями органів державної статистики, користувачами, науковцями та освітянами.
Напрямок вимірювання якості статистичної продукції продовжує інтенсивно розвиватися як у міжнародних, так і в національних статистичних службах, у тому числі і в системі органів державної статистики України. У зв'язку з цим наведені методологічні положення доцільно розглядати як першу версію, яка в подальшому буде переглядатися відповідно до розвитку галузі вибіркових обстежень населення (домогосподарств) та загальних підходів до питань вимірювання якості статистичної продукції. Слід підкреслити що не всі розглянуті в цьому документі характеристики якості можуть бути адекватно визначені на основі існуючого на сьогоднішній день в Україні методологічного та інформаційного забезпечення. Разом з тим проблемні з точки зору вимірювання характеристики якості, а також індикатори якості, розроблені Євростатом для перспективного застосування в майбутньому, наведені у даних методологічних положеннях для забезпечення повноти загальної концепції побудови системи звітів щодо якості та з метою визначення стратегічних напрямів удосконалення моніторингу якості для більш повного задоволення потреб користувачів.
1. ОСНОВНІ ВИЗНАЧЕННЯ ТА ТЕРМІНИ(*)
_______________
(*) При підготовці глосарія використано терміни, наведені у [14].
При здійсненні аналізу питань якості статистичної продукції вибіркових обстежень населення (домогосподарств) застосовуються такі скорочення та термінологія.
Відносна стандартна похибка (коефіцієнт варіації) дає уявлення про ступінь статистичної однорідності результатів при багаторазовому застосуванні процедур вибіркового обстеження однакового дизайну вибірки (реплікацій). Визначається як відношення величини стандартної похибки вибірки до середнього значення показника. Вимірюється у відсотках. Чим менша величина коефіцієнта варіації, тим менше результати за різними реплікаціями відрізняються один від одного, тобто дані більш надійні.
Дизайн (план) вибірки - організаційно-логічна модель структури вибіркової сукупності та принципи її формування. Якістю плану вибірки в значній мірі визначається репрезентативність вибіркової сукупності, отриманої за визначеними у плані правилами.
Дизайн-ефект (deff) - міра відносної статистичної ефективності певного дизайну вибірки у порівнянні з простою випадковою вибіркою (відношення дисперсії вибіркових оцінок показника для реального дизайну вибірки, до дисперсії оцінки цього показника, отриманої за допомогою простого випадкового відбору).
Дисперсія вибіркових оцінок (вибіркова дисперсія) - середній квадрат відхилень оцінок показника за всіма можливими вибірками даного дизайну (реплікаціями) від середнього значення оцінки за всіма вибірками.
Доступність характеризує фізичні умови, за якими користувачі можуть отримати статистичні дані: способи та місця отримання даних процедури замовлення, час, необхідний для виконання замовлень, політика ціноутворення, існуючі маркетингові умови (авторське право та ін.), формати, в яких дані можуть бути надані користувачам (паперові носії, електронні носії, CD-ROM, Інтернет та ін.), наявність макро- та мікроданих тощо.
Зміщення - різниця між очікуваною величиною оцінки (тобто середнім із реплікацій) та дійсним значенням показника для всієї сукупності. Особливість зміщення полягає в тому, що воно являє собою постійну складову частину похибки, яка при численній сукупності не зменшується із збільшенням обсягу вибірки, тоді як випадкова похибка вибірки із збільшенням обсягу вибірки в середньому зменшується. До основних причин зміщення належить: процедура невипадкового відбору під час формування вибірки; залежність спрямованого відбирання від будь-якої ознаки, пов'язаного з тими властивостями одиниць, які служать об'єктом вивчення; свідоме чи ненавмисне зміщення при утворенні випадкової вибірки (тобто порушення випадкового відбору); свідома заміна (процес збору відомостей) одних одиниць іншими; неповне охоплення обстеженням отриманої вибірки; неправильне застосування способів обчислення оцінок. Визначають як різницю середнього значення оцінок у разі повторних випробувань (спостережень) і оцінюваної величини.
Надійність (точність) - ступінь близькості розрахованих оцінок показників до дійсних (точних) значень показників.
Невибіркові похибки - це похибки, пов'язані з сутністю первинної інформації (відповідей) або її навмисним викривленням по окремих ознаках (елементах) сукупності з вини інтерв'юера або респондента.
Порівнянність спрямована на вимірювання впливу відмінностей у статистичних концепціях та визначеннях, які застосовуються, на співставність статистичних даних за географічними районами, негеографічними доменами або у часі. Це ступінь, з яким розбіжності між статистичними даними пояснюються розбіжностями між дійсними значеннями статистичних характеристик.
Похибка надохоплення - це похибка, пов'язана з неможливістю ідентифікувати одиниці, представлені в основі вибірки більше одного разу, або одиниці, які не входять до генеральної сукупності.
Похибка недоохоплення - виникає в результаті неможливості включити окремі одиниці в основу вибірки. Це веде до недопредставлення у вибірці груп або частин генеральної сукупності.
Похибки невідповідей - виникають за рахунок відмови респондента давати відповідь на окремі запитання і зумовлюють відсутність значень ознаки по окремих елементах вибіркової сукупності. Похибки невідповідей можуть не лише збільшувати дисперсію ознаки, а й призводити до зміщення оцінок показників за рахунок відсутності у вибірці елементів генеральної сукупності з можливо значно відмінними від середніх значень характеристиками.
Похибка вибірки - частина розбіжності між істинним значенням статистичного показника та його значенням, розрахованим за вибіркою, яка зумовлена застосуванням саме несуцільним характером спостереження.
Похибка вимірювання - різниця між розрахунковим значенням показника, що характеризує явище, і дійсним його значенням. У залежності від причини виникнення і законів зміни похибок розрізняють:
1) промахи, чи грубі похибки, - похибки, що носять суб'єктивний характер. Вони допускаються особами, що виконують вимірювання, в результаті їх недостатньої кваліфікації чи внаслідок недбалості. До промахів відносяться похибки спостереження і реєстрації. Промахи звичайно легко розпізнати: результати спостережень, що містять їх, різко відрізняються від інших значень;
2) систематичні - похибки, постійні за величиною і знаком, змінюються за деякими законами. Похибка систематична є наслідком дії постійних факторів, що діють в одному напрямку за певним законом. Вони можуть виникнути через неправильний вимірювальний інструмент. У разі виявлення факторів, що викликають систематичну похибку, і розрахунку її величини, вона може бути усунена проведенням відповідних виправлень у результатах вимірів;
3) випадкові похибки, що є наслідком дії великої кількості чинників, ефекти дії яких настільки незначні, що їх не можна виділити і врахувати окремо. Сумарний ефект дії цих чинників є причиною відхилу результату виміру від справжнього значення показника. Випадкова похибка має імовірнісний характер і розглядається як випадкова величина.
Похибка моделювання характеризує частину різниці між оцінкою показника та дійсним його значенням, яка пояснюється використанням статистико-математичних моделей для розрахунку оцінок. Похибки моделювання можуть бути систематичними і випадковими.
Похибка обробки характеризує частину різниці між оцінкою показника та дійсним його значенням, яка пояснюється використанням різноманітних процедур обробки даних (введення даних, кодування, редагування, імпутація тощо). Похибки обробки можуть бути систематичними і випадковими.
Похибка реєстрації (кодування) характеризує розбіжність між зафіксованим При статистичному спостереженні значенням ознаки в одиниці спостереження і дійсним її значенням, що є результатом неправильної, помилкової реєстрації (запису) відповіді на запитання статистичної форми (анкет опитування вибіркового обстеження). Розрізняють похибки реєстрації випадкові та систематичні. Перші виникають через збіг випадкових обставин і, як правило, при великому числі спостережень не роблять істотного впливу на результати його (через урівноваження похибок, що виникають у протилежних напрямках). Систематичні похибки - це неточності реєстрації, що виникають за певних обставин і постійно діють протягом процесу статистичного спостереження в одному напрямку (мають однакову тенденцію або до збільшення, або до зменшення значення), тому величина показника у підсумку по спостереженню буде включати накопичену похибку.
Пунктуальність характеризує проміжок часу між запланованою та фактичною датами підготовки даних. Наприклад, запланованою датою може бути дата, відображена у затверджених планах виконання робіт, анонсована або узгоджена з користувачами тощо.
Релевантність - ступінь, з яким статистичні дані відповідають поточним та потенційним потребам користувачів. Релевантність також стосується питань повноти розробки всіх необхідних статистичних даних, а також ступеня відповідності потребам користувачів концепцій, визначень, класифікацій і т.д., що використовуються;
Своєчасність характеризує інтервал часу між моментом (періодом), у який відбувалося явище або процес, що описують статистичні дані, та датою готовності (надання) цих даних.
Стандартна похибка - середньоквадратичне відхилення вибіркових оцінок показника від значення показника для генеральної сукупності.
Узгодженість - ступінь, з яким дані, отримані з різних джерел, можуть адекватно комбінуватись, інтегруватись та використовуватись для різних цілей. Зміст цього виміру полягає в тому, що статистичні дані, що характеризують одне й те саме явище, але отримані за результатами різних обстежень (обстежень різного типу і періодичності), можуть бути не повністю узгодженими, оскільки основані на різних методологічних підходах, класифікаціях тощо.
Ясність характеризує інформаційне середовище даних: наявність та якість метаданих, що надаються зі статистичними даними (текстова інформація, пояснення, документація та ін.), ілюстрації (графіки, карти, схеми та ін.), наявність пояснень щодо якості даних (включаючи обмеження у використанні); ступінь додаткового супроводу даних статистичними органами.
2. ЗАГАЛЬНІ ПОЛОЖЕННЯ. ОСНОВНІ ПРИНЦИПИ ВИМІРЮВАННЯ ЯКОСТІ СТАТИСТИЧНОЇ ПРОДУКЦІЇ ТА НАДАННЯ ІНФОРМАЦІЇ ЩОДО ЯКОСТІ КОРИСТУВАЧАМ
Забезпечення належної якості статистичної продукції визначено пріоритетним напрямом на сучасному етапі розвитку світової статистичної спільноти. В статистичних системах країн Європейського союзу Статистичною комісією ООН, Євростатом розроблені документи, що регламентують вимоги до якості статистичних даних (зокрема стосовно результатів вибіркових обстежень населення), до методів забезпечення якості, рекомендують програми та зміст звітної документації щодо якості даних для користувачів та фахівців статистики тощо [1 - 5]. На їх основі відповідні документи розробляються і в національних статистичних службах [1, 7 - 12]
Протягом останніх років регулярно проводяться міжнародні конференції з питань якості статистичних даних, що виробляються як органами статистики, так і міністерствами, відомствами, банківськими установами та іншими організаціями. При цьому, як правило, проблематика якості даних офіційної статистики розглядається окремо.
На сьогодні в міжнародній практиці не існує загальноприйнятого універсального визначення цього поняття. Загалом концепція якості найчастіше характеризується як "прийнятність" або "відповідність меті" в плані потреб користувачів. Раніше в міжнародній статистичній практиці якість визначалася виключно точністю та своєчасністю даних. Такий підхід до цього поняття часто зустрічається і зараз серед більшості національних користувачів. Разом з тим некоректно вважати якісними дані, які є точними та своєчасними, але до них немає прозорого доступу, вони не відповідають необхідним концепціям або не мають опису методологічних засад, за якими вони були розроблені. Таким чином, поняття якості статистичної продукції є багатовимірним та комплексним.
Підходи до змісту поняття "якості" постійно вдосконалюються на основі досягнень статистичної методології, насамперед, у напрямах більш ефективного і адекватного використання статистичної інформації і більш повного задоволення потреб користувачів. Враховуючи, що різні користувачі мають різні потреби, надзвичайно важливим є визначення діапазону характерних ознак, які у підсумку можуть бути використані для визначення ступеня відповідності статистичних даних критеріям якості користувачів.
Виміри якості характеризуються системою показників, зміст яких суттєво залежить від галузі статистики. Здійснення оцінки окремих аспектів якості статистичних даних також має численні особливості та значною мірою залежить від призначення та способу використання статистичних даних, методів збирання та обробки інформації тощо.
2.1. Якість даних: цілі вимірювання
Вимірювання якості статистичних даних необхідне, насамперед, для забезпечення адекватності використання цих даних внутрішніми (всередині статистичної системи) та зовнішніми користувачами. Вони потребують доступу до показників якості для свідомого розуміння як переваг, так і обмежень, які відносяться до конкретних даних, для відповідного використання останніх.
Інші, не менш важливі, напрями застосування інформації щодо якості даних - це оптимізація процесів вироблення інформації у напрямку забезпечення максимальної їх ефективності.
Впровадження у практичну діяльність виробників інформації, зокрема органів державної статистики, сучасних міжнародних підходів до визначення якості даних вимагає наступних актуальних акцентів у їх роботі. По-перше, передбачається, що виробники статистичних даних повинні гарантувати, що всі прийнятні вимоги користувачів щодо якості даних задоволені. По-друге, фінансове забезпечення виробництва інформації має визначатися з урахуванням необхідності забезпечення встановленого рівня якості даних. По-третє, виробники статистичних даних повинні сконцентрувати свої зусилля на впровадженні та удосконаленні найбільш ефективного методологічного та методичного забезпечення, які дозволяють отримати максимально якісні дані з найменшими витратами.
Оптимізація процесу виробництва статистичної продукції на основі результатів аналізу якості може бути проілюстрована циклом якості Деминга-Шварта: план, захід, перевірка, впровадження (рис. 1) .
Рис. 1. Цикл якості Деминга-Шварта
У відповідності з цим підходом за результатами контролю якості етапів виробництва статистичної продукції виявляються "вузькі" місця, розробляється план усунення недоліків або поліпшення якості розробляються та реалізуються відповідні заходи, перевіряються результати, фіксуються і впроваджуються найбільш ефективні рішення. Далі процес циклічно повторюється по мірі надходження нової інформації щодо якості, зокрема щодо виявлених недоліків, зміни потреб користувачів, розвитку методології тощо.
Висока якість статистичних даних суттєво сприяє підвищенню авторитету статистичних систем серед користувачів різних рівнів та в суспільстві в цілому.
2.2. Основні виміри якості, рекомендовані Євростатом
Для офіційної статистики на сучасному етапі Євростатом рекомендовані такі основні виміри якості статистичної продукції [2 - 4]:
1) Релевантність - ступінь, за яким статистичні дані відповідають поточним та потенційним потребам користувачів. Релевантність також стосується питань повноти розробки всіх необхідних статистичних даних, а також ступеня відповідності потребам користувачів концепцій, визначень, класифікацій і т.д., які використовуються;
2) Надійність (точність) - ступінь близькості розрахованих оцінок показників до дійсних (точних) значень показників;
3) Своєчасність та пунктуальність. Своєчасність характеризує інтервал часу між моментом (періодом), у який відбувалося явище або процес, що описують статистичні дані, та датою готовності (надання) цих даних.
Пунктуальність характеризує проміжок часу між запланованою та фактичною датами підготовки даних. Наприклад, запланованою датою може бути дата, відображена у затверджених планах виконання робіт, анонсована або узгоджена з користувачами тощо.
4) Доступність та ясність. Доступність характеризує фізичні умови, за якими користувачі можуть отримати статистичні дані: способи та місця отримання даних, процедури замовлення, час, необхідний для виконання замовлень, політика ціноутворення, існуючі маркетингові умови (авторське право та ін.), формати, в яких дані можуть бути надані користувачам (паперові носії, електронні носії, CD-ROM, Інтернет та ін.), наявність макро- та мікроданих тощо.
Ясність характеризує інформаційне середовище даних: наявність та якість метаданих, що надаються зі статистичними даними (текстова інформація, пояснення, документація та ін.), ілюстрації (графіки, карти, схеми та ін.), наявність пояснень щодо якості даних (включаючи обмеження у використанні); ступінь додаткового супроводу даних статистичними органами.
5) Порівнянність спрямована на вимірювання впливу відмінностей у статистичних концепціях та визначеннях, які застосовуються, на співставність статистичних даних за географічними районами, негеографічними доменами або у часі. Це ступінь, з якою розбіжності між статистичними даними пояснюються розбіжностями між дійсними значеннями статистичних характеристик.
6) Узгодженість - ступінь, з яким дані, отримані з різних джерел, можуть адекватно комбінуватись, інтегруватись та використовуватись для різних цілей. Зміст цього виміру полягає в тому, що статистичні дані, що характеризують одне й те саме явище, але отримані за результатами різних обстежень (обстежень різного типу і періодичності), можуть бути не повністю узгодженими, оскільки основані на різних методологічних підходах, класифікаціях тощо.
Виміри якості не є незалежними, а певним чином взаємопов'язані. Ці взаємозв'язки мають різний вплив на забезпечення якості статистичних даних: позитивний, коли удосконалення одного виміру якості супроводжується поліпшенням інших, та, навпаки, негативний, коли удосконалення одного виміру якості не може здійснитися без погіршення другого. Прикладом може слугувати взаємозв'язок між надійністю та своєчасністю, коли результати, отримані з високою надійністю, але з суттєвим запізненням, можуть бути взагалі не потрібні користувачам. Однобічне поняття якості статистичних даних як лише високої їх надійності завжди буде недостатнім. При здійсненні заходів щодо поліпшення якості статистичних показників необхідно обов'язково враховувати існуючі об'єктивні залежності та визначати пріоритети, оскільки, наприклад, не завжди скорочення термінів обробки можливе одночасно з підвищенням надійності показників. Виміри якості, таким чином, створюють систему, що вимагає відповідного системного підходу до визначення показників для їх характеристики.
Рекомендації Євростату щодо підготовки для користувачів інформації з якості даних саме і передбачають розробку та впровадження системи показників для характеристики кожного з наведених вимірів якості, а також опрацювання методології вимірювання цих показників для застосування у всіх галузях статистики.
2.3. Уніфікована система показників щодо якості статистичної продукції
У сучасних міжнародних дослідженнях проблем якості різними групами аналітиків рекомендується загалом біля 150 характеристик та показників, що можуть бути використані для оцінки якості статистичних даних.
У даний час Євростат здійснює розробку уніфікованої системи показників якості по усіх її вимірах, яка призначена, головним чином, для виробників статистичної продукції Європейського Союзу і забезпечує можливість порівняння якості статистичних продуктів різних галузей статистики та моніторингу її зміни у часі. Ці показники розроблені за умови їх максимальної інформативності стосовно конкретного виміру якості, тому зазначена система включає обмежену кількість показників. Система стандартних показників якості, рекомендована Євростатом у 2005 році [2, 6], наведена у табл. 1. Показники якості рекомендовано розрізняти за типом: основні показники (у табл. 1 позначені "1"), допоміжні показники ("2") та експериментальні показники (показники для можливого майбутнього застосування - "3").
Таблиця 1
Стандартні показники якості статистичної продукції, рекомендовані Євростатом для відображення у звітах щодо якості для будь-яких статистичних спостережень
N Показник Тип
(1 - основний;
2 - допоміжний;
3 -
експериментальний)
Вимір якості
1 2 3 4
1 R1. Індекс
задоволеності
користувачів
3 Релевантність
R2. Частка доступних
результатів
статистичних
спостережень
1
2 A1. Коефіцієнт
варіації
1 Надійність
(точність)
A2. Рівень участі
респондентів в
обстеженні (зважений
та незважений)
2
A3. Рівень
відповідей
респондентів по
основних показниках
(зважений та
незважений)
2
A4. Рівень імпутації 2
A5. Рівень
надохоплення та
помилкової
класифікації
2
A6. Рівень
географічного
недоохоплення
1
A7. Середня величина
уточнення даних
(середня з
абсолютних розмірів
змін показників за
попередніми та
остаточними даними)
1
3 T1. Пунктуальність
графіка публікації
1 Своєчасність та
пунктуальність
T2. Проміжок часу
між закінченням
звітного періоду та
датою отримання
перших результатів
1
T3. Проміжок часу
між закінченням
звітного періоду та
датою отримання
кінцевих результатів
1
4 AC 1. Кількість
поширених та/або
проданих публікацій
1 Доступність та
ясність
AC2. Кількість
відвідувань баз
даних
1
AC3. Рівень повноти
метаданих для
опублікованих
результатів
3
5 C1. Довжина
зіставних часових
рядів
1 Порівнянність
C2. Кількість
зіставних часових
рядів
1
C3. Рівень
відмінностей
концепцій та методів
від європейських
норм
3
C4. Асиметрія для
показників
дзеркальної
статистики
1
6 CH1. Частка
показників, що
задовольняють
вимогам для їх
використання в
якості джерел для
інших статистичних
продуктів
3 Узгодженість
Основні показники якості безпосередньо характеризують той чи інший її вимір. Наприклад, коефіцієнт варіації (відношення величини стандартної похибки вибіркових оцінок до середнього значення показника) є прямим індикатором виміру "Надійність", а пунктуальність графіка публікації (часовий лаг між запланованою та фактичною датами надання результатів користувачам) - виміру "Своєчасність та пунктуальність".
Допоміжні показники якості характеризують якість опосередковано, непрямо. Наприклад, безпосередньо визначити величину зміщення оцінок показників, зумовленого відмовами респондентів від обстеження, на практиці майже неможливо, оскільки це потребує значних витрат ресурсів на спеціальні дослідження. Разом з тим величина рівня участі респондентів в обстеженні (або рівня відмов від обстеження) є прийнятним показником, що надає уявлення щодо можливої величини такого зміщення.
Зазначені у табл. 1 показники якості рекомендується розраховувати один раз на рік або частіше (щоквартально, щомісячно), якщо це можливо. Окремі з наведених вище показників не можуть бути розраховані для всіх статистичних продуктів без виключення. Для кожної галузі статистики застосовується своя система основних показників якості.
Слід відмітити, що перелік стандартних показників якості, рекомендованих Євростатом, може бути доповнений іншими характеристиками та показниками, визначеними з досвіду роботи з користувачами та виходячи з внутрішніх потреб національної статистичної системи.
2.4. Особливості вимірювання якості результатів вибіркових обстежень населення (домогосподарств)
Визначення якості результатів вибіркових обстежень населення, що враховує основні її виміри, доцільно сформулювати наступним чином. Якісні результати вибіркових обстежень населення (домогосподарств) - це отримані у встановлені строки надійні дані щодо характеристик генеральної сукупності, які з максимальною повнотою відповідають потребам користувачів, узгоджені з наявними якісними даними з інших джерел і доступні для використання.
Для забезпечення комплексного характеру досліджень питань якості результатів вибіркових обстежень поряд з показниками якості що будуються як кількісні величини, доцільно наводити також якісні характеристики. У цих рекомендаціях вони позначаються терміном "характеристики якості".
Державні вибіркові обстеження населення (домогосподарств), як і будь-які інші вибіркові спостереження, мають чітко визначену послідовність етапів (див. рис. 2), кожен з яких впливає на якість кінцевих результатів. Це зумовлює необхідність забезпечення потенційних можливостей для аналізу впливу як кожного етапу окремо так і всіх етапів у комплексі для забезпечення оптимальності всього процесу вибіркового обстеження.
-------------------------- ------------------------ -----------------------
| Формулювання мети | |Визначення та побудова| | Розробка дизайну |
| обстеження, розробка |-->| основи вибірки |-->| вибірки, формування |
|концепцій та методології| | | |вибіркової сукупності|
| обстеження | | | | |
-------------------------- ------------------------ -----------------------
|
v
-------------------------- ------------------------ -----------------------
| Оцінювання показників, | | Обробка даних | |Проведення обстеження|
| підготовка масивів |<--| |<--| |
| мікроданих | | | | |
-------------------------- ------------------------ -----------------------
|
v
--------------------------
| Аналіз та публікація |
| результатів обстеження |
--------------------------
Рис. 2. Узагальнена схема процесу вибіркового обстеження населення
Таким чином, для поглибленого аналізу питань якості результатів вибіркових обстежень та більш повного розуміння її складових важливо ідентифікувати основні показники, характеристики якості та джерела похибок у розрізі основних етапів проведення таких несуцільних спостережень.
Дослідження питань якості результатів вибіркових обстежень населення (домогосподарств) порівняно з іншими галузями статистики має суттєві особливості, пов'язані як з несуцільним характером таких спостережень, так і з різноманітними проблемними аспектами опитування населення, можливим вагомим суб'єктивним фактором впливу (як з боку респондентів, так і працівників, що проводять опитування), а також зі складністю обробки даних, яка передбачає багатоетапність та застосування різних методів для оцінювання показників, у т.ч. - на основі різних зовнішніх джерел по відношенню до конкретного обстеження даних.
3. ТИПИ ЗВІТІВ ЩОДО ЯКОСТІ СТАТИСТИЧНОЇ ПРОДУКЦІЇ: ПРИЗНАЧЕННЯ ТА ОСНОВНІ ПРИНЦИПИ ПОБУДОВИ
У процесі досліджень питань якості статистичних даних, зокрема результатів вибіркових обстежень населення (домогосподарств), визначальним моментом є належне інформування користувачів щодо основних характеристик якості інформації. Звітування щодо якості Євростат визначає як підготовку та поширення на регулярній або нерегулярній основі спеціальних звітів, які містять інформацію щодо якості організації обстежень та їх результатів.
Звітування щодо якості не тільки забезпечує ефективне використання користувачами статистичних даних, а й сприяє поліпшенню взаємних відносин між користувачами та виробниками даних, дозволяє користувачам більш точно визначати свої потреби. З іншого боку, звіти щодо якості дозволяють статистичним службам здійснювати системний аналіз якості даних та сприяють подальшому удосконаленню методологічного та методичного забезпечення, в т.ч. у галузі вибіркових обстежень населення (домогосподарств).
Стандартизація звітів щодо якості статистичної продукції в національних статистичних системах країн європейської спільноти розпочалася відповідно до рекомендацій Євростату, що були прийняті у 2002 році за результатами шостого засідання робочої групи Євростату з оцінки якості статистики у Люксембурзі [2 - 4]). У травні 2005 року за результатами сьомого засідання робочої групи Євростату з оцінки якості статистики у Люксембурзі рекомендації щодо основних показників та характеристик якості були оновлені [5].
Згідно з вищезазначеними рекомендаціями Євростату виділяють такі напрями звітування щодо якості статистичної продукції [2]:
1. Звіт для внутрішніх користувачів, у якому подається деталізована інформація щодо якості в обсязі, необхідному для ефективного використання результатів обстежень усередині статистичної установи. Цей звіт призначений для фахівців, які використовують результати обстежень для виробництва іншої статистичної продукції.
2. Звіт для зовнішніх користувачів, у якому подається основна, найбільш вагома інформація щодо якості, яка необхідна для адекватного використання результатів обстежень зовнішніми користувачами. Цей звіт призначений для широкого кола користувачів які можуть мати лише базові знання зі статистики чи математики або бути фахівцями (зокрема науковцями) в окремих галузях статистики.
3. Повний звіт щодо якості, у якому інформація щодо якості подається у найбільш розгорнутому, деталізованому та повному вигляді. Цей звіт призначений для внутрішнього використання керівництвом статистичної установи та фахівцями найвищого рівня, експертами, консультантами, які відповідають за якість статистичної продукції або мають відношення до планування та проведення вибіркових обстежень. Повний звіт щодо якості містить максимально деталізовану систему показників та характеристик якості, а також відповідні аналітичні матеріали. У цьому звіті має наводитися опис процедур вимірювання показників та характеристик якості. Повний звіт розробляється за результатами певного циклу обстежень, наприклад, для щорічних вибіркових обстежень - один раз у 3-5 років. Цей звіт призначений у першу чергу допомагати удосконалювати методологічні основи обстежень, обгрунтовано планувати та впроваджувати зміни в організації та технології їх проведення.
Зміст кожного звіту має містити показники та характеристики основних вимірів якості, але з різним ступенем деталізації.
Національні статистичні служби на основі зазначених рекомендацій розробляють свої системи звітів з якості. Наприклад, враховуючи диференціацію зовнішніх користувачів за рівнем потреб щодо інформації з якості, в Офісі Національної Статистики Великої Британії (ОНС) встановлені два основні типи регулярних звітів щодо якості для зовнішніх користувачів [7 - 12]:
- базова інформація щодо якості - стисла інформація щодо якості, яка супроводжує усі публікації результатів статистичних спостережень;
- підсумковий звіт щодо якості - більш детальна інформація щодо якості, яка містить також опис питань методологічного характеру. Цей звіт публікується окремо від результатів обстеження а також розміщується на Інтернет-сторінці.
Крім того, в ОНС передбачається періодична (один раз на декілька років) підготовка повних звітів щодо якості для менеджерів вищого рівня, з можливістю надання певним користувачам доступу до окремих розділів цих звітів.
За результатами опрацювання документів Євростату з питань звітування щодо якості статистичної продукції та з урахуванням міжнародного досвіду розробки систем звітів щодо якості в національних статистичних системах інших країн, для використання в органах державної статистики України розроблена наступна система звітів щодо якості результатів вибіркових обстежень населення (домогосподарств) та принципів їх побудови:
- Базовий звіт щодо якості.
Базовий звіт щодо якості - це динамічна (поточна) інформація щодо основних характеристик якості результатів вибіркового обстеження, яка оновлюється для кожної публікації результатів і публікується (поширюється) разом з нею. Обсяг базової інформації, як правило, не має перевищувати однієї - двох сторінок. Базовий звіт щодо якості має уніфікований стандартний формат та зміст як для зовнішніх, так і для внутрішніх користувачів. Цей звіт може містити посилання на основні джерела більш детальної інформації щодо якості результатів обстеження (сторінки Інтернету, де розміщено підсумковий звіт щодо якості, методологічні та методичні документи з питань обстеження та ін.).
- Підсумковий звіт щодо якості.
Підсумковий звіт щодо якості - більш детальна інформація щодо якості, яка містить опис змін методів, що застосовуються у вибірковому обстеженні, або методів вимірювання якості. Обсяг такого звіту має складати близько 5 - 15 сторінок. Цей звіт публікується окремо від результатів обстеження, а також розміщується на Інтернет-сторінці. Підсумковий звіт щодо якості може готуватися у двох форматах: в уніфікованому стандартному форматі для зовнішніх та внутрішніх користувачів, а також за запитами окремих користувачів (зовнішніх або внутрішніх) - у розширеному за окремими вимірами якості форматі. Оскільки вибіркові обстеження населення (домогосподарств), які проводять органи державної статистики України, мають річні цикли для аналізу даних, і протягом цього часу методологія обстеження не змінюється, доцільно підсумкові звіти щодо якості готувати в уніфікованому форматі з щорічною періодичністю.
- Повний звіт щодо якості.
Зміст повного звіту щодо якості відповідає рекомендаціям Євростату. Цей звіт має уніфікований стандартний формат та зміст як для зовнішніх, так і для внутрішніх користувачів. Цей звіт орієнтований на внутрішніх користувачів та зовнішніх користувачів, які мають відношення до питань стратегічного планування та поглиблених досліджень якості результатів вибіркових обстежень. Для задоволення потреб інших категорій зовнішніх користувачів їм можуть бути надані окремі розділи (їх частини) повного звіту щодо якості шляхом вибору найбільш придатних вимірів та характеристик якості в залежності від обстеження, рівня користувачів та їх потреб.
Звіти щодо якості в цілому будуються за такою стандартною програмою:
1. Загальна частина (включає визначення поняття якості результатів вибіркових обстежень населення (домогосподарств), необхідність врахування користувачами інформації щодо якості для ефективного використання результатів).
2. Основні виміри якості та їх характеристики.
2.1. Релевантність.
2.2. Надійність.
2.3. Своєчасність та пунктуальність.
2.4. Доступність та ясність.
2.5. Порівнянність.
2.6. Узгодженість.
3. Висновки (наводяться основні тези щодо загальної характеристики та тенденцій щодо якості результатів обстеження).
При підготовці програми звіту щодо якості результатів конкретного вибіркового обстеження населення (домогосподарств) по кожному з вимірів наводяться показники та характеристики якості та їх зміст, значення для основних результатів, за необхідністю у підсумковому та обов'язково у повному звіті - алгоритми розрахунків показників якості, методологічні коментарі та зауваження. Залежно від типу конкретних звітів окремі виміри якості можуть бути відсутні.
При розгляді питання періодичності підготовки звітів щодо якості було враховано, що можливість їх підготовки передбачає проведення певного циклу вибіркових обстежень. Наприклад, найбільш стислі базові звіти, що містять лише необхідну інформацію у дуже лаконічній формі, готуються за результатами кожного обстеження і надаються одночасно з результатами обстеження (щомісячно, щоквартально, щорічно). Більші за обсягом та змістом підсумкові звіти можуть бути підготовлені лише на основі результатів декількох обстежень (наприклад, щорічно для щомісячних та щоквартальних обстежень). Повні звіти готуються з використанням масивів даних за певний період проведення вибіркових обстежень, у т.ч. - на основі результатів спеціально проведених досліджень з питань якості окремих етапів обстеження, опитувань користувачів тощо. У зв'язку з цим підготовка кінцевих варіантів таких звітів можлива за період 3 - 5 років проведення обстеження, хоча окремі їх розділи мають починати формуватись безпосередньо після початку обстеження. Ці звіти готуються (або актуалізуються) відповідно до найбільшого циклу проведення обстеження за встановленою методологією (періоду між змінами методології обстеження, дизайну вибірки, зокрема, територіальної, суттєвих змін методології обробки даних та ін.).
На рівні регіонів звіти щодо якості результатів конкретного вибіркового обстеження населення (домогосподарств) можуть готуватися за скороченою програмою кожного з типів звітів, з використанням основних характеристик вимірів якості по регіону (за відсутності інформації - по країні в цілому) та містити посилання на відповідні звіти щодо якості національного рівня.
4. ОСНОВНІ ПОКАЗНИКИ ТА ХАРАКТЕРИСТИКИ ВИМІРІВ ЯКОСТІ
Комплексний підхід до підготовки інформації щодо якості даних для представлення у відповідних звітах передбачає розробку системи показників та характеристик якості по кожному її виміру для використання у всіх вибіркових обстеженнях населення і, потенційно у всіх галузях державної статистики, а також - визначення методології вимірювання цих показників, опрацювання, затвердження та впровадження в практичну діяльність необхідних методичних та нормативних документів.
Інформація щодо якості дозволяє користувачам статистичних даних визначати як переваги, так і обмеження щодо їх використання.
Нижче наведені основні показники та характеристики вимірів якості, які потенційно можуть наводитися у звітах щодо якості результатів вибіркових обстежень населення (домогосподарств).
4.1. Релевантність
Релевантність - це ступінь, з яким статистичні дані відповідають поточним та потенційним потребам користувачів. Релевантність також стосується питань повноти розробки всіх необхідних статистичних даних, а також ступеня відповідності потребам користувачів концепцій, визначень, класифікацій і т.д., які використовуються.
Статистична інформація є релевантною, якщо вона відповідає потребам користувачів. У зв'язку з цим у даному розділі звітів щодо якості наводяться матеріали, що характеризують основних користувачів конкретного вибіркового обстеження, а також відповідність даних їх потребам. Надаються коментарі щодо використання узгоджених на національному та/або міжнародному рівнях визначень, стандартів, методології тощо.
Характеристики релевантності важко однозначно відокремити від характеристик по деяких інших вимірах якості. При звітуванні з питань релевантності, насамперед, слід надавати інформацію щодо корисності результатів обстеження для користувачів та ступеня використання результатів ними. Важливим аспектом релевантності є ступінь відповідності показників, що вимірюються за результатами обстеження, цільовим показникам, що планувалось оцінити при організації вибіркового обстеження.
Звітування щодо релевантності дозволяє отримати уявлення про ступінь відхилення інформації, що виробляється органами статистики за результатами вибіркових обстежень населення, від потреб користувачів. Зазначене відхилення може бути зумовлено як динамічністю соціальних процесів, так і певними об'єктивними обставинами, зокрема співвідношенням результатів та необхідних витрат. Оцінювання рівня відповідності результатів обстежень потребам користувачів та ступеня задоволення потреб користувачів може здійснюватись за допомогою різних засобів. Одним з найкращих підходів є проведення відповідних опитувань користувачів. Серед інших методів можуть застосовуватися непрямі оцінки, тобто суміжні показники, які опосередковано характеризують задоволеність користувачів (обсяги продажу публікацій, кількість отриманих від користувачів запитів на надання інформації, питань, скарг і т.д.).
У звітах можуть бути наведені такі показники та характеристики релевантності:
- опис мети вибіркового обстеження, класифікація та опис користувачів;
- опис потреб основних користувачів (за групами користувачів), протиріч між потребами окремих користувачів та опис встановлених пріоритетів;
- результати аналізу відхилень у концепціях та визначеннях, які використовуються користувачами;
- посилання на документи, де міститься інформація з більш детальним описом потреб користувачів, якщо такі матеріали є;
- характеристика відповідності результатів вибіркового обстеження потребам основних користувачів;
- характеристики ступеня задоволеності користувачів, насамперед, за основними групами користувачів, головні причини неповного задоволення потреб користувачів;
- кількісна характеристика недоступних для користувачів результатів вибіркового обстеження у порівнянні з запланованим (потрібним) обсягом доступної інформації;
- опис причин недоступності потрібної інформації та перспектив вирішення даної проблеми;
- опис проведених заходів із забезпечення релевантності;
- опис результатів оцінки задоволеності користувачів, а також планів та заходів, що будуть здійснені для поліпшення задоволеності їх потреб;
- кількісна характеристика обсягів поширених матеріалів або звернень користувачів до публікацій, підготовлених за результатами вибіркового обстеження в електронній та паперовій формах;
- кількість звернень до відповідних Web-сторінок, де розміщені матеріали вибіркового обстеження, та завантажень доступних масивів даних обстеження.
Для характеристики релевантності Євростатом розробляються та впроваджуються такі стандартні показники якості статистичної продукції (табл. 1):
- індекс задоволеності користувачів (R1). Цей показник пропонується визначати щорічно. Оскільки користувачі на національному рівні не співпадають з користувачами на міжнародному зокрема, європейському рівні, пропонується визначати індекси задоволеності в розрізі окремих груп користувачів. У майбутньому Євростат планує започаткувати обстеження задоволеності користувачів на європейському рівні. Для усіх рівнів перед розрахунком цих показників необхідно здійснити такі підготовчі кроки: розробити класифікацію користувачів вибіркового обстеження шляхом їх об'єднання в невелику кількість груп (доцільно виділити біля 5 основних груп); здійснити ранжування груп користувачів відповідно до їх важливості; здійснити систематизацію та аналіз методів, що використовуються для вимірювання ступеня задоволеності користувачів за їх групами для опису процедур оцінювання у відповідних звітах щодо якості. З метою оцінювання задоволеності користувачів рекомендується проводити їх опитування на щорічній основі, з використанням ротації, за якої кожен рік обстежуватимуться різні групи користувачів.
Кількісне значення індексу задоволеності для певної групи користувачів визначається як інтегральний показник на основі оцінок користувачами основних аспектів якості результатів вибіркового обстеження (з використанням певної шкали, наприклад, від 1 до 100 для кожної з оцінок та, відповідно, і для індексу задоволеності), зважених за ступенем важливості кожного з аспектів. За таких умов індекс задоволеності може бути розрахований за формулою:
L ~
I = S Y x d , (4.1)
s l=1 l l
де Y - оцінка l-го аспекта якості, 1 = 1, 2, ... , L;
l
~ L ~
d - нормоване вагове значення для i-го коефіцієнта, S d = 1.
l=1 l
S - знак суми.
- частка доступних результатів вибіркового обстеження (R2). Цей показник визначає співвідношення кількості наданих користувачам показників, розрахованих за результатами конкретного обстеження, до кількості показників, що необхідно було надати. Одночасно у звітах вказуються причини, що не дозволили опублікувати (надати) всі потрібні користувачам результати.
Нижче наведені деякі приклади практичної реалізації у звітах щодо якості окремих з наведених вище характеристик релевантності.
Приклад формулювання мети обстеження.
Приклад
Метою проведення обстежень економічної активності населення є одержання інформації про склад та структуру робочої сили, вимірювання зайнятості та напрямів діяльності населення, а також визначення реального рівня безробіття, який враховує загальний обсяг пропозиції робочої сили та застосовується як важливий показник аналізу поточного стану економіки країни. Матеріали обстежень дозволяють оцінити реальні обсяги та зміни пропозиції робочої сили на ринку праці України, проаналізувати тенденції розвитку його кон'юнктури.
Приклад короткого опису основних користувачів (2 - 3 за значимістю).
Приклад
Збірник розрахований на фахівців органів законодавчої та виконавчої влади, профспілок, наукових установ та організацій, студентів та здобувачів наукового ступеня, а також практиків, які займаються вивченням ринку праці.
Приклад детальної класифікації користувачів (табл. 2).
Приклад
Таблиця 2
Класифікація основних користувачів даними вибіркового обстеження умов життя домогосподарств
Органи центральної
законодавчої та
виконавчої влади
Верховна Рада України, Секретаріат
Президента України, Кабінет Міністрів
України, міністерства та інші органи
виконавчої влади, Рахункова палата
України, Рада національної безпеки і
оборони України
Інші державні
організації
Національний банк України, посольства,
консульства, представництва та місії
України за кордоном
Органи місцевого
самоврядування та
територіальні
підрозділи органів
виконавчої влади
Органи місцевого самоврядування, місцеві
органи та територіальні підрозділи,
представництва та філії центральних
органів виконавчої влади України та
Автономної Республіки Крим
Користувачі нерезиденти
України (іноземні)
Посольства, представництва та місії
іноземних держав в Україні,
представництва міжнародних організацій в
Україні, міжнародні статистичні
організації та статистичні служби інших
держав, іноземні установи, організації,
політичні партії, ЗМІ
Наукові та навчальні
заклади
Науково-дослідні організації та
установи, Національна та галузеві
академії наук України, навчальні заклади
Інші організації Вітчизняні підприємства, організації,
установи, бібліотеки, ЗМІ, профспілки
Громадські організації
та інші користувачі
Громадські організації та об'єднання,
політичні партії, громадяни України
Приклад надання характеристики щодо обсягів поширення результатів обстеження серед користувачів.
Приклад
За результатами державного вибіркового обстеження сільськогосподарської діяльності домогосподарств у сільській місцевості видається статистичний бюлетень, тираж якого у 2006 році становив 24 примірники. Окремі таблиці подаються у статистичному збірнику "Сільське господарство України", тираж якого у 2006 році склав 120 примірників. Бюлетень надається в електронному й паперовому вигляді.
4.2. Надійність
Надійність (точність) - ступінь близькості розрахованих оцінок показників до дійсних (точних) значень показників.
З точки зору статистичної методології оцінка певного показника за результатами вибіркового обстеження є надійною, якщо вибіркові оцінки, побудовані на базі всіх можливих вибірок однакового дизайну та обсягу, сконцентровані біля дійсного значення показника. Висока їх концентрація, тобто надійність, бажана тому, що в окремому процесі побудови вибірки та розрахунку оцінки показника існує лише деяка імовірність наблизитись до його дійсного значення.
Достовірна надійність оцінювання будь-якого показника за даними вибіркового обстеження, не може бути визначена абсолютно точно, оскільки на практиці процедура відбору реалізується лише один раз, і дійсні значення показників невідомі. Таким чином, при обробці даних вибіркових обстежень надійність лише оцінюється.
У табл. 3 наведено класифікацію основних факторів, що впливають на надійність даних вибіркових обстежень. Надійність визначається двома групами похибок - похибками вибірки та невибірковими похибками.
Проблема забезпечення надійності даних пов'язана не лише з необхідністю отримання адекватної інформації за результатами вибіркового обстеження. Не менш важливими є такі аспекти, як виправданість, оптимальність витрат фінансових ресурсів на проведення обстеження.
Таблиця 3
Класифікація похибок, що визначають рівень надійності оцінювання показників за результатами вибіркових обстежень населення
Типи
похибок
Опис похибки Головні
наслідки при
оцінюванні
показників
Похибки вибірки Дисперсія вибіркових
оцінок
Випадкова
похибка
Невибіркові Охоплення Пропуски у переліках
територіальних одиниць
Систематична
похибка
Невірні межі
територіальних одиниць
Застаріла основа
вибірки домогосподарств
Помилки при відборі
територіальних одиниць
та домогосподарств
Вимірювання Похибки в
інструментарії (анкетах
запитальниках)
обстеження
Низька якість
результатів у
цілому
Похибки у підготовці
персоналу, який
залучений до розробки
програм обстеження та
обробки результатів
Похибки у навчанні
персоналу, який
проводять опитування
домогосподарств
Систематична
похибка
Похибки у графіках
роботи працівників, які
проводять опитування
домогосподарств
Зміщення відповідей
респондентів
Проста дисперсія
відповідей респондентів
Випадкова
похибка
Корельована дисперсія
відповідей респондентів
Систематична
та випадкова
похибки
Обробки Похибки кодування Систематична
та випадкова
похибки
Похибки редагування
Похибки введення даних
в ПЕОМ
Пов'язані з
відсутністю
відповідей
Похибки програмування
Відмови респондентів
від інтерв'ю Недосяжні
респонденти Відсутні
вдома респонденти
Систематична
та випадкова
похибки
Моделювання Похибки моделювання при
оцінюванні показників
на основі
статистико-математичних
моделей
Систематична
та випадкова
похибки
Похибки вибірки
Головним джерелом похибок вибірки є специфіка вибіркових обстежень, яка полягає в обстеженні лише спеціально відібраної частини генеральної сукупності, тобто власне дизайн вибірки. Основними показниками похибок вибірки при оцінюванні показників за результатами вибіркових обстежень населення є дисперсія вибіркових оцінок, стандартна похибка, коефіцієнт варіації та гранична похибка.
Оцінку дисперсії, отриману за різними можливими вибірками певного дизайну, називають дисперсією вибіркових оцінок, або вибірковою дисперсією.
Дисперсія вибіркових оцінок визначається за формулою:
_
^ 1 H ^ ^ 2
var(ТЕТА) = --- S (ТЕТА - ТЕТА) , (4.2)
H i=1 i
^
де ТЕТА - оцінка показника по вибірці i, i = 1, 2, ... , H;
i
_
^
ТЕТА - середнє значення вибіркових оцінок показника,
_
^ 1 H ^ ^ ^
ТЕТА = --- S ТЕТА = E(ТЕТА) (символ E(ТЕТА) визначається
H i=1 i
як середнє значення показника для сукупності);
H - кількість вибірок;
S - знак суми.
Похибка вибірки розраховується як стандартна похибка SE на
^
підставі величини оцінки дисперсії var(ТЕТА) значень показника за
формулою:
^
SE = Кк var(ТЕТА). (4.3)
де Кк - корінь квадратний.
^
Для вибірок зі складним дизайном величина var(ТЕТА) може бути
розрахована на основі класичної формули для оцінки дисперсії
2
ознаки у при простому випадковому відборі (сигма) :
s
2
(сигма)
^ s
var(ТЕТА) = deff x -------- , (4.4)
n
2
де (сигма) - дисперсія ознаки по одиницях вибірки;
S
n - обсяг вибірки;
deff - дизайн-ефект.
Коефіцієнт варіації CV (або відносна стандартна похибка вибірки RSE) розраховується за формулою:
SE
CV = ------ x 100%. (4.5)
^
(ТЕТА)
Величина коефіцієнта варіації часто використовується як показник придатності даних для аналізу. Так, наприклад, якщо CV <= 5%, то оцінка вважається точною, якщо 5% < CF <= 10% - оцінка є придатною для кількісного аналізу, але її точність недостатньо висока, якщо 10% <= CV <= 25% - оцінка придатна лише для якісного аналізу і її слід використовувати обережно. Наведені граничні значення величини коефіцієнта варіації в цілому відповідають міжнародним вимогам, але ці рівні не мають "обов'язкового" характеру, оскільки в інших країнах іноді публікують дані, для яких CV досягає 30% і навіть 40%.
Гранична похибка вибірки LSE розраховується на підставі стандартної похибки вибірки за формулою (для 0,95 довірчої ймовірності):
LSE = 1.96 x SE (4.6)
Гранична похибка вибірки використовується для побудови
довірчих границь оцінок (границь довірчих інтервалів). Наприклад,
_ _
для побудови нижньої y та верхньої y довірчих границь
L R
інтервальної оцінки середнього значеннявикористовуються формули:
_ _ _ _
y = y - LSE; y = y + LSE. (4.7)
L R
Різниця між середнім значенням вибіркових оцінок показника
^
(ТЕТА) та дійсним значенням (ТЕТА) визначається зміщенням та
позначається як B:
^ ^
B(ТЕТА; (ТЕТА)) = (ТЕТА) - (ТЕТА). (4.8)
За наявністю зміщення для визначення статистичної надійності
оцінки показника використовується середньоквадратична похибка,
^
MSE(ТЕТА); (ТЕТА), що визначається формулою:
^ ^ 2 ^
MSE(ТЕТА; (ТЕТА)) = var(ТЕТА) + B (ТЕТА; (ТЕТА)). (4.9)
Таким чином, середньоквадратична похибка складається з дисперсії вибіркових оцінок та квадрату зміщення. Для визначення дисперсій, стандартних похибок та величини дизайн-ефекту для вибірок зі складним дизайном використовуються спеціалізовані методи розрахунків.
У звітах щодо якості можуть наводитись наступні показники та характеристики похибок вибірки:
- інформація про використання незміщених або зміщених оцінок; величини зміщення вибіркових оцінок для основних показників;
- величини CV (або MSE у випадку застосування зміщених оціночних функцій) для оцінювання основних показників;
- коментарі щодо рівня (інтервалів) величини CV для оцінок показників, що не віднесені до основних;
- посилання на документи та/або масиви даних з детальною інформацією щодо величин CV;
- величини стандартних похибок, дизайн-ефектів та довірчих інтервалів для основних показників;
- стислий опис дизайну вибірки, застосованих методів відбору та контрольних процедур на кожному етапі формування вибірки.
У залежності від типу звіту щодо якості обсяги та детальність інформації по зазначених показниках та характеристиках можуть суттєво розрізнюватись. Прикладом надання користувачам відповідної інформації різного ступеня деталізації є відповідні методологічні пояснення, наведені у статистичних бюлетенях за результатами державних вибіркових обстежень [17 - 19] та в Методиці розрахунку характеристик надійності оцінювання показників за результатами вибіркового обстеження населення (домогосподарств) з питань економічної активності [20].
- стислий опис методології процедур оцінювання показників, оцінки дисперсії вибіркових оцінок, відповідних характеристик надійності та контролю цих робіт;
В якості прикладу такого опису з певним ступенем наближення можуть бути прийняті загальні положення методики [20].
- стислий опис програмного забезпечення та основних його функціональних можливостей, що використовуються для розрахунку характеристик надійності результатів вибіркових обстежень;
Прикладом такого опису може бути матеріал наведений у [20]:
Приклад
У теперішній час, в умовах наявності та доступності досить потужних комп'ютерів, до методів розрахунку похибки вибірки ставляться такі загальні вимоги:
- можливість врахування реального складного дизайну вибірки;
- можливість використання для різних дизайнів вибірки;
- можливість використання для всіх основних типів показників та для будь-яких груп одиниць вибірки у межах вибірки;
- мінімальність величин та прийнятні статистичні властивості похибок, джерелом яких є самі методи;
- економічність у плані витрат часу;
- наявність та зручність використання спеціалізованого програмного забезпечення для практичного застосування методів.
При аналізі якості даних ОЕАН застосовується реплікаційний метод BRR, який реалізований у стандартному пакеті програм "WesVarPC". BRR є складною розрахунковою процедурою. Вона передбачає, що повна вибірка складається з H страт (ці страти у загальному випадку відрізняються від страт дизайну вибірки), у кожному з яких міститься два кластери (кластер об'єднує одиниці спостереження, що розташовані в межах однієї територіальної одиниці або декількох сусідніх територіальних одиниць, що залежить від розміру останніх). Кожна реплікація - "напіввибірка" - будується шляхом випадкового відбору по одному кластеру з кожної страти. Оцінка показника за реплікацією розраховується шляхом подвоєння статистичних ваг одиниць спостереження, що належать відібраним кластерам.
Необхідна кількість реплікацій T визначається з використанням методу балансування. Це досягається спеціальною процедурою формування реплікацій за допомогою ортогональних матриць Адамара.
Див. також розділ 6 та додаток 4 зазначеної методики [20].
У звітах щодо якості, крім зазначеної інформації, доцільно додавати "некількісні" характеристики, такі як попередження користувачів, що при використанні оцінок показників необхідно враховувати похибки вибірки тощо.
Для характеристики надійності в частині похибок вибірки Євростатом розробляється та впроваджується відповідний стандартний показник якості статистичної продукції (табл. 1):
- Коефіцієнт варіації (A1). Цей показник пропонується визначати як на поточній основі (щомісячно, щоквартально), так і щорічно.
Необхідно зазначити, що для зручності використання оцінки показників за значенням коефіцієнта варіації (за рівнем надійності) доцільно розподіляти на категорії. Наприклад, виділити п'ять категорій: якщо коефіцієнт варіації вибіркових оцінок показника приймає значення до 5%, то показник відноситься до групи "А", тобто до групи показників з високим рівнем надійності, 6-10% - до групи "Б" з достатнім рівнем надійності, 11-15% - до групи "В" з задовільним рівнем надійності, 16-25% - до групи "Г" з низьким рівнем надійності (дані придатні лише для якісного аналізу), більше 25% - до групи "Д" з незадовільним рівнем надійності.
Приклади надання інформації щодо величин коефіцієнтів варіації для обстеження економічної активності населення та сільськогосподарської діяльності населення в сільській місцевості наведені у додатку А (див. також [18, 19]), для ОУЖД - у додатку Б (див. також [20]).
Невибіркові похибки
Основними джерелами невибіркових похибок є неповне охоплення генеральної сукупності, відмови респондентів від обстеження або від відповіді на окремі запитання, похибки вимірювання, похибки обробки даних обстеження, похибка моделей при оцінюванні показників тощо.
Похибки охоплення
Похибки охоплення виникають при порушенні ймовірнісності вибірки, коли генеральна сукупність неповністю або некоректно представлена в основі вибірки. Похибки охоплення виникають за таких умов:
- окремі одиниці генеральної сукупності відсутні в основі вибірки (відсутні одиниці не мають жодного шансу бути обраними у будь-яку вибірку - недоохоплення);
- окремі одиниці в основі вибірки не відповідають ознакам формування генеральної сукупності (результатом цього є надохоплення, якщо такі одиниці не можуть бути ідентифіковані та вилучені після відбору);
- деякі одиниці генеральної сукупності з'являються більш ніж один раз в основі вибірки ("дуплікація", дублювання).
У багатоступеневій вибірці похибки охоплення можуть виникнути на будь-якому ступені.
Так, за міжнародною практикою, список територіальних одиниць в основі вибірки, як правило, повний. Однак суттєва похибка охоплення може виникнути при визначенні меж територіальних одиниць.
Крім того, списки адрес у цілому змінюються більш динамічно, ніж списки територіальних одиниць, а списки домогосподарств, що проживають за певними адресами, більш динамічно, ніж списки адрес, помешкань чи інших одиниць.
Найбільш серйозна проблема із списками, які використовуються в основі вибірки, стосується недоохоплення. Надохоплення також може траплятися, хоча й не так часто, як недоохоплення. Надохоплення виникає, якщо:
а) деякі одиниці зустрічаються у списку більше одного разу (дублювання записів у списках одиниць);
б) одиниці, не охоплені обстеженням, включаються, але не ідентифікуються як такі, і вилучаються під час обробки результатів обстеження;
в) включаються одиниці за межами вибірки.
Дублювання може бути проблемою, коли та ж сама одиниця може з'являтися під різними назвами чи за іншими ідентифікаторами.
У звітах щодо якості можуть наводитися такі показники та характеристики похибок охоплення:
- опис ступеня охоплення (територія, населення), тип і величина виявлених похибок охоплення (похибки надохоплення та недоохоплення, в т.ч. - географічного);
- зазначення похибок охоплення, що були враховані при оцінюванні показників, характеристик надійності та методів, які для цього використовувались;
- короткий опис впливу на результати обстеження неврахованих похибок охоплення;
- опис основних заходів, застосованих для виявлення похибок охоплення;
- опис методології побудови основи вибірки, включаючи джерела інформації, строки створення та строки останньої актуалізації;
- опис похибок, виявлених в основі вибірки.
Крім указаних характеристик, іноді доцільно наводити (або послатися на відповідний розділ звіту щодо якості) також опис генеральної та досліджуваної сукупності, результати їх порівняння в цілому (на національному рівні) і на рівні значних підсукупностей (наприклад, на рівні регіонів).
Слід зазначити, що похибки охоплення головним чином визначаються якістю підготовки та актуальністю основи вибірки.
Для характеристики надійності в частині невибіркових похибок охоплення Євростатом розробляються та впроваджуються такі стандартні показники якості статистичної продукції (табл. 1):
- рівень надохоплення та помилкової класифікації (A5). Рекомендується розраховувати показник рівня помилкових включень одиниць, як кількість одиниць, помилково включених до основи вибірки, віднесену до загальної кількості одиниць в основі вибірки а також показник рівня помилкової класифікації одиниць в основі вибірки, як відношення кількості помилково класифікованих (але придатних для обстеження) одиниць до загальної кількості одиниць в основі вибірки, що підлягають обстеженню. Ці показники пропонується визначати на поточній основі (щомісячно, щоквартально щорічно) у відповідності з процедурами актуалізації та використання основ вибірки;
- рівень географічного недоохоплення (A6). Визначається Євростатом для європейського рівня як частка зваженої оцінки цільової сукупності неохоплених країн (регіонів) у зваженій оцінці цільової сукупності усіх країн (регіонів). Цей показник визначається Євростатом головним чином на поточній основі (щомісячно, щоквартально), коли дані по окремих країнах (регіонах) надходять із запізненням або дані по них виявляються непридатними для аналізу.
Похибки вимірювання
Похибки вимірювання виникають на етапі збору інформації від респондентів і призводять до того, що зафіксовані значення ознак відрізняються від дійсних значень.
Основні джерела виникнення похибок вимірювання такі:
- інструментарій обстеження. Персоналом, який залучений до розробки програм обстеження, можуть бути допущені похибки при розробці інструментарію обстеження: помилки в анкетах, окремих формах, запитальниках, у формулюванні окремих запитань. Крім того, помилки у засобах, що використовуються при зборі інформації, можуть призводити до хибних записів або неузгодженостей у відповідях респондентів;
- респонденти. З різних причин респонденти можуть надавати хибні відповіді (ефекти забування, втрати уваги в ході інтерв'ю, акумуляції (схильність опитаних зазначати цифри, кратні 5 або 10) та округлення цифр, заниження (приховування) доходів, ефекти впливу статі, віку, освіти і т. д.);
- працівники, які проводять опитування респондентів (фахівці з інтерв'ювання). Ці працівники можуть свідомо чи несвідомо впливати на відповіді респондентів. Факторами впливу можуть бути вік, стать фахівця з інтерв'ювання, його рівень освіти та особливості усвідомлення ним програми обстеження чи окремих запитань, певне коригування ним порядку запитань у ході опитування, застосування різних специфічних або незрозумілих для респондентів слів у ході роз'яснень.
Для зменшення величини похибок вимірювання застосовуються спеціальні процедури при розробці дизайну анкети та при навчанні фахівців з інтерв'ювання.
Похибки вимірювання звичайно важко оцінити за результатами окремого обстеження без спеціальних додаткових процедур - застосування різних варіантів інструментарію при пробних (пілотних) обстеженнях, проведення додаткових (дублюючих) обстежень різними фахівцями з інтерв'ювання на різних вибірках домогосподарств, отримання окремих характеристик респондентів, наприклад статево-вікової структури населення, з додаткових джерел тощо.
У звітах щодо якості доцільно наводити такі показники та характеристики похибок вимірювання:
- опис технології збору даних, інструментарію обстеження, методичних та інструктивних матеріалів для персоналу, який розробляє програму обстеження та проводить опитування респондентів;
- опис основних ідентифікованих похибок вимірювання, визначення ступеня їх впливу на оцінки основних показників;
- оцінка обсягу редагування значень основних ознак, пов'язаних з похибками вимірювання;
- опис методів та процедур, що були використані для виявлення похибок вимірювання та оцінки їх впливу;
- повідомлення для користувачів щодо врахування похибок вимірювання при оцінюванні показників та визначенні характеристик їх надійності, опис процедур, що були використані для цього;
- оцінка можливого впливу на результати обстеження похибок вимірювання, що не були враховані при оцінюванні показників;
- опис результатів аналізу причин виникнення похибок вимірювання;
- опис процедур, які були застосовані для зменшення похибок вимірювання, включаючи розробку та тестування запитальників, навчання фахівців з інтерв'ювання, контролю їх роботи (включаючи опис результатів контролю) тощо.
Крім зазначених характеристик похибок вимірювання у звітах щодо якості можуть наводитись такі показники, як:
- оцінки розбіжностей оцінок основних показників внаслідок використання різних методів збору даних;
- частки респондентів, які мали труднощі з відповідями на основні запитання;
- частки нестандартних відповідей, що вимагають коригування;
- частки приблизних відповідей по основних запитаннях;
- оцінка частки дисперсії відповідей, що зумовлена впливом фахівців з інтерв'ювання тощо.
Похибки обробки
Похибки обробки складаються з похибок кодування, похибок введення даних в ПЕОМ, похибок редагування та імпутації даних і похибок програмування, що виникають при автоматизації відповідних процедур обробки даних. Ці похибки за природою та проявом аналогічні похибкам вимірювання, оскільки полягають в тому, що на певному етапі підготовки даних до аналізу замість дійсних первинних значень ознак з'являються їх хибні значення.
Для виявлення та врахування похибок обробки застосовують такі методи, як перекодування анкет, подвійне введення анкет в ПЕОМ, паралельне застосування різних методів імпутації для компенсації недоотриманої інформації, використання альтернативних засобів автоматизації робіт тощо. Ці процедури, як і для випадку дослідження похибок вимірювання, можуть призвести до помітного зростання вартості обстеження.
У звітах щодо якості доцільно наводити такі показники та характеристики похибок обробки:
- опис основних процедур обробки даних;
- опис процедур контролю первинних даних та результатів цього контролю;
- опис основних ідентифікованих похибок обробки, визначення ступеня їх впливу на оцінки основних показників, зокрема, похибок кодування та введення даних в ПЕОМ тощо;
- характеристика методів, процедур та моделей, що були використані для виявлення похибок обробки та оцінки їх впливу;
- повідомлення для користувачів щодо врахування похибок обробки при оцінюванні показників та визначенні характеристик їх надійності, опис процедур, що були використані для цього;
- оцінка можливого впливу на результати обстеження похибок обробки, що не були враховані при оцінюванні показників;
- опис аналізу причин виникнення похибок обробки;
- опис процедур зважування; опис якості системи ваг; порівняння оцінок основних показників до і після зважування;
- опис процедур, які були застосовані для зменшення похибок обробки, включаючи навчання кодувальників та операторів, удосконалення програм введення (сканування) та контролю інформації, удосконалення алгоритмів редагування та імпутації тощо;
- оцінка загального обсягу редагування та імпутації значень основних ознак та ін.
Для характеристики надійності в частині невибіркових похибок обробки Євростатом розробляються та впроваджуються такі стандартні показники якості статистичної продукції (табл. 1):
- рівень імпутації (A4). Цей показник рекомендується розраховувати для окремих основних показників обстеження. Визначається як показник незваженого рівня імпутації (відношення кількості імпутованих значень певної ознаки X до загальної кількості значень цієї ознаки), так і показник зваженого рівня імпутації (відношення зваженої суми імпутованих значень до загальної зваженої суми всіх значень). Ці показники пропонується визначати як на поточній основі (щомісячно, щоквартально), так і щорічно;
- середня величина уточнення даних (A7) - середня з абсолютних значень змін показників за попередніми та остаточними даними. Ці показники пропонується визначати як на поточній основі (щомісячно, щоквартально), так і щорічно.
Похибки, пов'язані з відсутністю відповідей
Різні вибіркові обстеження населення (домогосподарств) характеризуються різними рівнями участі (відмов) респондентів. Значний вплив на рівень відмов респондентів мають такі фактори, як час та зусилля, який вимагається від респондента для надання інформації, зміст та структура запитальника, порядок запитань, тривалість інтерв'ю, рівень складності запитань, рівень підготовки фахівців з інтерв'ювання (загальний та до окремого обстеження); вибір потрібного респондента; місце проведення інтерв'ю; інтерес до предмета обстеження (як респондента, так і фахівця з інтерв'ювання); рівень авторитетності організації, що проводить обстеження та ін. На мотивацію респондента впливають індивідуальні (об'єктивні та суб'єктивні) характеристики фахівця з інтерв'ювання - стать, вік, рівень освіти, комунікабельність, доброзичливість, наполегливість тощо, їхні погляди та очікування. Індивідуальні характеристики фахівців з інтерв'ювання впливають, насамперед, на рівень участі домогосподарств в обстеженні, а погляди та очікування фахівців з інтерв'ювання можуть вплинути на респондентів при наданні відповідей на окремі запитання. Для зменшення негативного впливу фахівців з інтерв'ювання на якість інформації розробляються спеціальні заходи (удосконалення програм запитальників, проведення тематичних цільових навчань фахівців з інтерв'ювання тощо).
Іншим сучасним підходом до вирішення проблеми недоотримання інформації є спеціальна робота з домогосподарствами (особами), які відмовилися від обстеження. До таких спеціальних заходів відносяться додаткове фінансування обстеження одиниць, від яких важко отримати інформацію, збір інформації за такими одиницями з додаткових джерел, збільшення частки відбору для таких груп респондентів та ін. Статистична цінність інформації, отриманої від таких одиниць, часто суттєво вища, ніж цінність інформації, отриманої від інших одиниць.
Разом з тим користувачі статистичними даними вибіркових обстежень мають розуміти, що існує інформація, відсутність якої неможливо компенсувати ніякими заходами.
Проблема компенсації відмов домогосподарств та осіб від участі в обстеженнях є суттєвою, коли рівні відмов відрізняються серед різних груп одиниць. Для її вирішення необхідно проводити спеціальні заходи, які мають запобігти суттєвим викривленням результатів обстежень.
Для аналізу похибок, пов'язаних з відсутністю відповідей респондентів в обстеженні, застосовується показник рівня участі респондентів в обстеженні.
Рівень участі в обстеженні домогосподарств і осіб R
c
(незважений) обчислюється як відношення кількості обстежених
домогосподарств (осіб) до кількості відібраних домогосподарств
(осіб), які підлягали обстеженню:
кількість обстежених домогосподарств
(осіб)
R = _______________________________________. (4.10)
c кількість домогосподарств (осіб), які
підлягають обстеженню
При проведенні розрахунків необхідно приділити особливу увагу коректному визначенню знаменника у формулі (4.10). Він повинен враховувати тільки тих з відібраних домогосподарств (осіб), які підлягали обстеженню (тих, які взяли участь, відмовилися від участі в обстеженні, і тих, яких не вдалося застати вдома). При визначенні знаменника не враховуються нежитлові, пусті, неіснуючі, недоступні адреси, що могли бути враховані як реальні адреси при формуванні вибірки завдяки неналежній актуальності основи вибірки, помилкам або з інших причин.
Величина R розраховується за основними групами одиниць, які
c
визначаються при стратифікації генеральної сукупності за такими
ознаками, як регіон, тип місцевості тощо.
Важливо відмітити, що величина R може розраховуватись по
c
сукупності одиниць, які мають різні статистичні ваги. У цьому
випадку рівень участі доцільно обчислювати як відношення зваженої
кількості опитаних домогосподарств (осіб) до зваженої кількості
домогосподарств (осіб), які підлягають обстеженню.
При аналізі якості інформації доцільно розраховувати також таку характеристику, як, наприклад, коефіцієнт адресного охоплення - відношення кількості відібраних адрес, за якими проживають домогосподарства, до загальної кількості відібраних адрес.
Основним наслідком відмов від обстеження є можливе викривлення структури вибіркової сукупності у порівнянні зі структурою генеральної сукупності, тобто порушення принципу репрезентативності вибірки (див. приклад у табл. 2). Для виявлення похибок репрезентативності використовують можливість порівняння структури генеральної сукупності і структури вибірки за певними показниками.
Для зменшення негативного впливу похибок, пов'язаних з відсутністю відповідей, застосовують методи максимізації відповідей, методи імпутації пропущених, недійсних і неузгоджених відповідей, методи зважування з метою компенсації відсутності відповідей.
У звітах щодо якості доцільно наводити такі показники та характеристики похибок, пов'язаних з відсутністю відповідей:
- зважені та незважені рівні участі домогосподарств (осіб) в обстеженнях по основних групах домогосподарств (осіб) та по окремих запитаннях для основних ознак (після реалізації всіх заходів зі збору даних - повторних відвідувань домогосподарств, отримання інформації з інших джерел тощо);
- опис застосованих методів імпутації та рівні імпутації даних по основних показниках (ці характеристики за своєю сутністю є аналогічними для похибок обробки та похибок, пов'язаних з відсутністю відповідей; у публікаціях найчастіше наводять загальний рівень імпутації, який розраховується на основі обох зазначених складових);
повідомлення для користувачів щодо методів урахування рівня участі одиниць в обстеженні, що були застосовані при оцінюванні показників та визначенні характеристик надійності за результатами вибіркового обстеження;
- оцінка розбіжності основних характеристик респондентів і нереспондентів, визначення ймовірної систематичної помилки, пов'язаної з відсутністю відповідей, по основних групах одиниць;
Приклад
У табл. 4 наведені результати порівняння статево-вікової структури вибіркової та генеральної сукупностей для обстеження умов життя домогосподарств України. Представлені дані свідчать, що у вибірці спостерігається надлишок представників старших вікових груп обох статей і не вистачає представників молодших вікових груп, серед яких кількість відмов значно вища і, крім того, яких важче застати вдома. Якщо не враховувати ці викривлення, то, відповідно, всі характеристики домогосподарств будуть зміщені в бік домогосподарств, що включають осіб старшого та похилого віку або складаються лише з таких осіб. Особливо це стосується територій та груп населення зі значними рівнями відмов.
Таблиця 4
Структура населення за даними вибіркового обстеження умов життя домогосподарств та даними демографічної статистики станом на 1 січня 2007 року
(відсотків)
Вік
(років)
Усе населення Жінки Чоловіки
Резуль-
тати
обсте-
ження
Демогра-
фічна
статис-
тика
Відхи-
лення
(відсот-
кові
пункти)
Резуль-
тати
обсте-
ження
Демогра-
фічна
статис-
тика
Відхи-
лення
(відсот-
кові
пункти)
Резуль-
тати
обсте-
ження
(1)
Демогра-
фічна
статис-
тика
Відхи-
лення
(відсот-
кові
пункти)
0 - 4 4,4 4,5 -0,1 3,7 4,1 -0,4 5,2 5,0 0,2
5 - 9 4,2 4,3 -0,1 3,6 3,8 -0,2 4,9 4,8 0,1
10 - 14 5,9 5,5 0,4 5,1 5,0 0,1 6,9 6,1 0,8
15 - 19 6,9 7,3 -0,4 6,0 6,7 -0,7 8,0 8,1 -0,1
20 - 24 6,7 6,3 -1,6 6,0 7,6 -1,6 7,3 9,1 -1,8
25 - 29 6,3 7,4 -1,1 6,0 6,9 -0,9 6,7 8,1 -1,4
30 - 34 6,4 7,2 -0,8 6,0 6,7 -0,7 7,0 7,7 -0,7
35 - 39 6,3 6,8 -0,5 6,2 6,4 -0,2 6,5 7,1 -0,6
40 - 44 7,1 7,1 0,0 6,9 6,9 0,0 7,4 7,4 0,0
45 - 49 8,1 7,9 0,2 8,2 7,8 0,4 7,9 8,0 -0,1
50 - 54 7,5 7,0 0,5 7,5 7,1 0,4 7,4 6,9 0,5
55 - 59 6,8 6,3 0-5 7,1 6,6 0,5 6,5 6,1 0,4
60 - 64 4,6 4,0 0,6 5,1 4,4 0,7 4,1 3,5 0,6
65 - 69 7,5 6,2 1,3 8,4 7,1 1,3 6,4 5,2 1,2
70 - 74 4,4 3,8 0,6 5,1 4,4 0,7 3,6 3,0 0,6
75 і
старші
6,9 6,4 0,5 9,1 8,5 0,6 4,2 3,9 0,3
100,0 100,0 - 100,0 100,0 - 100,0 100,0 -
_______________
(1) - незважені дані
Наведені дані свідчать, що при обробці даних необхідно застосовувати спеціальні заходи для компенсації впливу відмов від обстеження на кінцеві результати обстеження. З метою наближення результатів вибіркового обстеження до наявної зовнішньої інформації та підвищення рівня надійності оцінок показників, які вимірюються шляхом вибіркового спостереження, в обстеженні умов життя домогосподарств застосовуються процедури коригування статистичних ваг з метою компенсації відмов від обстеження та процедура калібрації ваг з метою узгодження результатів обстеження з наявною зовнішньою інформацією.
- повідомлення для користувачів щодо імовірного впливу відсутності відповідей (що не були враховані при обробці та редагуванні даних або враховані не повністю) на оцінки основних показників та характеристики їх надійності;
- аналіз основних причин невідповідей респондентів;
- опис методів, що були застосовані для отримання інформації по одиницях, що відмовилися від участі в обстеженні - повторні відвідування, використання інформації з зовнішніх джерел, а також наведення оцінки надійності інформації, отриманої на основі цих методів;
- повідомлення для користувачів щодо заходів, що були реалізовані для зменшення рівня відмов.
Для характеристики надійності в частині невибіркових похибок, пов'язаних з відсутністю відповідей, Євростатом розробляються та впроваджуються такі стандартні показники якості статистичної продукції (табл. 1):
- рівень участі респондентів в обстеженні (зважений та незважений) (A2).
- рівень відповідей респондентів по основних показниках (зважений та незважений) (A3).
Ці показники пропонується визначати як на поточній основі (щомісячно, щоквартально), так і щорічно.
Приклад надання користувачам інформації щодо рівня участі домогосподарств в обстеженні наведено далі.
Приклад
В обстеженні умов життя домогосподарств у 2006 р. взяли участь 10499 домогосподарств (81,6% відібраних адрес, за винятком нежитлових помешкань). Рівень участі в обстеженні сільських домогосподарств, який становив 93,7%, перевищував відповідний показник по міських домогосподарствах - 75,9%.
Найвищий рівень участі домогосподарств в обстеженні у 2006 р. був у Закарпатській (98,1%), Чернігівській (96,6%), Волинській (96,0%), Рівненській (95,2%), Чернівецькій (95,1%) та Вінницькій (94,7%) областях, найнижчий - у м. Києві (55,7%), в Одеській області (56,7%) та ум. Севастополі (67,2%). У більшості областей цей показник становив від 71,1% до 93,2%.
Приклад
Таблиця 5
Середньомісячний рівень участі домогосподарств, відібраних для проведення обстеження населення (домогосподарств) з питань економічної активності, у 2005 - 2006 роках
(у % до відібраних домогосподарств
за відповідним типом місцевості)
2005 рік 2006 рік
Усього у тому числі за типом
місцевості:
Усього у тому числі за типом
місцевості:
міські
поселення,
усього
сільська
місцевість,
усього
міські
поселення,
усього
сільська
місцевість,
усього
Україна 83,4 78,1 86,9 84,8 79,8 88,2
Автономна
Республіка Крим
79,4 75,9 82,2 81,2 77,6 84,2
Вінницька 84,6 79,4 86,0 85,7 80,6 87,1
Волинська 92,6 90,6 93,2 93,5 92,8 93,7
Дніпропетровська 78,3 74,4 84,0 79,5 77,0 83,1
Донецька 87,9 88,6 86,0 89,9 90,9 87,1
Житомирська 93,4 92,8 93,6 93,4 92,2 93,8
Закарпатська 85,4 82,6 86,4 88,4 86,2 89,1
Запорізька 80,4 74,2 84,9 85,3 80,3 88,9
Івано-Франківська 89,8 80,4 92,8 90,9 82,6 93,5
Київська 83,6 78,4 85,6 85,1 79,9 87,2
Кіровоградська 84,3 78,3 87,0 82,5 77,8 84,5
Луганська 77,6 72,5 85,1 78,2 73,1 85,7
Львівська 87,4 83,6 89,5 88,8 83,3 91,8
Миколаївська 87,9 86,0 88,9 90,4 91,4 89,9
Одеська 75,7 67,2 81,1 77,6 69,7 82,5
Полтавська 82,1 70,6 87,2 84,9 72,8 90,2
Рівненська 93,8 92,0 94,4 95,0 94,2 95,3
Сумська 91,3 93,7 90,2 91,7 92,5 91,3
Тернопільська 78,1 73,3 79,5 82,4 74,2 84,8
Харківська 76,2 67,5 85,4 77,3 70,0 85,0
Херсонська 79,9 75,8 81,7 81,4 79,0 82,4
Хмельницька 85,5 79,4 87,8 85,3 80,0 87,4
Черкаська 81,8 79,4 82,7 83,2 82,2 83,5
Чернівецька 87,0 82,4 88,6 90,1 84,3 92,2
Чернігівська 93,0 95,6 92,0 94,3 96,1 93,6
м. Київ 65,6 65,6 - 65,1 65,1 -
м. Севастополь 64,6 64,6 - 64,6 64,6 -
Примітка. Розподіл домогосподарств за типом місцевості здійснено відповідно до ПТОВ.
Похибки моделювання
У теперішній час у міжнародній та національній статистичній практиці різноманітні статистичні моделі все більше використовуються при обробці даних вибіркових обстежень населення (домогосподарств) та оцінюванні показників за їх результатами. Зокрема, це моделі обробки нестандартних значень показників, спеціальних коригувань даних, калібрації статистичних ваг, оцінювання показників на основі регресійних моделей або композиційних методів, застосування методів сезонних коригувань, реплікаційні моделі оцінювання характеристик надійності та ін. Будь-яка модель потребує обґрунтування доцільності її застосування аналізу її валідності (правильності), адекватності тощо.
При використанні будь-яких моделей у процесах обробки первинних даних та оцінювання показників за результатами вибіркового обстеження в звітах щодо якості доцільно наводити такі показники та характеристики:
- опис моделей, їх призначення та обгрунтування доцільності їх використання;
- опис процедур побудови моделей, оцінка якості додаткових по відношенню до обстеження даних, що були використані при реалізації цих процедур;
- пояснення щодо надійності оцінок показників, розрахованих за результатами обстеження, з урахуванням невизначеності, що вноситься припущеннями при побудові моделей;
- аналіз можливого впливу на оцінки показників та характеристики їх надійності неврахованих наслідків застосування моделей.
4.3. Своєчасність та пунктуальність
Своєчасність характеризує інтервал часу між моментом (періодом), у який відбувалося явище або процес, що описують статистичні дані, та датою готовності (надання) цих даних.
Пунктуальність характеризує проміжок часу між запланованою та фактичною датами підготовки даних. Наприклад, запланованою датою може бути дата, відображена у затверджених планах виконання робіт, анонсована або узгоджена з користувачами дата тощо.
Своєчасність і пунктуальність характеризуються часовими інтервалами і датами, але вони надають опис різних процесів. Своєчасність результатів обстеження відображає проміжок часу між датою закінчення підготовки даних (датою надання їх користувачам) і датою (періодом) реалізації події, явища або процесу, які описують дані. Чим коротший цей період, тим вище своєчасність. Пунктуальність характеризує проміжок часу між фактичною датою надання даних користувачам і визначеною датою, на яку їх потрібно було надати, з посиланням на дати, анонсовані в офіційних документах, наприклад у плані державних статистичних спостережень. Офіційні терміни надання інформації недоцільно порушувати у будь-яку сторону, оскільки це може призвести до порушення планів користувачів щодо використання інформації.
Своєчасність і пунктуальність накладають певні обмеження на період доступності для користувачів інформації обстежень, що проводяться на постійній основі. Щомісячні дані обстежень повинні бути доступні лише певний, спеціально визначений період часу (наприклад, певну кількість місяців) після оприлюднення. Це необхідно для мінімізації витрат ресурсів на супровід органами державної статистики неактуальної інформації і витрат часу користувачів на пошуки потрібних актуальних даних. Цей період встановлюється на основі спеціального дослідження потреб користувачів. Аналогічні терміни встановлюються для щоквартальних та річних даних.
У звітах щодо якості доцільно наводити такі показники та характеристики своєчасності та пунктуальності:
- посилання на існуючі офіційні документи щодо графіка поширення даних та періодичності розробки результатів обстеження;
- середня своєчасність даних (характеристика середнього інтервалу часу, необхідного для підготовки даних);
- періодичність надання даних і середня свіжість (актуальність) даних (свіжість даних S для обстежень, що проводяться на періодичній основі, вимірюється на основі періоду підготовки даних (-t) та циклу обстежень T, - (t + T) <= S <= -t. Якщо дані обробляються чотири місяці, а тривалість щоквартального обстеження 3 місяці, то через чотири місяці після певного циклу обстежень свіжість даних буде дорівнювати - 4, через п'ять місяців S = -5, далі вона буде знижуватись з кожним місяцем до мінімального значення S = -7, а потім з'являться нові дані, свіжість яких буде знову S = -4 і т. д.);
- відсоток даних, випущених з запізненням (оцінюється на основі термінів, вказаних в офіціальних документах, угодах тощо);
- проміжок часу між одержанням замовлення користувачів щодо підготовки даних (для нестандартних запитів) та датою їх надання;
- опис потреб основних користувачів щодо своєчасності даних, опис ступеня задоволення цих потреб;
- середня затримка у наданні даних користувачам, що оцінюється у відповідних одиницях: кількість днів, робочих днів, тижнів тощо;
- максимальне фактичне запізнення у наданні даних;
- опис причин запізнення у наданні даних: недостаток ресурсів, технічні проблеми тощо.
Для вимірювання своєчасності та пунктуальності Євростатом рекомендовані такі стандартні показники та характеристики якості статистичної продукції (табл. 1):
- пунктуальність графіка публікації (T1). Розраховується як різниця між фактичною та запланованою датами публікації.
- проміжок часу між кінцем періоду (датою) обстеження та датою отримання попередніх результатів (T2). Розраховується як різниця між датою випуску попередніх результатів та датою обстеження.
- проміжок часу між кінцем періоду обстеження та датою отримання кінцевих результатів (T3). Розраховується як різниця між датою випуску кінцевих результатів та датою обстеження.
Ці показники пропонується визначати як на поточній основі (щомісячно, щоквартально), так і щорічно.
В якості прикладу показників своєчасності доцільно навести інформацію щодо проміжку часу між закінченням певного періоду обстеження умов життя домогосподарств та датою публікації результатів цього обстеження.
Приклад
Таблиця 6
Проміжок часу між закінченням періоду обстеження умов життя домогосподарств та датою отримання результатів
Статистичні бюлетені та збірники Проміжок часу між
закінченням періоду
(датою) обстеження та
датою публікації, тижні
Соціально-демографічні характеристики
домогосподарств України
28
Витрати і ресурси домогосподарств
України (щорічний)
25
Витрати і ресурси домогосподарств
України (квартальний)
18
Стан здоров'я населення 20
Наявність у домогосподарствах товарів
тривалого користування
20
Самооцінка домогосподарствами України
рівня своїх доходів
23
Іншим прикладом інформації такого роду, що надається користувачам, могла би бути наступна.
Приклад
Проміжок часу між періодом проведення базового інтерв'ю за програмою обстеження сільськогосподарської діяльності населення в сільській місцевості (травень) та датою публікації його результатів у статистичному бюлетені "Основні сільськогосподарські характеристики домогосподарств у сільській місцевості" становить п'ять місяців кожного року, починаючи з 2004 року.
4.4. Доступність та ясність
Доступність характеризує фізичні умови, за наявності яких користувачі можуть отримати доступ до статистичних даних: способи та місця отримання даних, процедури замовлення, час, необхідний для виконання замовлень, політика ціноутворення, існуючі маркетингові умови (авторське право та ін.), формати, в яких дані можуть бути надані користувачам (паперові носії, електронні носії, Інтернет та ін.), наявність макро- та мікроданих тощо.
Ясність характеризує інформаційне середовище даних: наявність та якість метаданих, що надаються зі статистичними даними (текстова інформація, пояснення, документація та ін.), ілюстрації (графіки, карти, схеми та ін.), наявність пояснень щодо якості даних (включаючи обмеження у використанні); ступінь додаткового супроводу даних статистичними органами.
Доступність і ясність характеризують простоту і легкість, з якою користувачі можуть отримати результати обстеження, що їх цікавлять, використовуючи для цього прості і зрозумілі процедури, отримуючи дані в зручній для використання формі, в межах прийнятного для користувача періоду часу, з відповідним інформаційним супроводом та допомогою. Це, в свою чергу, забезпечує можливість оптимального використання даних.
Проблеми забезпечення конфіденційності результатів вибіркових обстежень деякою мірою обмежують доступність. Таким чином, органи державної статистики для кожного обстеження мають визначити та забезпечити певну оптимальну доступність, тобто найбільшу можливу доступність даних за умови дотримання принципу конфіденційності інформації.
Ясність характеризується якістю метаданих, які готуються за результатами вибіркового обстеження. Обсяг документації, що супроводжує результати обстежень, повинен бути адекватним для забезпечення можливості правильної інтерпретації і цільового використання користувачами результатів обстежень.
У звітах щодо якості наводяться такі показники та характеристики доступності та ясності:
- інформування користувачів щодо доступності статистичних даних через Інтернет-сайт, інші засоби електронної комунікації, опис засобів пошуку й навігації для даних, до яких забезпечено електронний доступ;
- інформування користувачів щодо випуску статистичних даних за заздалегідь оголошеним графіком з доступом для всіх користувачів в один і той же час;
- опис умов доступу до даних: канали (Інтернет, електронна пошта, інформаційна служба органів державної статистики, бібліотеки, інформаційні агенції тощо), формати, підтримка, маркетингові умови, можливі обмеження, існуючі угоди щодо супроводу і т.п.;
- опис процедур оформлення вимог доступу до неопублікованих даних;
- опис додаткової інформації (документація, в т.ч. щодо методології та програми обстеження, пояснення, якісні обмеження тощо), надання контактів для одержання більш детальної інформації, включаючи технічну інформацію;
- опис методології та алгоритмів побудови системи вихідних показників, опис моделей (якщо використовуються);
- опис можливої подальшої допомоги, послуг з супроводу даних, доступних для користувачів (коментарі, включаючи текстовий аналіз графіки, карти й т.п.);
- опис зворотного зв'язку з користувачем.
Відповідно до рекомендацій Євростату у звітах також надаються. такі стандартні показники якості статистичної продукції в частині доступності та ясності (табл. 1):
- Кількість розповсюджених та/або проданих публікацій (AC1). Цей показник може легко компілюватися для різних засобів передачі інформації: (1) публікації (Статистичний щорічник, місячні бюлетені, інформаційні бюлетені); (2) дискети; та (3) CD-диски.
- Кількість відвідувань баз даних (AC2).
- Рівень повноти метаданих для опублікованих результатів (AC2). Цей показник відображає ступінь доступності для користувачів метаданих обстеження, тобто завершеність метаданих, оприлюднених для певної статистичної області, теми. Показник має розраховуватися як рівень придатності (наприклад, 2 - повністю, 1 - частково, 0 - непридатний) аспектів метаданих, включених до шаблону метаданих, та ділитися на загальну кількість доцільних (релевантних) аспектів, для яких метадані повинні бути підготовлені.
M
S доступні метадані
j=1
Рівень повноти = ------------------------- (4.11)
метаданих M
S релевантні метадані
j=1
де (j) - аспект метаданих, що розглядається, j = 1, ... , M.
S - знак суми.
Наведені показники доступності та ясності пропонується визначати як на поточній основі (щомісячно, щоквартально), так і щорічно.
В якості прикладу характеристик доступності даних, отриманих за результатами обстеження економічної активності населення може бути наступна інформація.
Приклад
Результати обстеження економічної активності населення публікуються у щорічному статистичному збірнику "Економічна активність населення України", який поширюється у відповідності з затвердженим реєстром отримувачів та списком обов'язкової розсипки. Збірник також можна замовити та придбати в "ДП Держаналітінформ" за адресою: 01023, Київ-23, МПС, вул. Еспланадна, 4 - 6, офіс 419-2, довідки за телефонами: 289-77-62, 287-03-79. Початковий тираж цього збірника у 2005 році становив 115 екземплярів. Зі збірником можна ознайомитись у бібліотеці Держкомстату України.
У статистичному збірнику наведено детальні статистичні дані, що характеризують стан економічної активності, зайнятості та безробіття населення віком 15 - 70 років на ринку праці України. Також наведені дані про зареєстроване безробіття, що базуються на інформації адміністративних реєстрів державної служби зайнятості, інформація про рівень зайнятості та безробіття населення в країнах Євросоюзу.
У збірнику розкриваються методологічні та організаційні питання обстеження, надаються необхідні пояснення щодо методології визначення основних показників ринку праці, методів відбору домогосподарств та оцінки надійності даних.
Збірник розрахований на фахівців органів законодавчої та виконавчої влади, профспілок, наукових установ та організацій, студентів та здобувачів наукового ступеня, а також практиків, які займаються вивченням питань щодо ринку праці.
Окремі статистичні дані, отримані за результатами обстеження економічної активності населення, детальні методологічні матеріали з окремих аспектів обробки даних надані на офіційному сайті Держкомстату України: http://www.ukrstat.goy.ua/.
4.5. Порівнянність
Порівнянність спрямована на вимірювання впливу відмінностей у статистичних концепціях та визначеннях, які застосовуються, на співставність статистичних даних за географічними районами, негеографічними доменами або у часі. Це ступінь, з яким розбіжності між статистичними даними пояснюються розбіжностями між дійсними значеннями статистичних характеристик.
Порівнянність характеризує відносну якість результатів обстежень. Порівнянність даних може бути визначена, лише якщо визначені інші дані (отримані на основі іншого стандарту (класифікації) або для іншої території, групи населення тощо). Властивість порівнянності даних є результатом дії цілого ряду чинників. Органи державної статистики не можуть мати заздалегідь інформацію щодо порівнянь, в яких результати обстежень будуть використовуватись, а також щодо чинників, що впливатимуть на кожне порівняння. У зв'язку з цим дані повинні супроводжуватись інформацією, яка допоможе будь-якій зацікавленій стороні в оцінці порівнянності даних у кожній конкретній ситуації.
Основні фактори, що визначають порівнянність певних показників оцінених за результатами обстежень, можуть бути об'єднані у дві групи: концепції обстеження та методологія вимірювання.
Група концепцій вибіркового обстеження включає такі елементи, як система показників (їх зміст, визначення), одиниці спостереження, цільова та генеральна сукупність, основа вибірки, звітній період та періодичність обстежень, об'єкт спостереження, географічне охоплення, стандарти, що використовуються, та ін.
Група методології включає дизайн вибірки, спосіб збору даних, процедури обробки даних, процедури оцінювання показників та ін.
Розрізнюють такі основні аспекти порівнянності результатів вибіркових обстежень:
- географічна порівнянність;
- порівнянність у часі;
- порівнянність між доменами (групами населення, видами діяльності тощо);
- комбінаційна порівнянність.
Порівнянність у географічному аспекті розглядається для випадків, коли аналогічні за концепціями та методологією обстеження проводяться різними організаціями по різних територіях (країнах).
Порівнянність у часі аналізується, коли одне і те саме (за основними концепціями та методологією) обстеження організується та проводиться у різні періоди часу.
Порівнянність між доменами розглядається для випадків, коли аналогічні характеристики для різних доменів вимірюються в одному або у різних обстеженнях, які проводяться однією організацією.
Комбінаційну порівнянність розглядають, коли реалізуються комбінації різних окремих аспектів порівнянності.
У звітах щодо якості мають бути наведені такі показники та характеристики порівнянності:
а) щодо географічної порівнянності:
- стислі описи всіх концепцій, визначень, понять і методів, які можуть впливати на порівнянність результатів вибіркових обстежень населення;
- опис відмінностей між національними визначеннями, стандартами та міжнародними, в т.ч. європейськими стандартами у сфері вибіркових обстежень населення. Кількісна (бажано) оцінка ефекту кожної відомої різниці між цими стандартами, опис причин відхилень. Посилання на міжнародні нормативні документи, які містять стандарти або рекомендації.
- результати аналізу розбіжностей результатів обстежень для випадків здійснення порівнянь між певними регіонами;
б) щодо порівнянності у часі:
- опис динамічних рядів, в т.ч. - за минулі роки (періоди), а також опис усіх розривів у динамічних рядах;
- повідомлення користувачів щодо обстежуваного періоду, в якому відбулися зміни, що призвели до розриву часових рядів вибіркового обстеження. Необхідно відмітити основні можливі причини розривів: зміни концепцій та/або методології у часі (адаптація обстеження до реальності, гармонізація з міжнародними стандартами тощо);
- опис розбіжностей у концепціях, визначеннях, класифікаціях та методології обстеження до та після розриву;
- оцінка величини впливу змін на результати обстежень, бажано у кількісному вимірі;
в) щодо порівнянності між доменами:
- детальний опис розбіжностей у визначеннях для кожного обстеження або домена (адміністративно-територіальної одиниці, соціально-економічної групи населення тощо);
- опис методів збору інформації - одне й те ж саме обстеження, різні обстеження, використання даних із зовнішніх джерел та ін.;
- описи цільової та генеральної сукупностей для кожного з обстежень, методів формування вибірок, одиниці відбору тощо;
- опис відмінностей у класифікаціях, статистичній методології, методах обробки даних і т.п.;
- оцінка величини впливу змін на результати обстежень, бажано у кількісному вимірі.
Відповідно до рекомендацій Євростату у звітах також надаються такі стандартні показники та характеристики якості статистичної продукції в частині порівнянності (табл. 1):
- довжина зіставних часових рядів (C1). Цей показник визначається як кількість років (кварталів, місяців) від останнього розриву в часовому ряді певного показника. Якщо в часовому ряді розривів не було, то показник розраховується як кількість років (кварталів, місяців) з початку часового ряду. Показник рекомендується розраховувати щорічно;
- кількість зіставних часових рядів (C2). Цей показник є додатковим до C1 і може бути розрахований для множини показників. Показник рекомендується розраховувати щорічно;
- рівень відмінностей концепцій та методів від Європейських
норм (C3). Планується Євростатом для використання в майбутньому за
інформацією по країнах щодо наявності відмінностей концепцій та
методів, що використовуються при отриманні певної інформації (для
певного джерела інформації), від Європейських норм [6]. При
розрахунку цього індикатора для кожної країни встановлюється
значення індикатора наявності відмінностей концепцій та методів
D . Цей індикатор приймає значення "0" (відмінності відсутні) якщо
i
концепції та методи повністю гармонізовані з відповідними
нормативними документами Євростату.
Індикатор Di для i-го джерела інформації для певної країни визначається за формулою:
-
| 0, якщо відмінності відсутні;
D = < (4.12)
i | 1, якщо відмінності присутні.
-
Наявність та ступінь вищезгаданих відмінностей концепцій та методів для конкретного джерела визначається експертним шляхом.
Рівень відмінностей концепцій та методів від Європейських норм
R розраховується за формулою:
c
N
S D
i=1 i
R = -------- , (4.13)
c N
де N - загальна кількість джерел інформації у певній країні.
S - знак суми.
Рівень відмінностей R може розраховуватися також по всій
c
сукупності країн (регіонів), що порівнюються за формулою:
M N
S S D
j=1 i=1 ji
R = ------------- , (4.14)
c M x N
де j - країна (регіон); M - загальна кількість країн (регіонів);
S - знак суми.
- асиметрія для показників дзеркальної статистики (C4). Цей показник відображає невідповідність між оцінками показників, що характеризують певні процеси (міграцію, товарообіг тощо) з одного та іншого боку кордону для пар країн. Значення показника асиметрії для країни дорівнює сумі абсолютних різниць оцінок певного показника для цієї країни та всіх інших країн. Показник має розраховуватися щорічно.
Прикладом повідомлення користувачів щодо змін, які могли призвести до розриву часових рядів окремих показників в обстеженні умов життя домогосподарств, є така інформація:
Приклад
Починаючи з 2002 року до програми обстеження умов життя домогосподарств запроваджено міжнародну класифікацію індивідуального споживання товарів і послуг за цілями (COICOP-HBS), рекомендовану Євростатом. Дана публікація підготовлена за методологією визначення показників споживчих витрат відповідно до згаданої класифікації.
Номенклатура витрат на продукти харчування та безалкогольні напої, алкоголь, тютюн, непродовольчі товари та послуги опрацьована відповідно до міжнародної класифікації індивідуального споживання за цілями (COICOP-HBS), рекомендованої Євростатом.
Найбільш вагома стаття витрат "Витрати на харчування" наведена з виокремленням окремих статей витрат, що забезпечує можливість порівняння в динаміці з відповідними показниками за попередні роки (1999 - 2001 рр.):
- молоко, сир та яйця - окремо наводяться витрати на купівлю яєць;
- олія та жири - окремо виділені витрати на сало та інші тваринні харчові жири, масло, олію та інші рослинні жири;
- фрукти - окремо наводяться витрати на кавуни та дині;
- овочі, включаючи картоплю - окремо наводяться витрати на картоплю.
Крім того, для всебічної характеристики витрат на харчування в публікації наведені такі групи витрат:
- витрати на продовольчі товари;
- витрати на продукти харчування;
- вартість харчування поза домом.
Основною причиною зазначених змін є гармонізація класифікацій, що використовуються при обробці даних обстеження умов життя домогосподарств з GOICOP-HBS.
4.6. Узгодженість
Узгодженість - ступінь, з яким дані, отримані з різних джерел, можуть адекватно комбінуватись, інтегруватись та використовуватись для різних цілей. Зміст цього виміру полягає в тому, що статистичні дані, що характеризують одне й те саме явище, але отримані за результатами різних обстежень (обстежень різного типу і періодичності), можуть бути не повністю узгодженими, оскільки основані на різних методологічних підходах, класифікаціях тощо.
Узгодженість даних вибіркового обстеження населення з іншими (зовнішніми) даними передбачає можливість їх обґрунтованого комбінування, інтеграції, об'єднання з цими даними на основі відповідних статистичних методів і для різних використань. Узгодженість даних відображає проблему можливості порівняння (комбінування) показників, що характеризують, як правило, однакові або дуже близькі цільові сукупності, але отримані на основі різних джерел даних. На відміну від цього, порівнянність характеризує можливість порівняння показників, що розраховані за результатами обстеження для різних цільових сукупностей (підсукупностей).
Статистичні дані, отримані з одного джерела, наприклад, за результатами певного вибіркового обстеження, є, як правило, узгодженими і можуть надійно комбінуватись. Дані, отримані з різних джерел, наприклад, за результатами різних обстежень населення, зокрема, які проводяться з різною періодичністю тощо, не є повністю узгодженими.
Для вирішення питання щодо узгодженості даних певного вибіркового обстеження з зовнішніми даними необхідно мати два (як мінімум) набори даних і відповідні метадані.
При наданні результатів вибіркових обстежень населення користувачам необхідно оцінювати певні типи узгодженості даних у наступних стандартних ситуаціях:
1) Узгодженість між попередніми і остаточними даними. Застосовується в окремих вибіркових обстеженнях населення у випадках надання користувачам попередніх даних (наприклад, у вигляді експрес-інформації), які отримуються на основі спрощених процедур контролю та обробки даних, не на всій вибірці і т.п. Це може призводити до неповної узгодженості попередніх і остаточних даних (насамперед, у сенсі точності (надійності) і деталізації). Аналіз узгодженості такого типу та відповідне інформування користувачів проводиться після отримання остаточних даних обстеження.
2) Узгодженість між річними і квартальними (або місячними) даними. У випадках, коли для отримання квартальних (місячних) даних обстеження використовуються інші (або дещо відмінні) методологічні підходи, ніж для річних даних, доцільно провести аналіз ступеня узгодженості цих даних та надати відповідну інформацію користувачам.
3) Узгодженість між оцінками певних соціально-економічних явищ або процесів, отриманих за результатами застосування різних підходів до їх вимірювання. Оцінка узгодженості даного типу необхідна для запобігання (та пояснення) ситуацій, коли користувачі мають оперувати суттєво різною (або навіть суперечною) інформацією щодо певних явищ та процесів.
Прикладом такої ситуації можуть бути характеристики зайнятості на підприємствах за даними вибіркового обстеження домогосподарств з питань економічної активності населення та за даними обстеження підприємств або дані щодо рівня безробіття за методологією МОП та інформації адміністративних реєстрів державної служби зайнятості.
Приклад
Слід відмітити, що рівень безробіття (за методологією МОП) населення працездатного віку у 2005 році в 1,8 раза перевищував рівень зареєстрованого безробіття, розрахований за відповідною методикою, тобто по відношенню до економічно активного населення працездатного віку (у жінок - у 1,3 раза, чоловіків - у 2,5 раза міського населення - у 2,6 раза більше). Водночас у сільській місцевості цей показник на 0,5 в. п. був нижчим порівняно з рівнем зареєстрованого безробіття. Зазначена ситуація пояснюється тим, що сільські мешканці працездатного віку навіть за умови наявності низькодоходної зайнятості в особистих селянських господарствах, зверталися до державної служби зайнятості, оскільки потребували державної соціальної допомоги. Кількість зареєстрованих безробітних селян цієї вікової групи на 8,5 % перевищила відповідну чисельність безробітних сільської місцевості, визначених за методологією МОП. У той час як лише 51,4 % міських безробітних працездатного віку перебували на обліку в державній службі зайнятості.
4) Узгодженість між джерелами інформації та продуктами. Аналіз цього типу узгодженості застосовується для даних, які використовуються в якості джерел для інших статистичних продуктів. Наприклад, інформація вибіркових обстежень населення використовується для обчислення показників національних рахунків, обсягів виробництва окремих галузей економіки тощо.
В якості прикладу узгодженості між джерелами інформації можуть бути використані дані щодо узгодженості оцінок доходів та витрат домогосподарств за результатами обстеження умов життя домогосподарств та визначені в системі національних рахунків.
Приклад
Таблиця 7
Порівняння рівня середньомісячної заробітної плати, розрахованої за результатами обстеження умов життя домогосподарств та визначені в системі національних рахунків
Показник I кв.
2006 р.
II кв.
2006 р.
III кв.
2006 р.
IV кв.
2006 р.
2006 р.
Заробітна плата в
середньому за
місяць на одного
члена
домогосподарства,
грн. (обстеження
умов життя
домогосподарств)
258,8 287,5 312,5 334,0 300,1
Заробітна плата за
виключенням податку
з доходів найманих
працівників та
обов'язкових
внесків на соцстрах
у середньому за
місяць на одну
особу, грн.
(система
національних
рахунків)
262,8 301,2 323,5 386,4 318,5
Для всіх вищезазначених ситуацій у звітах щодо якості статистичної продукції необхідно наводити характеристики ступеня узгодженості показників, опис розбіжностей оцінок показників та явищ або процесів, пояснення щодо причин неузгодженості (різниць у концепціях, методології тощо).
Зокрема, у звітах щодо якості наводяться такі показники та характеристики узгодженості:
а) щодо узгодженості між попередніми та остаточними даними, отриманих за результатами певного обстеження:
- графік переглядів даних, інформування користувачів щодо даних, які підлягають перегляду, і переглянутих даних, опис причин необхідності проведення переглядів;
- порівняння оцінок основних показників за попередніми та остаточними даними, опис причин розбіжностей;
- інформування користувачів (за можливістю) щодо похибок для попередніх та остаточних даних за основними типами (похибки вибірки, похибки охоплення, похибки від не відповідей, похибки вимірювання, похибки обробки, та похибки моделювання);
- пояснення та інші коментарі для відмінностей, які можна вважати суттєвими.
б) щодо узгодженості між річними і квартальними (або місячними) даними, отриманих за результатами певного обстеження:
- порівняння річних та проміжних оцінок показників, розрахованих на основі річних масивів інформації;
- інформування користувачів щодо відмінностей у концепціях та методології, якщо відмінності поточних та річних оцінок показників повністю не пояснюються характеристиками точності.
в) щодо узгодженості даних по однакових сукупностях (доменах) отриманих з різних джерел інформації:
- порівняння оцінок основних показників, отриманих за даними обстеження з наявними близькими за змістом даними з інших джерел, з урахуванням рівня надійності, з яким ці показники оцінюються;

................
Перейти до повного тексту