Posted 16 июля 2022,, 07:10

Published 16 июля 2022,, 07:10

Modified 7 марта, 12:09

Updated 7 марта, 12:09

Парад отменяется! Почему государству не нужна фальсификация статистических данных

16 июля 2022, 07:10
Дмитрий Некрасов
Создать так называемую «парадную» государственную статистику под силу только инопланетянам, хотя уверенности в том, что и они справятся, нет никакой.
Сюжет
Власть

Поскольку мой предыдущий текст вызвал много однотипных комментариев, да и просто на будущее, выскажу здесь ряд соображений о достоверности экономической статистики в РФ.

Я сначала кратко сформулирую свои тезисы по сути, а потом обосную некоторые из них более подробно.

  1. Статистические данные являются важнейшим инструментом государственного управления и контроля. Если искаженные данные будут использоваться для управления, то качество управления неизбежно снизится, а коррупция возрастет. Соответственно для существенного искажения экономической статистики необходимо иметь два варианта статистики: «реальный» для работы госаппарата и «парадный» для рапорта об успехах.
  2. В силу того, что в государственном аппарате в своей повседневной работе официальной статистикой ежедневно пользуются десятки тысяч человек, мы бы, без всякого сомнения, знали о существовании двух параллельных статистик. Как мы знаем о фальсификации на выборах, или фальсификации данных о ковиде. Нашлось бы множество анонимных и не только свидетельств.
  3. Любое существенное и намеренное искажение показателей экономической статистики будет так или иначе видно внешним аналитикам. Данные очень сильно взаимосвязаны. Изменение одних показателей должно влечь изменение еще десятка других. Вызванные придумыванием нестыковки будут вылезать в самых неожиданных местах. «Придумать» внутренне непротиворечивую статистику, это примерно то же самое, что «придумать» законодательство, которое невозможно обойти. Находить нестыковки (часто ненамеренно) будет множество узких специалистов на местах, а «придумывать» внутренне непротиворечивую картину надо будет в центре нескольким высоколобым экспертам из головы. Это невозможно физически. По крайней мере, при той степени детализации статистики, которая сегодня доступна.
  4. Городить столь сложный огород, как две параллельных статистики, ради пиара слишком сложно и нецелесообразно. Для пиара всегда проще вырвать из контекста несколько красивых цифр.

Теперь поясню кое-что из вышесказанного подробнее.

Сначала нужно вынести за скобки проблемы с качеством и полнотой данных, которые есть у любой статистики (пусть у российской больше, чем у немецкой). Также опустим вопросы методологии ее периодических изменений.

Некоторые методы расчета/досчета и правда систематически искажают отдельные показатели в благоприятную для общей экономической картины сторону, а ряд проведенных в последние годы изменений методологии приводили к достаточно «благоприятным» пересмотрам определенных рядов цифр задним числом.

Однако в отношении подобных методологических вопросов, во-первых, изначально хорошо понятны пределы и вектор искажений, а во-вторых, они работают систематически в одну сторону и никак не мешают статистике улавливать тренды.

(Простыми словами: в отдельных вопросах экспертам в целом понятно, что если показатель Х согласно Росстату равен 10, то на самом деле он равен 9, однако если Росстат говорит, что за последний год Х вырос с 10 до 12, то мы можем быть уверены, что на самом деле Х вырос с 9 до 11. Ошибка методологии стабильна и никак не влияет на понимание тренда изменений).

Мой тезис сводится к тому, что невозможно сознательно исказить статистику в духе «на самом деле ВВП в 2022 упал на 10%, а Росстат показал, что он упал на 5%».

Для начала разделим статистические показатели на те, которые влияют на большое количество других, важных для работы бюрократической системы, показателей, и те, которые на них не влияют или ограничено влияют.

Пример: у вас умер 1 млн человек, из которых 0,5 млн от ковида. Вы можете довольно легко исказить число умерших от ковида, написав из политических соображений и 0,1 млн и 0,7 млн., потому что от чего конкретно люди умерли на другие показатели бюрократической системы влияет слабо.

Однако общую цифру в 1 млн человек умерших вам исказить гораздо сложнее (в особенности если вы публикуете ее не одной общей цифрой по стране, а с разбивкой по регионам и иным разрезам).

Во-первых, каждый гражданин состоит во множестве баз данных государственных ведомств и систематическое несовпадение этих баз статистики по регионам или другим учетным единицам будет приводить к множеству практических проблем для бюрократии. Во-вторых, совершенно реальные деньги и другие ресурсы, распределяются между различными территориальными образованиями и структурами, в том числе исходя из численности населения на определенной территории. В-третьих, разработка концепций и планов развития, а также KPI и контрольных показателей, для множества структур и программ в различных сферах от полиции до медицины, также опирается на данные о численности населения. Соответственно единственный способ занизить общее число смертей и не дезорганизовать при этом бюрократические процессы - это ведение отдельно «парадной» и отдельно «фактической» статистики.

Таким образом можно сформулировать правило, что чем больше один показатель статистики влияет на другие показатели, использующиеся в процессе практического управления, тем хлопотнее его исказить.

Другим важнейшим критерием достоверности является степень детализации. Если публикуется одна цифра смертей по всей стране, то даже в вопросе общего числа умерших соврать несложно и не хлопотно, а проверить сложно. Однако если ты эту общую цифру даешь в региональном и других разрезах, то число вызванных фальсификацией бюрократических проблем, а также сложность спрятать фальсификацию линейно растет.

В этом смысле рост ВВП и другие макроэкономические показатели, имеют самую широкую сеть взаимосвязей с другими цифрами, многие из которых критически важны для целей государственного управления.

Если мы намеренно завышаем выпуск, значит должны завысить выручку и, скорее всего, прибыль предприятий. И то и другое сидит в налоговой статистике, и активно используется для пиара достижений ФНС. Если Росстат намерено завысит выручку и прибыль, то собираемость налогов и другие похожие показатели, характеризующие качество работы ФНС ухудшаться. Если вы завышаете импорт, то где таможенные сборы, если добычу, то где НДПИ, если зарплату – НДФЛ, а если вы завысили выпуск без роста зарплаты, то где прибыль? А все это дальше идет в бюджет, исполнение которого который худо-бедно контролируется десятком инстанций, которые будут задавать вопросы, делать выводы и разрабатывать меры, на основе этих данных. И это лишь малая часть примеров, каковых десятки.

Соответственно, с точки зрения задач эффективного госуправления, намеренное искажение экономических показателей в принципе невозможно без ведения двух статистик «парадной» и «рабочей». (О чем бы мы точно знали, ибо это несоответствие бы каждый день наблюдалось десятками тысяч вовлеченных сотрудников).

Однако, на мой взгляд, выдумать непротиворечивую «парадную» статистику, огрехи которой не видны специалистам при текущей подробности предоставляемых Росстатом данных выше любых человеческих возможностей (не говоря уже про аналитические возможности собственно Росстата).

Изменение ВВП складывается из изменений сотен показателей отраслей и подотрослей, которые публикуются довольно детально. При этом одни отрасли являются покупателями продукции других, соответственно намеренное искажение должно быть сбалансированно. Часть показателей помимо денежных дублируются и в физических единицах, вроде тонн и киловатт часов.

В советское время расчет межотраслевого баланса считался сложнейшей задачей Госплана СССР, с которой никогда не удавалось эффективно справится. «Придумать» непротиворечивую экономическую статистику – абсолютно аналогичная задача, сложность которой по мере роста номенклатуры товаров и отраслей, в сравнении с 70-ми годами возросла на порядки. (Одним из расхожих объяснений снижения эффективности плановой экономики между 50-ми и 70-ми был именно взрывной рост номенклатуры продукции. Рост числа наименований на 10% увеличивает сложность планирования минимум вдвое, а сейчас номенклатура шире, чем 70-х в несколько раз).

Вы же не можете просто увеличить все показатели на условные 10%. Очень многие показатели видны из проверочной западной статистики. Сколько миллионов тонн нефти или зерна экспортировала Россия достаточно точно видно и из не российских источников, а внешнеторговый оборот – треть ВВП.

Соответственно для искажения показателей ВВП нужно «придумать» такие значения показателей не проверяемых внешней статистикой отраслей (а ты никогда не знаешь, какую хитрую методику проверки внешними данными может придумать независимый аналитик), которые были бы внутренне непротиворечивы и в плане финансовых счетов и в плане физических показателей типа мегаватт электричества. Я просто не представляю как это в принципе возможно, и какие ресурсы и кадры для этого понадобятся.

Кроме того, что экономическую статистику собирает и публикует одновременно несколько ведомств, для которых некоторые данные являются и официальным KPI и поводом для пиара собственных достижений для публики. Согласование «парадных» соотношений потребовалась оказалось бы крайне сложной и конфликтной аппаратной задачей, споры в рамках которой неизбежно вырывались бы на публику.

А еще есть множество совершенно независимых коммерческих агентств и исследований, которые изучают отдельные рынки. Они вам расскажут и о количестве проданных автомобилей, и об изменении объема рынка рекламы или среднего чека в продуктовом ритейле. Таких рейтингов исследований и докладов выходит сотни в год. Никто не может знать, кто и что сейчас считает чисто в коммерческих целях для оценки объема рынка или целесообразности открытия нового производства. Каждая из подобных цифр может служить проверочным материалом для отдельных цифр Росстата. (Они и сейчас часто не совпадают, но одно дело отдельные аномалии и разницы в методологиях, а другое дело система отклонений, которая была бы однозначно и однонаправленно видна в случае намеренных и массовых искажений статистики).

Таким образом для того, чтобы придумать правдоподобную «парадную» статистику, необходимо не просто рассчитать теоретический межотраслевой баланс в условиях гораздо более широкой номенклатуры товаров и услуг, чем в 70-е, когда с этим не справлялся гигантский Госплан, но сделать это так, чтобы эта выдумка плюс минус «билась» как с внешними данными, так и с непредсказуемым множеством внутренних экспертных оценок. Такая задача под силу разве что инопланетянам и рептилоидам, хотя не уверен, что и они справятся.

А главное зачем? Если для пиара нужно рассказать о росте промышленности, то зрителю лучше зайдет сюжет о новом открытом заводе, которые всегда открываются даже если промышленность падает. А можно и просто выдернуть из контекста показатель (какие-то показатели всегда растут) или просто выдумать его и озвучить с высокой трибуны. Тех, кто поймет, что показатель сомнителен – абсолютное меньшинство, а те, кто, ничего не понимая, не поверит озвученной цифре и сейчас точно также не верит Росстату, ибо «вы-все-врете».

Все вышесказанное не значит, что в Росстате нет намеренных искажений, просто их зоны пока ограничены плохо проверяемым. Гораздо важнее искажений тенденция засекречивания данных и сокращения их уровня подробности. В какой-то момент если будет публиковаться сотня показателей вместо десяти тысяч, искажать информацию будет сильно проще.

Когда я работал в аналитическом управлении ФНС и в экспертном управление Администрации Президента (самый центр аналитики страны с полным доступом к данным) я многократно сталкивался с тем, что существуют закрытые данные статистики, которые нигде не публикуют, но ни разу не сталкивался с тем, чтобы опубликованные данные прямо не совпадали с данными для внутреннего пользования. И сегодня видно, что все больше данных просто закрывают для публики. Это гораздо более естественный для бюрократии путь, нежели ведение двух параллельных статистик. И мы идем по этому пути все дальше.

А пока, когда мне с ехидцей задают вопрос «вы правда верите данным Росстата?», хочется ответить, что наше с вопрошающим «верю» отличается примерно также как вера физика в правильность формулы и вера обывателя в бога. Но подобный ответ требует длинных разъяснений, которые я здесь и изложил.

"