ГРУППОВЫЕ ПОКАЗАТЕЛИ РИСКА ЗДОРОВЬЮ В НЕОДНОРОДНОЙ КОГОРТЕ. КОСВЕННАЯ ОЦЕНКА ПО ДИНАМИКЕ СОБЫТИЙ - Анализ риска здоровью

Страница создана Родион Беляков
 
ПРОДОЛЖИТЬ ЧТЕНИЕ
ГРУППОВЫЕ ПОКАЗАТЕЛИ РИСКА ЗДОРОВЬЮ В НЕОДНОРОДНОЙ КОГОРТЕ. КОСВЕННАЯ ОЦЕНКА ПО ДИНАМИКЕ СОБЫТИЙ - Анализ риска здоровью
Групповые показатели риска здоровью в неоднородной когорте. Косвенная оценка по динамике событий

УДК 57.042; 519.246.2                                                                          Читать
DOI: 10.21668/health.risk/2021.2.02                                                            онлайн

Научная статья

ГРУППОВЫЕ ПОКАЗАТЕЛИ РИСКА ЗДОРОВЬЮ В НЕОДНОРОДНОЙ
КОГОРТЕ. КОСВЕННАЯ ОЦЕНКА ПО ДИНАМИКЕ СОБЫТИЙ

В.Ф. Обеснюк
Южно-Уральский институт биофизики Федерального медико-биологического агентства России,
Россия, 456780, г. Озерск, Озерское шоссе, 19

      Объектом внимания в данном исследовании является описание методики оценки интенсивных и кумулятив-
ных показателей специфического риска при наблюдении когорт, подвергавшихся сочетанному воздействию не-
скольких внешних или внутренних факторов. Показано, каким образом хорошо известные эвристико-дескрип-
тивные показатели, принятые в эпидемиологии отдаленных последствий, могут быть использованы для анализа
динамики счетных событий в когорте на вполне строгой статистико-вероятностной основе, опирающейся на
байесовский подход в трактовке условных вероятностей их наступления. Несмотря на то что в работе не ис-
пользовано ни одного нового или ранее неизвестного эпидемиологического понятия или показателя, статья не
является обзором литературы. Сравнительно новой является сама предложенная методика, сочетающая прие-
мы обработки традиционной эпидемиологической информации и корректный метрологический подход на основе
описания процессов.
      Основным результатом работы является подведение читателя к пониманию того, что все основные дескрип-
тивные эпидемиологические показатели в рамках когортного описания оказываются количественно взаимосвязанны-
ми, если рассматривать их как условные групповые процессы. Это позволяет одновременно производить взаимосогла-
сованную оценку как годовых показателей риска, так и кумулятивных показателей Каплана ‒ Майера (Флеминга –
Харрингтона) и Нельсона ‒ Аалена, а также других условных показателей риска или их аналогов. Показано, что при
выборе основной описательной характеристики кумулятивных показателей в качестве меры измеримого пролонгиро-
ванного внешнего воздействия естественно применять понятие дозы данного фактора риска, которая носит сурро-
гатный характер. Работоспособность метода оценки подтверждается примером. Указано на отличие предложенной
методики от ее прототипа, который ранее приводил к существенному смещению оценок до ~100 % по ряду парамет-
ров даже в случае штатного режима работы. Применение требует создания специализированного, но доступного
программного обеспечения для ЭВМ.
      Ключевые слова: риск, показатель, эпидемиология, фактор риска, конкуренция, косвенная оценка, смерт-
ность, процесс, когорта, страта, модель.

     Будем опираться на устоявшееся мнение о            информации. В этом смысле задача рискометрии
том, что риск здоровью представляет собой объек-        похожа на метрологическую процедуру определе-
тивную вероятность наступления того или иного           ния некой неизвестной (но объективно сущест-
нежелательного события [1–3] при некоторых сло-         вующей) величины, или на установление связи ме-
жившихся условиях/факторах, включая период на-          жду показателем риска и условиями его потенци-
блюдения. В перечень изучаемых событий обычно           альной реализации. В этой логической схеме
включают смерть, болезнь или, реже, субклиниче-         содержится кажущееся внутреннее противоречие,
ские надежно диагностируемые необратимые из-            связанное с тем, что понятие вероятности предпо-
менения состояния здоровья. Соответственно, риск        лагает действие категории «случайность», проти-
может быть количественно выражен некоторым              воречащей детерминированной категории «связь».
числовым или функциональным показателем.                Да, случайность присутствует и оказывает влияние,
В практике прогнозирования он может характери-          но противоречия нет. Применение категории
зовать даже еще не наступившее событие, однако          «риск» имеет смысл только в условиях возможной
достичь этапа управления рисками весьма сложно,         альтернативы развития событий. Однако факторы
если не обобщен опыт наблюдения подобных со-            риска могут присутствовать здесь в виде той или
бытий в схожих условиях, то есть не выполнена           иной детерминированной комбинации, порождая
апостериорная оценка риска по ранее собранной           вполне реальную связь «факторы – риск», которая
     __________________________

       Обеснюк В.Ф., 2021
      Обеснюк Валерий Федорович – кандидат физико-математических наук, доцент, старший научный сотруд-
ник (e-mail: v-f-o@subi.su; тел.: 8 (35130) 7-52-36; ORCID: https://orcid.org/0000-0002-2446-4390).

ISSN (Print) 2308-1155 ISSN (Online) 2308-1163 ISSN (Eng-online) 2542-2308                                 17
ГРУППОВЫЕ ПОКАЗАТЕЛИ РИСКА ЗДОРОВЬЮ В НЕОДНОРОДНОЙ КОГОРТЕ. КОСВЕННАЯ ОЦЕНКА ПО ДИНАМИКЕ СОБЫТИЙ - Анализ риска здоровью
В.Ф. Обеснюк

и должна являться предметом изучения еще до на-              Пример 5-летнего когортного исследования
ступления этапа управления рисками.
     Отметим ряд сугубо математических свойств                 Параметр         Экспонировано Не экспонировано
понятия «риск», определяющих сложность процеду-          Умерло по причине           30              10
ры оценки. Связь или потенциальная связь с факто-        Не умерло по причине        70              90
рами риска указывает на то, что мы имеем дело с          Всего                       100             100
условной вероятностью. Дело может усугубляться
еще и тем, что при анализе специфического риска                Понятие о названном показателе и его непо-
здоровью в роли одного из факторов риска обычно          средственной связи с величиной риска и другими
выделяют время или возраст, из чего можно сделать        объективными показателями нетрудно получить из
вывод, что риск здоровью – не только показатель          опубликованного простого примера [5], воспроизве-
(число), это еще и динамический случайный про-           денного в таблице.
цесс. Наконец, если ставится задача элиминации                 Пусть за некоторый сравнительно небольшой
влияния на метрологическую процедуру случайных           период времени T = 5 лет происходило наблюдение
или неконтролируемых факторов, этот риск никак           за двумя практически одинаковыми по составу
не может быть оценен индивидуально, но только            группами населения (стратами), отличающимися
для однородной группы индивидуумов в качестве их         только тем, что одна из них подвергалась, а другая
некоторой общебиологической характеристики.              не подвергалась воздействию некоторого фактора
     Типичным и широко употребляемым показате-           риска, влияние которого мы пытаемся оценить.
лем, используемым в дескриптивной эпидемиологии          Если риск ‒ это вероятность гибели по исследуе-
профессиональных заболеваний, клинической эпи-           мой причине, то в экспонированной группе его
демиологии, медико-экологических и демографиче-          оценка составит очевидные 30 из 100 случаев, или
ских исследованиях является интенсивный показа-           Re  0,30; аналогично в неэкспонированной
тель риска1 общей или специфической смертности            Rn  10/100 = 0,10. Тогда избыточный риск смерти
или заболеваемости, известный также под назва-
ниями «интенсивность риска», «сила смертно-              по изучаемой причине составит 0,3‒0,1 = 0,2; его
сти/заболеваемости» (force of mortality, hazard rate),   естественно связать с действием экспозиции фак-
«моментный показатель риска» [4, 5]. При описании        тора риска. Относительный риск для действия фак-
отдаленных последствий с его помощью эту вели-           тора RR  Re Rn  3,0.
чину обычно относят к году возрастной или кален-               Приведенные величины – это кумулятивные
дарной шкалы как наиболее часто употребляемой            смертности за рассматриваемый пятилетний период.
единице времени. Использование в качестве меры           По ним нетрудно оценить и интенсивные показате-
ряда из показателей риска обусловлено довольно           ли, исходя из соотношений M e  N e  1  exp  heT  
неплохой воспроизводимостью его динамики при
описании отдаленных последствий широкого списка          и M n  N n  1  exp  hnT   , а также из предположе-
эффектов, к примеру неинфекционных заболеваний,          ния о постоянстве интенсивных показателей в экс-
для большого количества изолированных субкогорт          понированной и неэкспонированной группах. Здесь
или субпопуляций, находящихся в сходных соци-            M e , M n ‒ числа «случаев» в экспонированной и не-
ально-экологических условиях. Это позволяет рас-
                                                         экспонированной стратах; N e , N n ‒ исходная засе-
сматривать интенсивный показатель во всей его ди-
намике практически в качестве видоспецифической          ленность страт; he , hn ‒ hazards ‒ годовые показатели
характеристики. Данное обстоятельство является,          риска. Наличие экспонент в указанных формулах
например, одной из причин проведения регулярного         отражает тот факт, что величины he , hn являются
регионального скрининга всех видов онкологиче-           скользящими, то есть связанными с условием дожи-
ской заболеваемости и смертности именно по упо-          тия до текущего возраста в пределах интервала на-
мянутому показателю [4]. Как правило, этот показа-       блюдения, в то время как кумулятивные показатели
тель и есть та самая величина, избыточные значения       Re , Rn относятся ко всему периоду наблюдения в
которой на уровне 0,001‒1 ‰ в год в качестве пре-        целом по сравнению с состоянием субкогорт в нача-
дельно допустимых рисков2 принимаются контро-
                                                         ле. Благодаря этому показатели he , hn по своим ма-
лирующими органами как уровни принятия реше-
ний. Интенсивный групповой показатель риска из-          тематическим свойствам аналогичны непрерывной
вестен также под не совсем точным названием              норме дисконтирования в экономической теории,
«индивидуальный риск», которое противоречит его          порождая связь с экспоненциальными соотноше-
групповой природе.                                       ниями. Расчет по ним дает he  71 ‰ в год
      __________________________
      1
        Эпидемиологический словарь / под ред. Д.М. Ласта для Международной эпидемиологической ассоциации. ‒
4-е изд. – 316 с.
      2
        Р 2.1.10.1920-04. Руководство по оценке риска для здоровья населения при воздействии химических веществ,
загрязняющих окружающую среду. – М.: Федеральный центр госсанэпиднадзора Минздрава России, 2004. – 143 с.

18                                                                           Анализ риска здоровью. 2021. № 2
ГРУППОВЫЕ ПОКАЗАТЕЛИ РИСКА ЗДОРОВЬЮ В НЕОДНОРОДНОЙ КОГОРТЕ. КОСВЕННАЯ ОЦЕНКА ПО ДИНАМИКЕ СОБЫТИЙ - Анализ риска здоровью
Групповые показатели риска здоровью в неоднородной когорте. Косвенная оценка по динамике событий

и he  21 ‰ в год соответственно. Отношение по-         будет превышать 100 %. Менее чем по четырем точ-
казателей риска (hazard ratio) HR  he hn              кам вообще невозможно надежно идентифицировать
                                                        процесс, несмотря на то, что статистически значи-
= 3,38  RR  3,0 под действием фактора.
                                                        мые различия страт могут наблюдаться и при мень-
      Если просто не обращать внимания на двусмыс-      шем числе случаев [6]. Таким образом, требуется
ленность толкования относительного риска и возвра-      создание такого алгоритма оценивания, который
тится к названию статьи, уместно задать вопрос:         сохранял бы преимущества стратификации про-
в чем же проблема оценки показателей в неоднород-       странства факторов вместе с возможностью иденти-
ной когорте? Ведь, судя по данным таблицы, все пре-     фикации оптимальной модельной зависимости по-
дельно просто. На самом же деле здесь целый ворох       казателей риска, учитывающей взаимосвязь со всеми
методологических проблем:                               факторами риска для всей совокупности страт одно-
      1) показатель h  h(t ) на самом деле не число,   временно.
а функция возраста или времени, то есть процесс,             Таким образом, актуальной и естественной яв-
в то время как в таблице оценки приведены к обыч-       ляется задача построения алгоритма оценки интен-
ным скалярным (числовым) показателям;                   сивных и кумулятивных показателей специфическо-
      2) в таблице указан только один фактор, ока-      го риска в неоднородной когорте на основе данных
зывающий влияние на риск, в то время как в ситуа-       регистра о ее длительном наблюдении.
ции реальной выборки или когорты почти всегда                Описание метода оценки и его прототипа.
приходится иметь дело с многофакторным иссле-           Отметим, что интерес к проблеме неоднородности
дованием. Здесь нужна особая технология стати-          реальных наблюдений существует давно как в случае
стического оценивания, подразумевающая страти-          когортных выборок, так и в случае популяционных
фикацию неоднородной когорты более чем на две           исследований медико-демографических проблем [7].
страты с учетом всех интересующих комбинаций            Установлено множество различных причин неодно-
факторов риска;                                         родности, наблюдаемых при жизни представителей
      3) как можно видеть, ни интенсивность h, ни ее    выборки или устанавливаемых посмертно, включая
кумулятивный аналог h  T не являются непосредст-       ненаблюдаемые скрытые факторы [8].
венно наблюдаемыми величинами. Живучести про-                Не претендуя на всеобщий охват, в дальней-
тивоположных (устаревших) воззрений способствует        шем сосредоточим свое внимание на изучении
известное приближенное свойство величины h,             влияния только заранее известных факторов риска,
позволяющее вычислять ее как «отношение числа           полагая латентные переменные состояния отсутст-
специфических случаев к числу человеко-лет наблю-       вующими. Здесь остается полагаться только на ин-
дения под риском»1. Ошибочно считать это прибли-        туицию врача-исследователя при ведении регистра и
женное свойство точным определением. В действи-         первичном сборе эпидемиологической информации.
тельности первичной эмпирически наблюдаемой ин-         Это позволяет еще до начала математического ана-
формацией является динамика отсчетов в таблице как      лиза данных выполнить группирование индивидуу-
в кумулятивной, так и в индивидуальной форме. Это       мов по стратам с возможностью постоянной привяз-
обстоятельство порождает задачу косвенной оценки        ки к своей заранее определенной страте в течение
процесса h(t ) или его кумулятивного аналога по на-     всего периода наблюдения. Имплицитно предпола-
блюдениям процесса накопления отсчетов в каждой         гается, что все индивидуумы в ней имеют одинако-
однородной страте когорты;                              вые шансы заболеть или умереть от любой иссле-
      4) отсчеты в однородной страте, являющейся        дуемой причины, закодированной в сборниках
частью случайной выборки, тоже случайны. В оцен-        МКБ-9 или МКБ-10. Особенно просто это сделать
ке же нуждается показатель некой однородной и           в отношении факторов риска, которые можно опи-
почти генеральной совокупности. По этой причине         сать в виде бинарных признаков, например пола или
показателям может быть дана оценка с некоторой          принадлежности к группе курящих или некурящих.
относительной неопределенностью, которая будет          Бинарным признаком может быть даже интерфери-
тем больше, чем меньше число случаев в изучаемой        рующее заболевание в анамнезе периода наблюде-
когорте/страте. Например, интервальные оценки           ния. Такие факторы можно считать почти неизмен-
кумулятивных рисков для рассмотренных экспони-          ными на протяжении довольно длительного времени.
рованной и неэкспонированной страт (на уровне           Некоторые количественные факторы воздействия на
95%-ной доверительной вероятности) составляют           здоровье также могут оказаться пригодными для
 Re  0,219…0,396 и Rn  0,056…0,175, причем вид-       выбранной схемы стратификации, если характер
но, что для неэкспонированной группы ширина ин-         интенсивности воздействия одинаков для всех чле-
тервала неопределенности превышает центральную          нов когорты. Это очевидно для случаев острого од-
оценку. Это обстоятельство практически запрещает        нократного воздействия, либо хронического равно-
нам работать с малочисленными стратами, число           мерного воздействия с постоянной индивидуальной
«случаев» в которых менее 4, так как расширенная        интенсивностью. Тогда возможно введение такого
относительная неопределенность риска заведомо           (суррогатного) кумулятивного фактора, как доза,

ISSN (Print) 2308-1155 ISSN (Online) 2308-1163 ISSN (Eng-online) 2542-2308                            19
В.Ф. Обеснюк

накопленная на конец периода наблюдения. В этом             нову подобно своему прототипу – методу макси-
случае представляется вполне естественным анализ            мального правдоподобия Карла Гаусса [12].
условной зависимости в паре «кумулятивный риск –                  Хотя любой алгоритм статистической обработ-
кумулятивная доза».                                         ки дает смещенные оценки, есть основания надеять-
     Описанный подход в эпидемиологии имеет свой            ся на заметное улучшение измерительной точности
функциональный прототип – модуль AMFIT пакета               за счет исправления недостатков уже неплохо заре-
программ Epicure3. Этот программный продукт ус-             комендовавшего себя алгоритма AMFIT, если ис-
пешно зарекомендовал себя в эпидемиологических              пользовать последний в качестве прототипа.
исследованиях во всем мире [9, 10]. В частности,                  Взаимосвязь интенсивных и кумулятивных
в области радиационно-эпидемиологических исследо-           условных статистических показателей в эпиде-
ваний он провозглашен стандартом программного               миологии отдаленных последствий. Стремление
обеспечения: «… Epicure is the de-facto standard for        к получению объективных оценок эпидемиологи-
modeling radiation health effects …» [11]. На основании     ческих показателей требует применения несколько
результатов, полученных с помощью AMFIT (алго-              более углубленного математического аппарата, чем
ритм пуассоновской регрессии), базируются практиче-         тот, который был продемонстрирован при обработ-
ски все национальные нормы радиационной безопас-            ке данных, приведенных в таблице. Эта математи-
ности в странах, имеющих радиационно опасные про-           ка, однако, никого не должна вводить в заблужде-
изводства, включая Россию4. При этом считается              ние относительно намерений перейти в область
установленным, что эквивалентная доза радиационно-          аналитической эпидемиологии. Демонстрируемая
го воздействия – общепризнанный фактор риска отда-          методика по-прежнему соответствует обычной де-
ленных радиационно-онкологических последствий.              скриптивной статистике, не связанной с природой
     Подход, предлагаемый в данной работе, не-              причинно-следственных связей при описании со-
сколько отличается от AMFIT, несмотря на то что             стояния здоровья, если речь идет о событиях в ус-
имеет общую цель. Таких отличий три:                        ловно однородной страте в составе неоднородной
     а) если придерживаться строго вероятностного           когорты. Дескриптивный подход подразумевает
метода, то описание наблюдений и построение                 очевидный формализм: в тех случаях, когда потоки
функционала их совокупной оценки нельзя обеспе-             событий со специфической причиной смерти или
чить применением пуассоновского распределения               заболевания в однородной группе можно описать
для отсчетов «случаев» в стратах, поскольку пуас-           простой марковской схемой с тремя состояниями и
соновская статистика пригодна только для описания           наличием двух конкурирующих причин выбывания
редких событий в неограниченной выборке. Реаль-             из-под наблюдения, скорость изменения заселен-
ные когорты рано или поздно перестают быть тако-            ности компартмента, отвечающего за исходное
выми по мере вымирания даже приближенно. Необ-              состояние, пропорциональна численности лиц, его
ходимо более корректное описание отклонений от              заселяющих (рис. 1, формула (1)). Независимо от
основного тренда (процесса) на базе биномиальной            того, насколько близка такая модель к действи-
статистики, пригодной для конечных выборок и не             тельности, коэффициент пропорциональности ме-
связанной с условием редкости событий;                      жду скоростью выбывания и численностью лиц
     б) во главу угла в алгоритме AMFIT положе-             в основном состоянии всегда может быть вычислен
ны оценки интенсивности специфических событий               и представлен в виде суммы двух интенсивностей
в ущерб оценке связанных с ними кумулятивных                событий – изучаемой и конкурирующей.
показателей. Между тем интенсивность не является
непосредственно наблюдаемой дескриптивной ха-
рактеристикой, однако вместо нее успешно может
быть применен кумулятивный показатель Капла-
на ‒ Майера, напрямую связанный с индивидуаль-
ными отсчетами «случаев» и случайными отклоне-
ниями биномиальной природы. Применение такого
показателя позволило бы повысить устойчивость
оценок одновременно с сохранением возможности
вычисления интенсивности событий;
                                                                 Рис. 1. Марковская структурная схема выбытия
     в) в основе алгоритма AMFIT лежит метод
                                                              из-под наблюдения для двух конкурирующих причин
максимального правдоподобия в формулировке Ро-                 смерти. Указаны компартмент исходного состояния
нальда Фишера, который, строго говоря, не является                 и компартменты для двух разновидностей
вероятностным, а имеет сугубо эвристическую ос-                          регистрируемых причин смерти

     __________________________
     3
       EPICURE User’s Guide / D. Preston, J. Lubin, D. Pierce, M. McConney. – Seattle: Hirosoft, 1988–1993. ‒ 334 p.
     4
       СанПиН 2.6.1.2523-09. Нормы радиационной безопасности (НРБ-99/2009). – М.: Федеральный центр гигиены
и эпидемиологии Роспотребнадзора, 2009. – 100 с.

20                                                                             Анализ риска здоровью. 2021. № 2
Групповые показатели риска здоровью в неоднородной когорте. Косвенная оценка по динамике событий

     Схема рис. 1 может быть приближенно опи-                                   ная интенсивность специфической смертности при
сана системой обыкновенных дифференциальных                                     условии отсутствия иных причин смерти (cumulative
уравнений                                                                       hazard) [19, 20]. Может показаться, что связанные
                                                                                друг с другом показатели P1  t t0  и H1  t t0  не
                              h0  t   h1  t    N ,
                       dN
                       dt                                                       наблюдаемы. Однако это не так. В эпидемиологиче-
                                                                         (1)    ских приложениях теории мартингалов [19] уста-
                       dM 1
                             h1  t   N ,                                    новлено, что показателю P1  t t0  соответствует
                        dt
                                                                                условная, но вполне измеримая функция дожития
где t – время (возраст); h0  t  , h1  t   интенсивности
                                                                                Каплана ‒ Майера [22], а величине H1  t t0  ‒ изме-
событий конкурирующей и изучаемой причин смерти;
                                                                                римый и уже упоминавшийся мартингальный пока-
 N  t   заселенность исходного состояния; M 1  t  
                                                                                затель Нельсона ‒ Аалена. Напомним, что величина
кумулятивное (накопленное) число случаев смерти по                               H1  t t0  , по сути являющаяся площадью под кри-
изучаемой причине. Приближенность системы урав-
нений (1) связана с тем, что не существует производ-                            вой процесса h1  t  , успешно и эффективно более
ных от дискретнозначных функций, подверженных                                   двух десятилетий контролируется в рамках онколо-
к тому же случайным флуктуациям. Однако это не                                  гического мониторинга [4] в Российской Федерации.
мешает перейти к ожидаемым условным долям, ис-                                  Этот показатель удобен не только для измерений
числяемым от исходной численности однородной под-                               в когорте, но и в популяции.
группы в некоторой точке начала наблюдения t0 ,                                      Таким образом, в рамках простой динамиче-
а значит, к условным вероятностям или показателям                               ской схемы, приведенной на рис. 1, оказываются
распространенности в страте. Тогда соотношения ста-                             связанными шесть дескриптивных эпидемиологиче-
нут непрерывными и точными (2):                                                 ских показателей ‒ четыре кумулятивных и два ин-
                                                                                тенсивных. Важно отметить, что величина показате-
                        dS
                              h0  t   h1  t    S ,                    лей, являющихся относительными, привязана к раз-
                        dt                                                      ной базе. Например, условный пожизненный риск
                                                                         (2)    исчисляется по отношению к точке начала наблю-
                        dR
                            h1  t   S ,                                     дения, а интенсивные показатели и их кумулятив-
                        dt
                                                                                ные характеристики P1  t t0  и H1  t t0  являются
если условно принять в точке начала наблюдения
                                                                                скользящими, т.е. исчисляемыми относительно дос-
S  t0   1 . В силу линейности, система (2) имеет                             тигнутой доли выживших, поскольку связаны с ус-
простое аналитическое решение:                                                  ловием дожития до момента наблюдения. Кроме
                                                                                того, истинная функция дожития оказывается силь-
            S  t   S  t t0   S  t0   P0  t t0   P1  t t0  , (3)   нее связанной с конкурирующими причинами смер-
                                                                                ти и неконтролируемой историей страты до начала
                                       t
                                                                                наблюдения, по сравнению с показателями, отве-
                      R  t t0    h1  τ   S  τ  dτ ,            (4)
                                                                                чающими за изучаемую причину смерти. По этой
                                                                                причине показатели H1  t t0  и P1  t t0  представ-
                                       t0

где                                
               P0  t t0   exp  H 0  t t0  ;              P1  t t0     ляют    самостоятельный              интерес.   В силу   связи

                       
                                             t
 exp  H1  t t0  ; H  t t0    h  τ  dτ ; R  прирост
                                                                                                                
                                                                                P1  t t0   exp  H1  t t0  показатель P1  t t0  мож-
                                            t0                                  но трактовать как некий условный аналог «функции
риска смерти от изучаемой причины за период                                     дожития», своеобразие которого состоит в том, что
t0 , t  . По смыслу решений (3), (4) и по опыту широ-                         его предельное значение при t   может не дос-
                                                                                тигать нуля, в отличие от истинной функции дожи-
кого круга эпидемиологов [13–23] в этих выражени-                               тия. Такое поведение возможно, если изучаемая
ях помимо интенсивности изучаемых специфиче-                                    причина смертности не является ведущей, в отличие
ских событий h1  t  можно узнать точную функцию                               от совокупности конкурирующих причин смерти.
дожития S  t t0  , добавочный условный пожизнен-                              Оно будет наблюдаться также и в тех случаях, когда
                                                                                фатальный потенциал изучаемой причины смерти
ный риск смерти от изучаемой причины R  t t0  ,                              конечен в силу конечности доли лиц, потенциально
                                                                                подверженных развитию изучаемого заболевания.
кумулятивную вероятность не умереть от изучаемой
                                                                                Эти свойства позволяют интерпретировать показа-
причины при условии дожития до возраста t0 и ус-
ловного отсутствия конкурирующих причин смерти ‒                                              
                                                                                тели 1  exp  H1  t t0       и H1  t t0  подобно вели-
P1  t t0  , а кроме того, аналог показателя Нельсона ‒                        чине специфического риска и численно почти ото-
                                                                                ждествлять их, если только предельное значение по-
Аалена H1  t t0  , известного также как кумулятив-                            казателя Нельсона ‒ Аалена не превышает примерно

ISSN (Print) 2308-1155 ISSN (Online) 2308-1163 ISSN (Eng-online) 2542-2308                                                                 21
В.Ф. Обеснюк

~0,1. Этому условию практически всегда удовлетворя-             факт, что большинство интенсивных показателей
ет популяционная кумулятивная смертность, связанная             риска смерти от аналогичных онкозаболеваний в воз-
с конкретной локализацией онкологического заболе-               растной динамике имеет вид унимодальных функций,
вания [4]. Однако, например, смертность от всех бо-             характеризующихся приблизительно степенным рос-
лезней системы кровообращения в популяции обычно                том в диапазоне возрастов до 60–65 лет и резким спа-
перекрывает это ограничение, и тогда H1  t t0  не             дом в возрасте старше 75 лет.
является оценкой риска. Сравнительно больших зна-                    Если непрерывная модель h  t z , β, Data  в не-
чений H1  t t0  может достигать также среди контин-           котором смысле адекватна изучаемому множеству
                                                                дискретных эмпирических отсчетов Data , это будет
гента специализированных клиник или отделений в
силу специфики отбора их пациентов. Например,                   означать попытку двойственного описания одних
в работе [24] приводятся оценки группового риска смер-          и тех же событий либо через отсчеты непосредст-
ти от рака предстательной железы до 1  P1  24 %, что          венно, либо в пространстве параметров . Естест-
                                                                венному рассеянию в пространстве наблюдений бу-
соответствует предельному значению H1  0,27 за                 дет соответствовать некоторое непрерывное услов-
период более 3000 суток. Для сравнения, кумулятив-              ное распределение в пространстве параметров. Оно
ный риск развития рака предстательной железы в по-              будет прямо представлять интерес для интервально-
пуляции мужчин РФ за 75 лет жизни не превышает                  го оценивания множества подходящих параметри-
                                            
5,7 % [4]. За показателем риска 1  exp  H1  t t0       в   ческих гипотез, если процедуре оценки придать ве-
                                                                роятностную форму.
радиационной эпидемиологии закрепилась аббревиа-                     Подходящим инструментом для этого является
тура RADS [15, 16].
                                                                теорема Байеса, позволяющая связать два упомяну-
     Принципы конструирования и параметриза-
                                                                тых типа условных распределений:
ции модели. Байесовское интервальное статисти-
ческое оценивание. Как было показано, оценка ку-                                     L  Data β   prior  β 
мулятивных показателей для отдельных страт не                     ψ  β Data                                       (5)
представляет больших технических трудностей, од-                                    L  Data β   prior  β  dβ
нако любая подробная стратификация наблюдений
в пространстве факторов приводит к уменьшению                   или    ψ  β Data   L  Data β   prior  β  .   (6)
числа «случаев» в каждой страте и, соответственно,
к росту неопределенности оценки рисков. Поднять                      Несмотря на то что байесовский подход счи-
точность оценок и одновременно сохранить подроб-                тается прямым статистическим конкурентом из-
ность описания можно только путем применения                    вестному методу максимального правдоподобия,
единой аппроксимирующей математической модели                   оба подхода органически связаны друг с другом.
для всех страт одновременно. Тем самым в расчетах
                                                                Здесь L  Data β   плотность рассеяния наблюде-
будут участвовать все наблюдаемые «случаи», что
при соответствующей оптимизации позволит добить-                ний для фиксированной параметрической модели;
ся большей устойчивости оценок риска. В этом со-                ψ  β Data   плотность распределения параметров
стоит роль единой модели для всех страт. Она долж-
на быть динамической, то есть пригодной для всех                модели для собранных наблюдений; prior  β  –
наблюдений, разнесенных по времени (возрасту).                  априорное распределение параметров предположи-
Строго говоря, модель должна соответствовать при-               тельно адекватной модели hazard. По смыслу ус-
роде связи факторов с показателями риска, однако                ловных распределений ψ – правдоподобие Байеса;
обычно это и является предметом исследования, то                L – правдоподобие Фишера, а ожидаемая область
есть до завершения анализа такой модели обычно                  наиболее вероятных параметров лежит вблизи точ-
нет. В этом случае можно опереться на ожидаемое                 ки максимального правдоподобия функции L, по
подобие динамики реализации риска во времени для                крайней мере в тех исследованиях, результат кото-
различных страт h  h  t z , β, Data  , взяв за основу        рых до анализа опытных данных неизвестен.
уже изученное поведение показателей в некоторой                 В данном случае соотношения (5), (6) вполне стро-
группе сравнения. Здесь z – вектор факторов риска;              гие, если бы не неизвестность априорного распре-
 – соответствующий вектор подгоночных парамет-                 деления prior  β  , благодаря которому справедли-
ров модели. При изучении онкологических эффектов                во мнение5 о том, что понятие параметрически за-
разумно использовать популяционные показатели [4]               висимого правдоподобия не тождественно понятию
и на основе метода возмущений ввести в описание                 условной плотности вероятности [25]. Однако в
связь с факторами риска и соответствующую пара-                 защиту байесовского подхода отметим, что всякое
метризацию. Например, можно использовать тот                    новое и в особенности однократное исследование
      __________________________
      5
          Справочник по прикладной статистике / ред. Э. Ллойд, У. Ледерман. ‒ М.: Финансы и статистика, 1989. – 510 с.

22                                                                                    Анализ риска здоровью. 2021. № 2
Групповые показатели риска здоровью в неоднородной когорте. Косвенная оценка по динамике событий

характеризуется почти полным отсутствием до-                              ной интенсивности риска являются интегралами
опытного знания, благодаря которому функция                               модельной функции интенсивности
 prior  β  заведомо характеризуется существенно                                                                         ti

большей шириной по сравнению с L  Data β  как                                       H i  H i  ti ti 1 , z , β       hτ      z , β  dτ.   (9)
                                                                                                                         ti 1
функцией параметров  в некоторой значимой об-
ласти. Поэтому не будет большой ошибкой при-                                   По своей конструкции правдоподобие (7), (8)
нять предположение о каком-либо неинформатив-                             имеет дифференциальную форму, как и традицион-
ном априорном распределении или даже о предполо-                          ное правдоподобие Фишера для независимых собы-
жении prior  β   1 в значимой области. Тогда                           тий, однако это не совсем так. Анализируя частные
                                                                          правдоподобия Li ~ π iNi1  mi 1  π i  i , нетрудно заме-
                                                                                                                                 m

формально ψ  β Data   L  Data β  , чем фактиче-
                                                                          тить, что они достигают максимального значения
ски и пользовался Рональд Фишер, что не мешало
ему в публикациях одновременно полностью от-                              при π iopt   N i 1  mi  N i 1 , то есть локально удовле-
вергать байесовский подход [25]. Близость понятий                         творяют процедуре Каплана ‒ Майера [22] на каж-
байесовского и фишеровского правдоподобий оп-                             дом i-м шаге по времени для однородной страты.
равдывает рассмотрение постоянных параметров                              Таким образом, максимизация функционала (7), (8)
функции правдоподобия L  Data β  в качестве                             потенциально может привести к интерполяции ку-
                                                                          мулятивного показателя, если рассматривать оценки
подгоночных переменных модели. То, что считается
                                                                          π̂ i  π iopt в качестве параметров интерполирующей
постоянным вектором в фриквентистской/частот-
нической концепции Фишера и Пирсона, при более                            модели. Разумеется, это же свойство приближенно
строгом рассмотрении является непрерывной слу-                            сохранится и при меньшем числе параметров в со-
чайной переменной по Лапласу / Байесу.                                    ставе рассматриваемого вектора , но с добавлением
     Отметим главное: правдоподобие для совокуп-                          фильтрующего свойства правдоподобия как функ-
ности страт в силу их независимости просто равно                          ционала оценки. Таким образом, сконструированное
произведению правдоподобий для каждой однород-                            правдоподобие способно одновременно обеспечить
ной страты. Поэтому построим правдоподобие для                            и дифференциальную, и кумулятивную аппрокси-
отдельной однородной страты. Для этого в ее преде-                        мацию (регрессию) одновременно. Оценка интенсив-
лах введем свою сетку моментов времени ti, каждый                         ных показателей аналогична разностному численно-
узел которой привязан к одному из специфических                           му дифференцированию меняющейся зашумленной
событий на числовой оси возраста. Точка t0 соответ-                       функции. Дифференцирование эмпирических дан-
ствует началу наблюдения. Очень редко в одном                             ных ‒ плохо обусловленная (некорректная) численная
узле может происходить до 2–3 таких событий од-                           операция. Напротив, производные от сглаженной ку-
новременно, поэтому каждый полуоткрытый интер-
                                                                          мулятивной функции будут более устойчивыми.
вал (ti 1 , ti ] между двумя соседними узлами будет
                                                                                 Технически удобнее вместо резко изменяющей-
связан со своим количеством накопленных специ-
                                                                          ся функции правдоподобия L  Data β  или плотно-
фических случаев mi. Обычно mi  1 . Общее коли-
чество накопленных случаев к рассматриваемому                             сти ψ  β Data  оперировать их удвоенным нату-
                                                        i
моменту времени ti составит M i   m j .                                 ральным логарифмом, смещенным относительно точ-
                                                       j 1               ки предельного насыщения (интерполяции). Тогда
     Совместное правдоподобие наблюдения всей                             для одной страты вместо поисков вблизи максимума
последовательности специфических событий в j-й                            выражения (7) следует анализировать функцию
страте с вектором факторов zj, как цепи последова-
тельных переходов, составит                                                                                         N  mi  
                                                                                                N i 1  mi  ln  i 1               
         L j  L( M i max , M i max 1 , ... , M 1 z j , β)                                                        N i 1 π i  β   
                                                                    (7)     β Data   2                                                (10)
                          i max
                                                                                             i                                        
                     1   p  M i M i 1  ,
                                                                                                                       mi
                                                                                                 mi ln  N 1  π  β    
                           i 1
                                                                                                            i 1           i          
где
                                  p ( M i M i 1 )                       вблизи ее минимума. Вклады (10) следует просум-
                      N i 1 !                                      (8)   мировать для всей совокупности непустых страт.
                                      πi  i1 i 1  πi )  i .
                                           N m
             
                                                             m

               mi ! ( N i 1  mi )!                                      Окончательно в этом случае можно говорить о дос-
                                                                          тигнутой девиации (функционале оценки)
       Здесь также введены обозначения π i  exp   H i 
и H i  H (ti ti 1 , z , β) , где приращения кумулятив-                          β     j  β Data  ;  j  β Data   0 .                 (11)
                                                                                             j

ISSN (Print) 2308-1155 ISSN (Online) 2308-1163 ISSN (Eng-online) 2542-2308                                                                          23
В.Ф. Обеснюк

     Согласно известным представлениям [26, 27],       предпочтительным, поскольку не существует ни
свойственным фишеровскому подходу, по величине         одного реального регистра, результат исследования
уклонения    β  от нуля можно судить о качестве    рисков для которого заведомо совпадал бы с точны-
                                                       ми и заранее известными показателями. Поскольку в
и статистической значимости выполненной аппрок-
                                                       искусственной когорте будет происходить только
симации, а по разности достигнутых оптимальных
                                                       детерминированная имитация стохастического по-
значений ‒ следует производить селекцию моделей.
                                                       ведения ее участников, следует ожидать возможно-
Если параметрическая зависимость девиации (11)
                                                       сти численного достижения нулевой или почти ну-
близка к квадратичной по малым отклонениям от
                                                       левой девиации (11). Иными словами, предстоит
центра (т.е. ψ  β Data  ‒ почти нормальное много-    практически ответить на вопрос, обладает ли изу-
мерное распределение), случайное рассеяние    β    чаемый алгоритм оценки асимптотической сходи-
                                                       мостью. Этот вопрос можно адресовать не только
вблизи минимума близко к распределению «хи-            к рассматриваемому алгоритму, но и к его прототи-
квадрат» с числом степеней свободы, равным разно-      пу – алгоритму AMFIT пакета программ Epicure,
сти между количеством группированных слагаемых         несмотря на то что ранее эта проверка не проводи-
в составе (11) и размерностью вектора .               лось никогда.
        С учетом того, что на практике параметри-              В качестве примера рассмотрим радиацион-
ческая зависимость правдоподобий L  Data β  и        но-эпидемиологическое исследование. В основу
                                                       положим следующие характеристики. Создадим
ψ  β Data  может оказаться весьма далекой от         имитационную выборку из четко ограниченных од-
многомерного нормального распределения, более          нородных страт, различающихся по дозе гамма-
продуктивным будет завершение алгоритма оценки         облучения (от нуля до 2 Зв), полу и достигнутому
в логике последовательного продолжения байесов-        возрасту. Будем считать, что кумулятивная доза ра-
ского подхода. Это означает переход к интерваль-       диации – фактор риска, причем вся она была полу-
ному оцениванию, основанному на многомерных            чена в режиме острого однократного равномерного
совместных распределениях (5), (6). Однако вместе      облучения легких в возрасте 19 лет. Основными
с достаточной строгостью байесовский подход от-        причинами изменения показателей онкологической
личается высокой трудоемкостью и склонностью к         смертности будем считать: а) условно линейный
накоплению вычислительных погрешностей, свя-           рост кумулятивного показателя интенсивности рис-
занных с прямым подсчетом многомерных интегра-         ка смерти от рака легких с ростом дозы, известной и
лов с участием плотности ψ  β Data  в пространст-    ограниченной по величине; б) некоторое сокраще-
                                                       ние продолжительности жизни для всех облученных
ве параметров . По этой причине более реалистич-      членов когорты; в) пол в качестве одного из факто-
ным на практике является метод статистических          ров неоднородности, вызывающего как несовпаде-
испытаний (метод Монте-Карло), позволяющий по          ние фоновых показателей риска у мужчин и жен-
большому множеству точечных псевдонаблюдений           щин, так и различия в радиочувствительности. Та-
(~1 млн или более), подчиняющихся распределению        кие причинно-следственные связи хорошо известны
 ψ  β Data  , производить осреднение интересую-      по серии исследований реальной когорты лиц, под-
щих исследователя функций или параметров вместе        вергшихся атомной бомбардировке в Хиросиме и
с оценкой их маржинальных статистических харак-        Нагасаки [29, 30]. Фрагмент диаграммы (мужчины)
теристик. Алгоритм тоже трудоемкий, но, несмотря       с грубыми оценками годовых показателей риска по
на это, – наиболее реалистический. Теоретическая       типовой схеме трехфакторной «эталонной когорты»
основа для одного из способов его практической         (пол, доза, возраст), представлен на рис. 2. Всего в
реализации – алгоритма Гиббса – хорошо известна        базе данных имелось 25 тысяч индивидуальных за-
[28]. При этом оценки центра распределения по ме-      писей (15 тысяч мужчин; 10 тысяч женщин). Общее
тоду максимального правдоподобия в случае уни-         количество случаев смерти от специфического рака
                                                       при условии полного вымирания когорты – 1118
модальной плотности ψ  β Data  могут служить         (995 случаев среди мужчин; 123 случая среди жен-
хорошим начальным приближением для построе-            щин). Общая продолжительность наблюдения ко-
ния стохастической последовательности псевдо-          горты 1 031 414 человеко-лет. При условии груп-
наблюдений.                                            пирования по 14 возрастным интервалам, двум по-
        Результаты оценки показателей риска в          ловым признакам и пяти уровням доз можно
неоднородной когорте с заранее известными              получить 14·2·5 = 140 однородных страт. Оказа-
свойствами. Рассмотрим искусственно созданный          лось, что из них только 91 страта содержала нену-
эпидемиологический регистр, описывающий некую          левое количество случаев специфического рака.
«эталонную» когорту, события в которой не имеют        Непустые страты соответствовали 754 106 челове-
случайной составляющей и точно подчиняются за-         ко-годам наблюдения.
ранее известной модели. Выбор имитационных дан-             Представляется очевидным тот факт, что при
ных вместо реальных в данном случае является           отсутствии случайных колебаний выборочных пока-

24                                                                      Анализ риска здоровью. 2021. № 2
Групповые показатели риска здоровью в неоднородной когорте. Косвенная оценка по динамике событий

зателей в «эталонной когорте» дозовый и возрас-
тной тренды на рис. 2 видны невооруженным гла-
зом. Одновременно количественные закономерно-
сти для фоновых показателей риска полностью со-
ответствуют популяционным [4]. Исследователь
риска обязан «видеть» всю заданную детализацию.
Что же будут давать предлагаемый алгоритм и его
ближайший прототип?
     Оказывается, предлагаемый метод оценки про-
цессов изменения кумулятивных и интенсивных
показателей неплохо справляется с поставленной
задачей, что можно видеть на рис. 3 и 4 как для суб-
когорты женщин, так и для субкогорты мужчин
в рамках единой параметрической модели  β  R 8  .
                                                          Рис. 2. Трехмерная диаграмма «возраст – доза – показатель»
     Вычисленная минимальная девиация  min для           для мужской части «эталонной» когорты. По горизонтали
                                                            отложены номера возрастных страт (14 шт.) и дозовых
найденного экстремального решения составила в              страт (5 шт.). По вертикали – грубые оценки показателя
данном случае всего 0,40 единицы при существен-            специфической смертности в пределах страты (‰ в год)
ном увеличении составляющих «наблюдений» по
Каплану ‒ Майеру и росте числа степеней свободы
по сравнению с ситуацией традиционной предвари-
тельной группировки с применением 5-летних воз-
растных интервалов (см. рис. 2). В расчете на один
случай из 1118 это приблизительно соответствует
визуально наблюдаемому среднеквадратическому
относительному уклонению оцененных показателей
hazard около 0, 40 1118  0,019  1,9 % . Остаточ-
ное уклонение  min не достигло точного нуля, что
указывает на неустранимую роль дискретной при-
роды записей в базе данных выборки в сравнении с
непрерывной природой показателей в истинной ге-
неральной совокупности. Однако вряд ли девиацию
можно снизить еще больше. Оценка коэффициента
дозового тренда избыточного кумулятивного пожиз-
                                                                Рис. 3. Заданные и оцененные по алгоритму
ненного показателя интенсивности накопления риска
                                                            биномиальной регрессии динамические зависимости
и его неопределенности по информационной матрице            показателя специфической смертности среди мужчин
Фишера составила 0, 49 Гр 1  95% ДИ : 0,24 ... 0,99                      «эталонной когорты»
для мужчин и 0,68 Гр 1  95% ДИ : 0,33 ...1,35  для
женщин. Следует обратить внимание на существен-
ную неопределенность, наблюдающуюся, несмотря
на чрезвычайно малую величину достигнутой де-
виации. Это обстоятельство связано с преимущест-
венной зависимостью размеров области неопреде-
ленности от кривизны функции (11) вблизи экстре-
мума, а не от достигнутого ею минимального
значения, поскольку оценка доверительных интер-
валов выполняется так, будто бы отсчеты в «эталон-
ной когорте» все же подвержены случайным флук-
туациям в той же мере, как если бы они были реаль-
ными. Этим биномиальная регрессия отличается от
регрессии по методу наименьших квадратов.
      В отличие от полученного результата, метод               Рис. 4. Заданные и оцененные по алгоритму
AMFIT в рамках своей типовой группы моделей                биномиальной регрессии динамические зависимости
[9, 10, 31–33] продемонстрировал значительное сис-         показателя специфической смертности среди женщин
тематическое смещение годовых показателей риска                            «эталонной когорты»
в области старших возрастов (рис. 5; субкогорта

ISSN (Print) 2308-1155 ISSN (Online) 2308-1163 ISSN (Eng-online) 2542-2308                                       25
В.Ф. Обеснюк

                                                          пов относительных трендов и, следовательно,
                                                          необходимость их различения отмечалась и другими
                                                          авторами [34]. Таким образом, AMFIT может иметь
                                                          склонность к переоценке эффектов облучения. В ряде
                                                          случаев использование годовых показателей может
                                                          также приводить и к недооценке реального (кумуля-
                                                          тивного) риска [31]. Потенциальная основа для это-
                                                          го хорошо видна на рис. 3 и 4.
                                                                Обсуждение преимуществ и недостатков ал-
                                                          горитма оценки рисков в неоднородной когорте.
                                                          Отметим главные обстоятельства, отличающие наш
                                                          рискометрический алгоритм от своих аналогов и,
                                                          прежде всего, от прототипа ‒ алгоритма AMFIT.
                                                          В первую очередь, в предложенном алгоритме все
 Рис. 5. Результат AMFIT-оценки дозовых и возрастных      отсчеты изучаемых специфических событий рас-
 трендов показателя специфического риска в сравнении      сматриваются в качестве процессов биномиальной
  с истинным его поведением для мужской субкогорты.       природы, а кумулятивные и интенсивные показате-
   На рисунке видно, что типовая модель [9, 10, 31–33]    ли определяются на вероятностной основе, а не в
  поведения фонового и исследуемого рисков является       качестве эвристических величин. Это позволяет рас-
  источником систематического смещения всех оценок        сматривать оценку рисков в качестве инструмен-
                                                          тальной процедуры косвенных измерений непре-
мужчин). Неплохо аппроксимируются только вос-             рывно-распределенных оценок параметров на осно-
ходящие участки кривых. Также модели алгоритма            ве байесовского подхода. В отличие от этого, и
оказались неспособными «разглядеть» в когорте             алгоритм AMFIT, и другие, реже применяемые ал-
возможности взаимопересечения группы кривых               горитмы [35–38] базируются на точечной оценке
hazard, связанной с некоторым сокращением про-            всей совокупности событий и идее гладкой аппрок-
должительности жизни облученных.                          симации получающихся негладких эмпирических
      Наблюдаемая минимальная девиация (форму-            распределений в рамках частотно-дискретной стати-
ла (11)) для найденного экстремального решения            стической парадигмы Пирсона и Фишера.
составила 24,3 единицы при числе степеней свободы               Отмеченные альтернативные подходы к оценке
85 (число страт за вычетом числа параметров). При         рисков вместе с математической простотой в срав-
таком числе степеней свободы 90%-ная область              нении с оценками процессов приобретают очевид-
ожидаемого случайного попадания минимальной               ные, но игнорируемые недостатки. Например, ин-
девиации, казалось бы [26], распределенной по «за-        тенсивный показатель риска в реальности не являет-
кону хи-квадрат», должна составлять 64,7…107,5.           ся ни константой, ни набором констант, как это
Таким образом, наблюдаемое значение 24,3 стати-           предписывалось бы пуассоновской статистикой. По
стически значимо меньше типичного случайного.             этой причине не ясна роль погрешности, связанной
Наблюдаемый оверфиттинг практически однозначно            со стратификацией неоднородной когорты по воз-
указывает на искусственность «эталонной когорты».         расту. Слишком малые возрастные интервалы могут
Однако вызывает удивление заметное отклонение             приводить к исчезновению случаев в них для когорт
 min от нуля, очевидно связанное с абсурдным сис-        малого объема, при которых функционал пуассо-
тематическим смещением h  t D, sex, β  в области        новской регрессии может терять экстремальные
                                                          свойства. Слишком большие интервалы, напротив,
возрастов более 75 лет и даже более 100 лет для всех      будут приводить к необоснованному усреднению
дозовых воздействий. Фактически достигнутый уро-          интенсивностей накопления риска в пределах ин-
вень значимости p ~ 10-11 формально указывает на          тервала. Заранее назначить оптимальную ширину
крайне малую вероятность уклонения модели от              интервалов при стратификации по возрасту в этом
данных, что, однако, соответствует реальной карти-        случае затруднительно. Аналогичный недостаток
не только в области быстрого роста интенсивности          пуассоновской регрессии проявляется по мере вы-
риска (см. рис. 5), но не в широком диапазоне воз-        мирания когорты, когда число новых специфиче-
растов. Поскольку смещению подверглись все кри-           ских случаев устремляется к нулю. На какой грани-
вые показателей годового риска, то смещенными             це возрастного распределения следует остановить-
оказались и дозовые тренды. Например, годовой             ся? Более адекватен был бы биномиальный закон
показатель h  t D, sex, β  в возрасте 60 лет для муж-   распределения событий, из которого закон Пуассона
чин смещался с темпом изменения дозы                      вытекает асимптотически как частная статистиче-
 82 % на 1 Зв , что почти вдвое превышает показа-        ская модель редких событий.
                                                                Отметим также, что качество аппроксимации
тель дозового тренда для кумулятивной пожизнен-
ной величины, определенной предыдущим алгорит-            h  t D, sex, β  для описания радиационного воздей-
мом при тех же условиях. Несоответствие двух ти-          ствия зависит от того, насколько хорошо работает

26                                                                         Анализ риска здоровью. 2021. № 2
Групповые показатели риска здоровью в неоднородной когорте. Косвенная оценка по динамике событий

эта функция в случае отсутствия внешнего воздей-        ключительно в форме простых одномерных зависи-
ствия ( D  0 ). Речь идет о той самой группе сравне-   мостей на плоском двухкоординатном графике.
ния, на которой держится любое сравнительное ис-        Действительно, упрощающая концепция «доза –
следование. Часто на этот нюанс исследователи           риск» способна порождать необъяснимые артефак-
внимания не обращают [32, 33], полагаясь на про-        ты в виде ложных трендов. Наглядным примером
стые модели степеннóго роста или модели с насы-         является толкование радиационно-онкологического
щением. Формально это означает, что фоновый по-         тренда, график которого нами заимствован из доку-
жизненный кумулятивный показатель интенсивно-           мента [43].
сти может достигать очень больших значений или
обращаться в бесконечность, а сам специфический
риск гибели от изучаемой причины достигнет еди-
ницы. Однако на самом деле таких болезней не
существует, и это видно уже на этапе предвари-
тельного группирования данных (рис. 2). Учет
такой информации в моделях динамики интенсив-
ных показателей риска уже с успехом применялся
в байесовских исследованиях на ограниченных вы-
борках с неполным периодом наблюдения и потеря-
ми данных, например, по методикам right censored
spell models [39], cure rate models [40], bounded cu-
mulative hazard models [41]. Более того, есть основа-
ния полагать, что смещение оценок на рис. 5 пре-
имущественно связано именно с неудачной моделью
                                                        Рис. 6. Схематичное поведение избыточного показателя
фонового риска, а не только с игнорированием при-
                                                        риска в зависимости от дозы радиационного воздействия
роды процесса и ошибкой в выборе статистического          по ожиданиям экспертов BEIR VII. Воспроизведено
закона. Заметим, что такой показатель, как p-value,                         по отчету [43]
определяемый в результате применения теста отно-
шения правдоподобий, в многомерном случае не                  На нем со всей очевидностью представлен не-
всегда может быть надежным ориентиром при оцен-         линейный отклик избыточной интенсивности спе-
ке качества аппроксимации.                              цифических событий с явно немонотонным спадом
      Все сказанное не означает, что вновь предла-      в области больших доз. Такой тренд невозможно
гаемый метод оценки рисков является идеальным           убедительно объяснить ни в рамках широко извест-
инструментом исследователя. Напомним, что он            ной линейной беспороговой модели, ни в рамках
базируется на принципе такой стратификации ко-          обоснованных нелинейных моделей. Однако обра-
горты, которая не предусматривает переход членов        тим внимание на то, что, оперируя понятием «ин-
когорты из страты в страту в период наблюдения.         тенсивность» вместо понятия «риск», график можно
Если бы такой переход происходил, страты нельзя         связать только с одной возрастной группой членов
было бы считать независимыми единицами, а значит        когорты. Тогда легко обнаружить, что в диапазоне
функционал вероятностной оценки должен строить-         возрастов от 60 до 65 лет на рис. 3 и 4 дозовый
ся на иных основаниях. Уязвимым местом может            тренд имеет именно такой вид с характерным спа-
быть также неполнота покрытия факторного про-           дом и даже возможной сменой знака «избыточного»
странства имеющимися наблюдениями, свойствен-           эффекта в еще более старших возрастных группах.
ная любой эмпирической выборке. Стандарты               При этом кумулятивный показатель риска вместе
CONSORT [42] распространяются на любые выбо-            с ростом кумулятивной дозы только монотонно рас-
рочные исследования. Если хотя бы одна пара фак-        тет. Здесь же уместно напомнить, что известная ли-
торов сильно коррелирует, действие одного из фак-       нейно-беспороговая модель «доза – эффект»
торов может быть замаскировано кажущимся дейст-         Н.В. Тимофеева-Рессовского и К.Г. Циммера [44, 45]
вием другого. По этой причине для обеспечения           формулировалась именно для пары кумулятивных
успешного оценивания процессов либо когорты             показателей, одним из которых был аналог показа-
должны быть достаточно велики и разнообразны,           теля Нельсона – Аалена задолго до изобретения по-
либо исследование связей риска с факторами долж-        следнего. Близкой точки зрения на область приме-
но иметь характер контролируемого эксперимента.         нения кумулятивных показателей придерживался
      Важно отметить, что данная статья не продви-      также автор широко известной концепции «эффек-
гает никакой теории в области аналитической эпи-        тивной дозы» [46].
демиологии. В ней предлагается всего лишь инст-               Выводы. Таким образом, анализ динамики
румент практического анализа в рамках ментальной        наступления специфических событий в неодно-
схемы «доза – время – риск» вместо традиционного        родной когорте в сочетании с байесовской мето-
ограниченного подхода «доза – риск», навязываю-         дологией оценки рисков имеет определенную
щего толкование вреда от внешних воздействий ис-        перспективу применения, если исследователи об-

ISSN (Print) 2308-1155 ISSN (Online) 2308-1163 ISSN (Eng-online) 2542-2308                                 27
В.Ф. Обеснюк

ладают детальной информацией о членах когорты в                         Вместе с тем нельзя не отметить повышенную
течение достаточно длительного или пожизненного                    трудоемкость использования описываемой парамет-
наблюдения и полным исчерпывающим описанием                        рической версии байесовских методов. Частично
индивидуальных факторов риска. Используемая                        преодолеть этот недостаток можно только путем
техника вычислений лежит в рамках общеприня-                       создания соответствующего программного обеспе-
тых эпидемиологических способов оценки вреда                       чения6, способного автоматизировать процедуры
здоровью, комбинируя применение годовых груп-                      группирования данных, выбора моделей, поиска
повых показателей риска вместе с кумулятивными.                    экстремальных решений, моделирования статисти-
Показано, что, занимаясь прогнозированием ущер-                    ческой неопределенности байесовских оценок.
ба от последствий внешнего воздействия на здоро-
вье людей в рамках привычных ментальных схем                             Финансирование. Создание методологии являлось ча-
«доза – эффект», следует отдавать предпочтение                     стью исследований, финансируемых Федеральным медико-
сочетанию кумулятивных доз и кумулятивных по-                      биологическим агентством (гриф «Последствия-2020»).
казателей риска или их дескриптивным аналогам                            Конфликт интересов. Автор данной статьи заявля-
(эффектам).                                                        ет об отсутствии конфликта интересов.

                                                     Список литературы
       1. Анализ риска здоровью в стратегии государственного социально-экономического развития: монография /
Г.Г. Онищенко, Н.В. Зайцева, И.В. Май [и др.] / под ред. Г.Г.Онищенко, Н.В.Зайцевой. – М.; Пермь: Издательство
Пермского национального исследовательского университета, 2014. – 738 с.
       2. Commonwealth of Australia, 2012. Environmental Health Risk Assessment. Guideline for assessing human health risk
from environmental hazards: Glossary. ‒ Commonwealth of Australia, 2012. – 244 p.
       3. Публикация 103 Международной Комиссии по радиационной защите (МКРЗ) / под ред. М.Ф. Киселева,
Н.К. Шандалы. – М.: ООО ПКФ «Алана», 2009. – 344 с.
       4. Злокачественные новообразования в России в 2018 году (заболеваемость и смертность) / под ред. А.Д. Каприна,
В.В. Старинского, Г.В. Петровой. – М.: МНИОИ им. П.А. Герцена, 2019. – 250 с.
       5. Ahrens W., Pigeot I. Handbook of epidemiology. – Switzerland: Springer, 2005. – 1617 p. DOI: 10.1007/978-3-540-26577-1
       6. Newman J.R. Mathematics of a lady tasting tea by Sir Ronald Fisher // The World of mathematics. – Vol. III, Part VIII. ‒
New-York: Simon and Schuster, 1956. – P. 1514‒1521.
       7. Vaupel J.W., Manton K.G., Stallard E. The Impact of Heterogeneity in Individual Frailty on the Dynamics of Mortality //
Demography. – 1979. ‒ Vol. 16, № 3. – P. 439. DOI: 10.2307/2061224
       8. Михальский А.И., Петровский А.М., Яшин А.И. Теория оценивания неоднородных популяций. – М.: Наука,
1989. – 128 с.
       9. Technical Report No. 1-86. Life span study report 10. Part 1. Cancer mortality among A-bomb survivors in Hiroshima
and Nagasaki, 1950-82 / D.L. Preston, H. Kato, K.J. Kopecky, S. Fujita // RERF. ‒ 1987. ‒ № 111. ‒ P. 151‒178.
       10. Solid cancer incidence in atomic bomb survivors exposed in utero or as young children / D.L. Preston, H. Cullings,
A. Suyama, S. Funamoto, N. Nishi, M. Soda, K. Mabuchi, K. Kodama [et al.] // Journal of the National Cancer Institute. ‒
2008. ‒ Vol. 100, № 6. – P. 428–436. DOI: 10.1093/jnci/djn045
       11. Epicure. The premiere software for risk regression and person-year tabulation [Электронный ресурс] // EPICURE
Risk Sciences International. – URL: https: //risksciences.com/epicure/ (дата обращения: 21.04.2021).
       12. Гаусс К.Ф. Избранные геодезические сочинения / под ред. Г.В. Багратуни, С.Г. Судакова. ‒ М: ИГЛ, 1957. ‒
Т. 1. ‒ 153 c.
       13. Vaeth M., Pearce D. Calculating excess lifetime risk in relative risk models // Environmental Health Perspectives. ‒
1990. ‒ Vol. 87. – P. 83–94. DOI: 10.1289/ehp.908783
       14. Definition and estimation of lifetime detriment from radiation exposures: principles and methods / D. Thomas,
S. Darby, F. Fagnani, P. Hubert, M. Vaeth, K. Weiss // Health Physics. ‒ 1992. ‒ Vol. 63, № 3. – P. 259–272. DOI:
10.1097/00004032-199209000-00001
       15. Lifetime radiation risk of stochastic effects – prospective evaluation for space flight or medicine / A. Ulanowski,
J.C. Kaiser, U. Schneider, L. Walsh // Ann. ICRP. ‒ 2020. ‒ Vol. 49, № 1. ‒ P. 200‒212. DOI: 10.1177/0146645320956517
       16. On prognostic estimates of radiation risk in medicine and radiation protection / A. Ulanowski, J.C. Kaiser, U. Schnei-
der, L. Walsh // Radiat. Environ. Biophys. ‒ 2019. ‒ Vol. 58, № 3. ‒ P. 305‒319. DOI: 10.1007/s00411-019-00794-1
       17. Esteve J., Benhamou E., Raymond L. Statistical methods in cancer research. Descriptive epidemiology // IARC Scien-
tific Publication. ‒ 1994. ‒ Vol. IV, № 128. ‒ P. 313.
       18. What is the lifetime risk of developing cancer?: the effect of adjusting for multiple primaries / P.D. Sasieni, J. Shel-
ton, N. Ormiston-Smith, C.S. Thomson, P.B. Silcocks // Br. J. Cancer. ‒ 2011. ‒ Vol. 105, № 3. ‒ P. 460–465. DOI:
10.1038/bjc.2011.250
       19. History of application of martingales in survival analysis / O. Aalen, P.K. Andersen, Ø. Borgan, R.D. Gill, N. Keiding //
Electronic Journal of History of Probability and Statistic. ‒ 2009. ‒ Vol. 5, № 1. ‒ P. 1‒28.

      __________________________
     6
       Обеснюк В.Ф. Программа, управляющая многофакторной оценкой групповых рисков здоровью по индивиду-
альным записям регистра длительных наблюдений / зарегистрировано в БД РосПатента 23.12.2020; свид-во 2020667423.

28                                                                                       Анализ риска здоровью. 2021. № 2
Вы также можете почитать