Gini coefficient as a life table function: computation from discrete data
←
→
Транскрипция содержимого страницы
Если ваш браузер не отображает страницу правильно, пожалуйста, читайте содержимое страницы ниже
Реферат выполнен Евгением Андреевым Краткое содержание статьи Gini coefficient as a life table function: computation from discrete data, decomposition of differences and empirical examples. by Vladimir M. Shkolnikov, Evgeny M. Andreev and Alexander Z. Begun Demographic Research, 2003. 8:11, pp. 305-358 Коэффициент Джини как функция таблиц смертности: расчет на основе дис- кретных данных, декомпозиция различий и эмпирические примеры В настоящее время ожидаемая продолжительность жизни во многих странах весьма высока, и интересно узнать в какой степени это достижение равнодоступно для всех лю- дей. По этой причине меры неоднородности популяции по продолжительности жизни привлекают растущее внимание. Коэффициент Джини – наиболее распространенный ста- тистический индекс неоднородности или неравенства в общественных науках. Он широко используется как мера экономического неравенства между индивидуумами или домохо- зяйствами. Точно также коэффициент Джини может быть использован в качестве меры неравенства по продолжительности жизни, т.е. меры неоднородности популяции по воз- расту в смерти. Коэффициент Джини уже применялся в исследованиях как для измерения масшта- ба различий в средней продолжительности жизни между социальными группами, так и для измерения межиндивидуальных различий в возрасте смерти. Данная статья предлагает набор инструментов для измерения и анализа межиндивидуального неравенства в про- должительности жизни с помощью коэффициента Джини, который рассматривается как еще одна, дополнительная функция таблицы смертности. Существует много подходов к расчету коэффициента Джини. Наиболее популяр- ный среди экономистов метод основан на использовании кривой Лоренца. Кендалл и Стюарт [Kendall, Stuart, 1966] дали самое простое для понимания определение, согласно которому Джини коэффициент равен отношению средней межиндивидуальной разницы в возрасте смерти к величине средней ожидаемой продолжительности жизни. В терминах полной таблицы смертности, это определение соответствует формуле: 1 G0 2 2(l0 ) e0 d x 0 y 0 x dy x y , где x, y - возраст смерти, - максимальная длительность жизни в популяции, d x , d y - числа умирающих в условном поколении таблицы смертности в возрастном интер- вале x, x 1 и y, y 1 , соответственно, из начальной совокупности новорожденных l0 (корня таблицы), x, y - средние возраста смерти в этих интервалах и e0 - ожидаемая продолжительность жизни при рождении. G0 – безразмерный показатель относительного неравенства. Если убрать деление на е0, то получится показатель абсолютного неравенства, которые измеряется в годах жизни и может быть назван «средняя межиндивидуальная разница по продолжительности жизни» AID. Однако с точки зрения простоты вычислений и использования тех же подходов, что и при расчете других показателей таблиц смертности, предпочтение может быть отдано формуле Ханада [Hanada, 1983]: 1
1 2 G0 1 [l ( x )]2 dx , e(0) [l (0)] 0 где l (x ) – функция дожития. Эта формула очевидно аналогична основной формуле для расчета ожидаемой продолжительности жизни при рождении: 1 e0 l ( x )dx . l (0) 0 Коэффициент Джини далеко не единственная возможная мера неравенства. Среди возможных индексов неравенства отметим такие, как расстояние между первым и третьим квартилем распределения по возрасту смерти IQR, дисперсия VAR и стандартное отклоне- ние STD этого распределения, дисперсия логарифма длительности жизни VarLog, индекс энтропии распределения (индекс Тейла) T. Поэтому были выработаны критерии позво- ляющие оценивать предпочтительность того или иного индекса. Так Ананд [Anand, 1983] сформулировал следующие основные свойства, которые желательны для любого индекса неравенства по уровню дохода: (а) независимость от чис- ленности, индекс не изменится, если общее количество людей изменяется без изменения в пропорциях личных доходов; (б) независимость от шкалы, индекс не изменяется, если все доходы изменяются пропорционально на одну и ту же величину; (в) условие Pigou-Dalton: любая передача части дохода от более богатого более бедному индивиду, которая не ме- няет их местами по уровню богатства, уменьшает величину индекса неравенства. Среди 6 рассмотренных в статье индексов неравенства, которые могли бы быть применены для измерения неравенства по продолжительности жизни, лишь два: коэффициент Джини и индекс энтропии T – удовлетворяют все трем условиям, но в отличие от индекса энтропии, восходящего к теории информации, G0 имеет достаточно простую интерпретацию. В слу- чае смертности мужчин в США между 1950 и 1997 гг. тренды всех 6 рассмотренных ин- дексов в основном совпадают, но в примере для мужчин России (1959-2000) единообразие динамики нарушается. Динамика индексов, повышенно чувствительных к уровню мла- денческой смертности, которая почти непрерывно снижалась в России, отлична от дина- мики тех, кто сильнее реагирует на смертность взрослых в динамике которой чередова- лись периоды снижения и роста. Далее в статье детально рассматривается алгоритм расчета G0 , с учетом выявлен- ной аналогии с e0 , в случае полных и кратких таблиц смертности. При расчете e0 по дис- кретным данным главный вопрос связан с определением для умершего в некотором ин- тервале возраста [ x, x n) числа лет, прожитых им в этом интервале. Эта длительность ха- рактеризуется с помощью величины Ax - средняя доля возрастного интервала, прожитая людьми, которые умирают в пределах данного интервала. Если ряд Ax определен, то инте- грал для расчета e0 заменяется суммой, которая в случае полной таблицы выглядит сле- дующим образом e0 l x 1 Ax (l x l x 1 ) . Для расчета интеграла от квадрата функции x дожития [l ( x )]2 вводится величина Âx , которая близка, но не тождественна Ax . Значимые различия между этими двумя величинами существуют для возраста до 1 года, в случае кратких таблиц смертности, для открытого последнего возрастного интервала 85 +. Пред- ложенные приближенные расчетные формулы были успешно протестированы на основе 334 таблиц смертности для Японии, Франции, Швеции и США, почерпнутых из Berkeley Mortality Database. Развивая дальше аналогию между методами расчета e0 и G0 , удается найти фор- мулы декомпозиции различия двух коэффициентов Джини по возрастам или по возрастам и причинам смерти. Использован дискретный метод декомпозиции, получивший название 2
метода "пошаговой замены" ("stepwise replacement")1. Первоначально метод был применен к разложению различий в продолжительности жизни при рождении, где привел к извест- ной формуле декомпозиции. Затем этот же алгоритм был применен к декомпозиции раз- личий двух коэффициентов Джини, где дал принципиально новые формулы. Рассмотрены примеры использования методов декомпозиции, которые не только иллюстрируют применение полученных формул, но и несут новую информацию. Так в США в 1900-1995 годах продолжительность жизни росла, а коэффициент Джини снижал- ся. Изменение смертности во всех возрастных группах благоприятно влияло на рост про- должительности жизни, но особенно сильным было влияние смертности в возрастах 0-14 лет, снижение которой обусловило около 55% роста продолжительности жизни и мужчин и женщин. Одновременно это снижение обусловило более 70% снижения коэффициента Джини. Снижение смертности в старшей возрастной группе 65+ увеличило продолжи- тельность жизни на 2,4 лет (более 9% общего роста), но привело к увеличению неравенст- ва на величину равную примерно 5% изменения коэффициента Джини. В качестве примера применения декомпозиции по возрасту и причинам смерти, проведено сравнение смертности мужчин в США и Великобритании в 1997 г. Продолжи- тельности жизни мужчин очень близки - различие немного более 1 года в пользу Велико- британии (или 1.4 % от e(0) ). Однако, коэффициента Джини в США был на 16%, чем Ве- ликобритании, что говорит об имеющемся в США существенном неравенстве по длитель- ности жизни2. Рисунок 1 показывает компоненты различий между США и Великобрита- нией. e(0) G(0)*100 85+ 85+ 75-79 75-79 65-69 65-69 США 1997 12.02 Великобритания 1997 10.18 55-59 55-59 Разница 1.85 США 1997 73.60 Великобритания 45-49 45-49 1997 74.71 Разница -1.12 35-39 35-39 25-29 25-29 15-19 15-19 5-9 5-9 0 0 -0,20 -0,10 0,00 0,10 0,20 0,30 -0,10 0,00 0,10 0,20 Инфекционные заболевания Рак Сердечно-сосудистые заболевания Респираторные заболевания Болезни органов пищеварения Внешние причины Рисунок 1. Декомпозиция различий в ожидаемой продолжительности жизни и в Коэффициенте Джини между Великобританией и США к возрасту и причине смер- ти: мужчины, 1997. 1 Подробно метод пошаговой замены изложен в статье [Andreev, Shkolnikov, Begun, 2002] также представ- ленной в данной серии рефератов. 2 В 2011 г. была опубликована статья, специально посвященная неоднородности смертности в США: Shkolnikov V. M. , Andreev E. M. , Zhang Z., Oeppen J., Vaupel, J. W. Losses of expected lifetime in the United States and other developed countries: methods and empirical analyses Demography, 48:1, pp. 211-239, которая также представлена в данной серии рефератов. 3
Преимущество Великобритании в продолжительности жизни мужчин связано главным образом с внешними причинами смерти в возрастах от 15 до 50 лет и несколько более низкой смертностью от болезней системы кровообращения и рака в возрастах от 40 до 59 лет. Однако, это преимущество почти уравновешено более низкой смертностью в США в возрастах 65 лет и старше от болезней системы кровообращения, респираторных заболеваний и рака. Вместе с тем, с точки зрения различий в коэффициенте Джини, роль повышенной смертности от внешних причин смерти в молодых возрастах существенно выше. Кроме того, и более низкая смертность в старости увеличивает уровень коэффици- ента Джини в США по сравнению с Великобританией. В статье также рассмотрена возможность оценки вклада в различия между двумя величинами e(0) и между двумя величинами G(0) в зависимости не только от возраста, но и от социальной структуры населения. Заключительная часть статьи посвящена анализу изменениям продолжительности жизни и коэффициента Джини во времени и пространстве. На рисунке 2 представлено соотношение между продолжительностью жизни для мужчин и женщин и коэффициентом Джини в 1996-99 гг. в 31 стране с продолжительно- стью жизни мужчин 70 лет или выше. Отчетливо видно, что с ростом продолжительности жизни коэффициент Джини убывает. Коэффициент корреляции для мужчин равен -0,69 и для женщин -0,58. Мужчины 13 Чили r = - 0.691 Македония США Сингапур 12 Коста-Рика Франция Чехия Новая Зеландия Шотландия Греция 11 G(0)*100 Гонконг Ирландия Англия и Уэльс Япония 10 Нидерланды Исландия Швеция 9 8 70 72,5 75 77,5 80 82,5 85 e(0) 4
Женщины 13 r = - 0.581 12 11 G(0)*100 Македония Куба Сингапур США Чили 10 Новая Зеландия Коста-Рика Англия и Уэльс Канада Гонконг 9 Чехия Португалия Япония Финляндия Швеция Греция Испания 8 70 72,5 75 77,5 80 82,5 85 e(0) Рисунок 2. Соотношение между продолжительностью жизни и коэффициентом Джини для мужчин и женщин в 1996-99 гг. для 31 страны с продолжительностью жизни мужчин 70 лет и выше Траектории в координатах e(0) и G(0) 100 для мужчин Великобритании, Испании, России, США и Японии в 1950-99 гг. представлены на рисунке 3. Траектории всех стран, кроме России, отражают устойчивый рост продолжительности жизни и уменьшение нера- венства в длительности жизни. В 1950-е годы Великобритания и США опережали другие страны, но в конце периода лидером становится Япония. В конце 1980-х – начале 1990-х в Испании и США отмечалось прекращение снижение коэффициента Джини, но позже оно восстановилось. Россия выпадает из общего ряда. После впечатляющих успехов 1950-х, с середины 1960-х смертность мужчин увеличивалась. Последующие хаотические колеба- ния соответствуют быстрому росту продолжительности жизни в годы антиалкогольной кампании и ее стремительному падению в первой половине 1990-х. 5
27 Япония 26 25 Россия 24 Испания 23 Постепенное увеличение 22 смертности в России в США 1965-1984 21 Великобритания 20 19 G(0)*100 18 17 Замедление снижения G(0) в США в 1985-92 16 15 Замедление снижения G(0) в Испании в 1985-93 14 13 Быстрые колебания 12 смертности в России в 1985-1999 11 10 9 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 e(0), годы Рисунок 3. Траектории в координатах e(0) и G(0) 100 для мужчин Японии, России, Испании, США, и Великобритании в 1950-99 гг. Рисунок 4 представляет крупным планом динамику продолжительности жизни и коэффициента Джини мужчин и женщин в США в 1980-1996 гг. Ожидаемая продолжи- тельность жизни мужчин увеличивалась в этот период непрерывно, в то время как коэф- фициент Джини не снижался между 1983 и 1990 годом. Если исключить влияние младен- ческой смертности и рассмотреть показатели для возраста 15 лет, то ситуация становится яснее: продолжительность жизни в 15 лет увеличивается, в то время как коэффициент Джини между 1983 и 1994 г. также увеличивается. В отличие от мужчин, для женщин си- туация кажется нормальной: и для новорожденных и в возрасте 15 лет продолжительность жизни увеличивается и коэффициент Джини снижается. Применив метод декомпозиции можно доказать, что рост коэффициента Джини связан с ростом смертности мужчин в возрастах от 15 до 44 лет, главным образом из-за СПИДа и внешних причин в возрастах 15-29 лет. На рост коэффициента повлияло также уменьшение в смертности в самых старших возрастах. 6
72,5 13,7 79,4 11,2 Мужчины Женщины 13,6 79,2 11,1 72,0 13,5 79,0 11,0 13,4 e(0) 78,8 71,5 10,9 13,3 e(0) 78,6 13,2 10,8 G(0) G(0) e(0) e(0) 71,0 78,4 13,1 10,7 G(0) 78,2 13,0 G(0) 70,5 10,6 78,0 12,9 77,8 10,5 70,0 12,8 12,7 77,6 10,4 69,5 12,6 77,4 10,3 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 Годы Годы 58,5 15,1 65,2 12,1 Мужчины Женщины 65,0 12,1 15,0 58,0 12,0 64,8 14,9 e(15) e(15) 12,0 64,6 57,5 14,8 11,9 G(15) G(15) e(15) e(15) G(15) 64,4 14,7 11,9 57,0 64,2 G(15) 11,8 14,6 64,0 56,5 11,8 14,5 63,8 11,7 56,0 14,4 63,6 11,7 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 Годы Годы Рисунок 4. Тенденции в продолжительности жизни и коэффициента Джини в возрастах 0 и 15 лет для мужчин и женщин в США в 1980-95 гг. Главные выводы статьи – по своим математическим свойствам коэффициент Джи- ни лучше других известных показателей соответствует базовым требованиям, предъяв- ляемым к мерам неравенства. Динамика этих показателей в США и России с 1950-х пока- зывает, что выбор меры неравенства может влиять на принципиальную оценку изменений. Коэффициент Джини, в отличие от некоторых других мер, не чрезмерно чувствителен к изменениям в детской смертности и соразмерно реагирует на изменения в смертности взрослых. Огромный массив вычислений свидетельствует об эффективности предложен- ного инструментария для расчета коэффициента Джини на основе показателей таблиц смертности и для декомпозиции различий двух коэффициентов по возрастам и причинам смерти. Эмпирические примеры показывают, что, не смотря на тесную связь коэффициента Джини с продолжительностью жизни, некоторые изменения в смертности (например, рост смертности в молодых возрастах или снижение смертности в самых старших) могут раз- нонаправленно влиять на эти показатели. References Anand, S. 1983. Inequality and Poverty in Malaysia: Measurement and Decomposition. New York: Oxford University Press. Andreev, E.M., Shkolnikov, V.M. and Begun, A.Z. 2002. Algorithm for decomposition of differences between aggregate demographic measures and its application to life expectancies, healthy life expectancies, parity-progression ratios and total fertility rates. Demographic Re- search, 7:14, pp. 499-522 7
Kendall, M.G., Stuart, A. 1966. The Advanced Theory of Statistics. London: Charles Griffin. Hanada, Kyo. 1983. A formula of Gini's concentration ratio and its application to life ta- bles. Journal of Japan Statistical Society, 13: 95-98. 8
Вы также можете почитать