Оригинальная статья
http://www.ajog.org/article/S0002-9378(10)00671-X/fulltextОпровержение кривой статистики.
http://www.midwiferytoday.com/articles/ajog_response.aspРожать дома в три раза опаснееКРИТИЧЕСКИЙ АНАЛИЗ ИССЛЕДОВАНИЯ СТАТИСТИКИ ДОМАШНИХ РОДОВ
Критика мета-анализа, проведенного исследователем J.Wax и его командой, согласно которому риск неонатальной смерти среди детей без генетических аномалий утраивается при запланированных домашних родах.
Авторы:
Gill Gyte, тренер по методологии исследований, National Childbirth Trust
Mary Newburn, глава отдела исследований и информации, National Childbirth Trust
Alison Macfarlane, профессор в вопросах перинатального здоровья, отдел акушерства и детского здоровья, Городской университет Лондона (City University London)
Краткое содержание.
Как и в предыдущих исследованиях на эту тему, в своем исследовании Wax и его команда не выявили различий в безопасности запланированных домашних и больничных родов для женщин без предварительно известных факторов риска, используя показатели уровня перинатальной смертности, обычный критерий определения безопасности. Однако, они обнаружили, что запланированные домашние роды ведут к двукратному увеличению риска того, что они назвали неонатальной смертностью, для детей без генетических аномалий этот риск увеличивался троекратно.
Действительно ли мета-анализ J.Wax (2010) является свидетельством того, что для «неаномальных» детей в ситуации запланированных домашних родов риск неонатальной смерти возрастает в три раза?
Эксперты National Childbirth Trust выявили некоторые серьезные методологические ограничения этого исследования, такие как:
* Недостаточная информация о том, как авторы оценивали качество отобранных первичных исследований и о причинах включения или невключения в анализ того или иного исследования.
* Отсутствие информации о включенных исследованиях и о тех данных, которые каждое из них внесло в полученные результаты. Перепроверка первичных исследований привела к выделению других чисел (следовало бы включить в работу график вида «forest plot» – изображение результатов индивидуальных исследований в мета-анализе в виде диаграммы, состоящей из серии горизонтальных отрезков, отображающих оцененные в этих исследованиях доверительные интервалы исследуемой величины).
* Отсутствие четкости и последовательности в определении неонатальной смертности в каждом из включенных исследований, и информации о том, включались ли в него мертворожденные.
* Небольшой размер субгруппы, данные по которой вносили вклад в вычисление сравнительного риска неонатальной смертности для запланированных домашних и больничных родов. Предполагается, что для того, чтобы избежать систематической ошибки, связанной с недостаточным количеством данных, нужно, чтобы в исследовании было 200-400 случаев неблагоприятного исхода, вероятность которого пытаются определить. В данном анализе сообщалось о всего лишь 64 неонатальных смертях вообще, и о 37 – уникальных случаях.
* В некоторых из нерандомизированных исследований не было учтено действие побочных факторов риска, впоследствии данные не корректировались, и в некоторые исследования были включены женщины, находящиеся в группе повышенного риска осложнений.
Учитывая эти ограничения, совершенно неоправданным выглядит утверждение о том, что «меньшее количество медицинских вмешательств в ходе запланированных домашних родов приводит к утроению уровня неонатальной смертности». Учитывая качество информации, которой располагали авторы, они не должны были делать таких выводов. Более того, редакторы «Американского журнала акушерства и гинекологии» не должны были принимать в печать этот материал без значительной доработки.
Преподнесение информации.
В своем пресс-релизе «Американский журнал акушерства и гинекологии» обращает особое внимание на то, что исследование включает «данные о 342 056 запланированных домашних родов и 207 551 запланированных родов в больнице». Однако, только для приблизительно 5% от этого числа родов измеряли показатель неонатальной смертности (всего 16500 запланированных домашних родов и 15633 «неаномальных» домашних родов).
Мы предполагаем, что прилагательное «неаномальный» относится к детям без генетических отклонений. Причина, по которой только для 15633 родов из мета-анализа J.Wax был измерен уровень неонатальной смертности, в том, что большинство исследований не использовали этот показатель как критерий безопасности. В большей части исследований использовался более обычный, более релевантный критерий, уровень перинатальной смертности, который помимо ранней неонатальной смертности учитывает и рождение мертворожденных детей.
Уровень перинатальной смертности был определен J.Wax для более чем 330 000 запланированных домашних родов. По этому показателю безопасности нет разницы между группой запланированных домашних родов и запланированных родов в больнице.
Критическая оценка методологии.
Gill Gyte проверила и критически оценила мета-анализ J.Wax, исследующий вопрос безопасности домашних родов, а также занялась изучением входящих в него первичных исследований и смертей, о которых в них сообщалось.
Mary Newburn проверила часть работ. Alison Macfarlane провела экспертную оценку смертей, о которых сообщалось в критическом анализе.
В мета-анализе выявлено несколько методологических недоработок:
1. Критерии для включения исследований в мета-анализ, которыми пользовались авторы, были следующими: «исследования из развитых западных стран, опубликованные в англоязычной литературе, подвергаемой экспертной оценке, исход родов для матери и ребенка рассмотрен с точки зрения запланированного места родов, информация была предоставлена в таблице 2х2. Качество рукописей было оценено с помощью опубликованного инструмента (Zaza 2000)». Авторы выявили 47 исследований, которые подвергли анализу, из них 12 были включены в итоговый мета-анализ. Однако, они не указали на исследования, которые были из него исключены, и не назвали причины для исключения каждого. В результате, мы не знаем, почему были исключены, например, следующие исследования: Johnson and Daviss (2007), Bastian (1996), NRPMSCG (1996). Причина исключения исследования – важная информация, которую должны предоставлять в любом хорошо проведенном систематическом обзоре или мета-анализе. Исследование из Соединенного Королевства (Chamberlain, 1996) не было включено из-за того, что оно не было опубликовано в критически обозреваемом журнале, но методология, использованная в нем, лучше, чем в некоторых исследованиях, которые были включены в мета-анализ.
2. J.Wax не указывают на то, какие из 12 включенных исследований стали источником данных для любых из исходов, указанных в таблице 3. Опять же, это показатель низкого качества работы.
3. Авторам следовало предоставить график типа «форест-плот» для основных исходов, которые они учитывали в подсчете перинатальной смертности (ПНС) и неонатальной смертности (ННС), чтобы читатели смогли увидеть специфику данных из каждого отдельного исследования. Вместо этого они посвятили несколько страниц объяснению своего мнения относительно различных аспектов затронутой темы.
4. J.Wax и его команда определили:
* «перинатальную смерть» как мертворожденного ребенка по-крайней мере 20 недель гестации или имеющего массу не менее 500 грамм, или смерть ребенка в течение первых 28 дней жизни,
* «неонатальную смерть» как смерть ребенка в течение первых 28 дней после родов.
Однако, не все из включенных исследований использовали такие же определения, а некоторые в принципе не давали определений перинатальной и неонатальной смерти. Обычно в таких случаях исследователи связываются с авторами, чтобы удостовериться в правильности всей информации, которую они включают в свой мета-анализ. J.Wax и его команда должны были, как минимум, объяснить читателям расхождения в определениях в использованных исследованиях.
5. Авторы утверждают, что данные по ННС получены из исследований 4, 7, 10, 13, 15 и 17 (эту информацию можно найти на третьей странице мета-анализа в левой колонке). Они пишут: «Важно то, что эти последние наблюдения были характерны для всех исследований, измеряющих неонатальную смертность, независимо от периода наблюдения (4, 7, 10, 13, 15, 17)». Здесь перечислены 6 исследований, в то время как в таблице 3 указаны 7 исследований, измеряющих ННС и 6 – ПНС. Тщательная перепроверка первичных исследований показала, что всего было 8 исследований, которые содержали данные по ПНС, и, с некоторым перекрытием и отличиями, 8 исследований, содержащих данные по ННС. Потерянные данные и отсутствие четких определений в некоторых материалах указывают на то, что необходима дальнейшая работа для того, чтобы точно знать, какое из исследований вносит вклад в какой показатель, и в каких из них учитывалось количество мертворожденных детей, а в каких – нет.
6. Проверяя данные из оригинальных исследований, мы получили числа, отличающиеся от указанных. Их нужно перепроверить с авторами первичных исследований для того, чтобы минимизировать любые неточности в кодировании информации. Мы обнаружили следующее: ПНС, за исключением случаев с генетическими аномалиями, должна включать в себя 367 смертей на 517 107 женщин, а ННС, исключая случаи с генетическими аномалиями, – 62 смерти на 62 047 женщин.
7. Важно обеспечить достаточное количество «событий» для того, чтобы исключить влияние систематических ошибок. Инструмент для оценки GRADE предполагает, что их количество должно быть в районе 200-400. Данные по ПНС соответствуют требованию учитывать более 300 «событий» для того, чтобы исключить влияние систематической ошибки, связанной с недостаточным количеством данных. Некоторые другие показатели, включая ННС, не соответствуют этому требованию.
8. Все исследования, измеряющие ПНС и ННС, были нерандомизированными, многие не учитывали действие побочных переменных (факторов риска) и не корректировали данные впоследствии. В одном исследовании в группу домашних родов были включены двойни, преждевременные роды и переношенная беременность, которых не было в группе запланированных больничных родов (Lindgren, 2008).
9. Самый большой вклад в мета-анализ по показателю ННС внесло исследование Pang (2002), в котором учтены 38 смертей новорожденных на 16 726 женщин, включая 19 смертей новорожденных без генетических аномалий на 16 726 женщин. Это исследование было ретроспективным и в нем использовались записи о домашних родах из ЗАГСов (birth registry). В силу того, что в этих записях домашними считаются роды, которые завершились дома, для термина «запланированные домашние роды» пришлось придумывать определение. Авторы определили их как «роды после одноплодной беременности, продолжавшейся минимум 34 недели, которые закончились дома, и на которых присутствовала акушерка, медицинская сестра или врач, помогающие в родах или указанные в свидетельстве о рождении». Кроме того, это «роды после одноплодной беременности, продолжавшейся минимум 34 недели, закончившиеся в больнице в результате госпитализации в случае, если в свидетельстве о рождении было указано, что изначально роды должен был принимать медицинский работник на дому». Представляется вероятным, что такое определение могло поспособствовать тому, что незапланированные домашние роды могли быть классифицированы как запланированные.
10. J.Wax и его команда не предоставляют информацию о качестве исследований, а это важный показатель, когда речь идет о нерандомизированных исследованиях. Они сообщают, что проводили оценку качества исследований и анализ сензитивности, но то, что они не сообщают ни о результатах оценки качества каждого первичного исследования, ни о результатах анализа сензитивности, можно отнести к недостаткам работы.
11. Авторы говорят о том, что они оценивали гетерогенность с помощью теста Breslow-Day, но ссылаются на него. Они заявляют, что данные по ННС, которыми они располагают, заслуживают доверия, так как не являются гетерогенными, но они не упоминают о том, что эти данные основаны на числах, слишком малых для того, чтобы быть уверенным в результатах, в то время как данные по ПНС, основанные на достаточно больших числах, не показывают различий (между группой запланированных домашних и больничных родов).
Выводы.
Данное исследование характеризуется некоторым количеством методологических ограничений. Среди них можно выделить следующие:
* Недостаточная информация о том, каким образом подбирали первичные исследования, о причинах включения или невключения каждого из исследований, и отсутствие оценки качества для каждого включенного исследования. Отсутствие информации о том, какие исследования вносили вклад в различные показатели, и какой вклад внесли данные из разных исследований в эти показатели. Перепроверка данных из первичных исследований привела к выделению других чисел (в работу следовало включить график типа «форест-плот»).
* Отсутствие однозначности в определении неонатальной смертности в каждом из исследований и того, были ли включены данные по мертворожденным.
* Небольшой размер субгруппы, внесшей вклад в просчет относительного риска неонатальной смерти для запланированных домашних и запланированных больничных родов. Предполагается, что для того, чтобы избежать систематической ошибки, связанной с недостаточным количеством данных, нужны 200-400 «событий» (GRADE, 2004), в то время как в исследовании J.Wax указаны только 64 неонатальные смерти, из которых только 37 – «уникальные случаи».
* В некоторых из включенных в анализ нерандомизированных исследований не было учтено действие побочных факторов риска, и впоследствии данные не корректировались.
Учитывая эти ограничения, совершенно неоправданным выглядит утверждение о том, что «меньшее количество медицинских вмешательств в ходе запланированных домашних родов приводит к утроению уровня неонатальной смертности». Учитывая качество информации, которой располагали авторы, они не должны были делать таких выводов, а редакторы «Американского журнала акушерства и гинекологии» не должны были принимать в печать этот материал в том виде, в котором он сейчас существует.
Дальнейшие действия.
Gill Gyte будет отправлять запросы:
* Janssen (2009) чтобы получить информацию. Они сообщили о том, что не было смертей между 8 и 28 днями жизни.
* Pang (2002) чтобы запросить определение неонатальной смерти, которое они использовали, и включали ли они данные по мертворожденным.
* De Jonge (2009) чтобы уточнить, учитывали ли они данные о неонатальных смертях между 7 и 28 днями жизни.
Материалы.
GRADE Working Group. Grading quality of evidence and strength of recommendations. BMJ 2004; 328: 1490-1494.
Muller PS et al. Ethical issues in stopping randomized trials early because of apparent benefit. Annals of Internal Medicine 2007;146(12):878-82.
Wax JR et al. Maternal and newborn outcomes in planned home birth vs planned hospital births: a metanalaysis. AJOG 2010;203:x.ex-x.ex.
Перевод: Надежда Павловская
Вывод. Исследование статистически безграмотное, подтассовка результатов.
Даже у поддерживающих исключительно безальтернативно роддомовское родовспоможение читала просьбы убедительно не использовать это исследование, как аргумент, потому как явное фуфло.
Но автор состоящий в группе ортодоксов от медицины наших одиозных киллеров видимо это не читал, выложил ее и вляпался в дисскусию, где ему популярно даже коллеги по группе пытались объяснить о явной кривоватости и подгонке, но товарищ не догнал, если до сих пор не убрал.