Medicine Review - Архів номерів - Клинические исследования. О «золотом стандарте» и проблеме «доказательного нигилизма»

Ликбез

Клинические исследования. О «золотом стандарте» и проблеме «доказательного нигилизма»

Уважаемые читатели!

Мы вводим новую рубрику – «Ликбез». Здесь будут публиковаться материалы, посвященные основам доказательной медицины, статистической обработки клинических и эпидемиологических данных, научного литературного поиска, использованию международных баз доказательных данных и другим вопросам. Без понимания всех этих нюансов современный врач не может адекватно оценить значимость тех или иных результатов клинических исследований, понять, на каком основании из этих результатов делаются определенные выводы и составляются практические рекомендации и стандарты. Кроме того, хотелось бы разрушить стереотип, существующий у многих отечественных врачей и касающийся того, что активное использование научной литературы для рутинной клинической практики необходимо преимущественно научным сотрудникам и преподавателям высшей медицинской школы. В развитых странах мира врачи учатся работать с научными базами данных еще в студенческие годы и на протяжении всей своей практической деятельности черпают там ответы на многие свои вопросы – как в крупных исследованиях, метаанализах, систематических обзорах, регистрах, так и в представленных клинических случаях их коллег со всего мира.

К сожалению, отечественные врачи зачастую все еще противопоставляют «доказательную медицину» и «вообще медицину», а медицинскую науку – практической медицине. Понимание основ статистики, необходимых как для проведения клинических исследований, так и для грамотной интерпретации их результатов, остается в удручающем состоянии. Исследования, обзоры, клинические случаи наших авторов не попадают в международные базы данных в связи с несоответствием общепринятым требованиям к научным публикациям и клиническим исследованиям (общим заблуждением является мнение о том, что отечественные статьи не принимаются Medline и другими базами данных преимущественно потому, что не переводятся на английский язык, однако в той же базе Medline можно встретить массу публикаций на немецком, французском, испанском, польском, китайском, японском и других языках мира, которые никогда не переводились на английский, но все же цитируются в качестве заслуживающих внимания источников научной информации).

В некоторых медицинских вузах и академиях последипломного образования Украины в последние годы вводятся курсы обучения основам доказательной медицины, хотя такой подход не кажется правильным, поскольку доказательная медицина должна быть не отдельно взятым предметом, а стержнем, интегральной составляющей обычных клинических дисциплин. И если у молодых врачей некоторые представления о современных принципах организации и систематизации медицинских научных знаний уже имеются, то врачи старшего поколения должны многому учиться и переучиваться. Ряд вопросов доказательной медицины большинству врачей известен только в общих чертах – просто потому, что они постоянно «на слуху», хотя было бы полезным разобраться в них подробнее и на конкретных примерах, чтобы более осознанно использовать различные аргументы и следующие из них клинически значимые выводы.

Не претендуя на всеохватность этой обширной и сложной темы, мы попытаемся регулярно публиковать короткие полезные материалы, касающиеся данных проблем. Мы не хотели бы обидеть наших врачей намеком на их неосведомленность в элементарных вещах – вероятно, очень многим нашим читателям ряд вопросов, которые мы будем рассматривать в рубрике «Ликбез», покажутся общеизвестными и не заслуживающими принципиального внимания. Поэтому для нас очень важна в этом отношении обратная связь. Пишите нам о том, насколько необходимыми, полезными и информативными для вас являются подобного рода материалы, – мы учтем все ваши пожелания и замечания.

С уважением,
главный редактор журнала Medicine Review
Александра Ратманова

Начинаем рубрику с короткого описания ключевых характеристик клинических исследований, поскольку основой доказательной медицины является проведение клинических исследований, и без понимания ключевой терминологии, касающейся этих исследований, нельзя разобраться в применимости научных данных для практики.

Рассмотрим, какие имеются разновидности клинических исследований и в чем практический смысл различий между ними. Большая часть этой информации должна быть хорошо известна нашим читателям, но мы хотели бы еще раз систематизировать ее, указать на определенные нюансы и проблемы в оценке ключевой терминологии, касающейся этих характеристик. Изучая многочисленные отечественные публикации, мы убедились в том, что соответствующую терминологию в разных источниках зачастую используют некорректно, что красноречиво указывает на определенную проблематичность в понимании этой терминологии.

Хотелось бы также предостеречь наших читателей от распространенного заблуждения – расценивать все исследования, не относящиеся к двойным-слепым плацебо-контролируемым рандомизированным проспективным многоцентровым исследованиям (которые часто называются «золотым стандартом» клинических исследований), как недостойные внимания, а их результаты – как имеющие низкую научную ценность. Многие авторы, составляющие рекомендации по анализированию доказательных данных, призывают врачей не доверять никаким исследованиям, если они не принадлежат к этому «золотому стандарту». Такой гиперскептический, порой почти нигилистический подход принципиально неверен, поскольку практически любые разновидности клинических исследований занимают свои собственные ниши в доказательной медицине и играют большую роль для оценки различных данных. Множество очень важных исследований не соответствуют в полной мере этому «золотому стандарту», тем не менее эксперты учитывают результаты этих исследований как значимые и даже зачастую меняющие существующую клиническую практику.

В нашем сообщении для обозначения объекта изучения в клиническом исследовании мы для краткости и простоты будем использовать в основном указание на лекарственный препарат, но подразумевается, что изучаться могут и любые другие «объекты» – комбинации препаратов, определенные стратегии лечения, немедикаментозные методы лечения или профилактики, новые диагностические подходы, шкалы оценки риска и многое другое.

Одно- и многоцентровые

В зависимости от количества исследовательских центров (клиник), в которых проводится наблюдение за больными, участвующими в исследовании, клиническое исследование может быть одноцентровым и многоцентровым. Чем больше центров участвует в исследовании, тем меньше вероятность неблагоприятного влияния возможных некорректностей или ошибок на результаты исследования. Например, если в исследовании в качестве одного из значимых исходов изучается влияние лекарственного препарата на общую смертность, а в каком-то отдельно взятом центре появляется побочная причина повышения общей смертности (внебольничная инфекция, необученный персонал, неисправность аппаратуры, партия фальсифицированных лекарственных средств, воздействие каких-то токсических веществ в атмосфере из-за локального загрязнения окружающей среды и другие неучтенные факторы, то при достаточно большом количестве других центров-участников исследования (несколько десятков или даже сотен) эта некорректность по данным отдельно взятого центра будет сглажена и, скорее всего, нивелирована при статистической обработке данных; одноцентровое исследование в этой клинике привело бы к гораздо более серьезным ошибкам.

Поэтому крупное одноцентровое исследование может предоставлять менее достоверные данные, чем меньшее по количеству участников, но многоцентровое. Кроме того, в рамках одного лечебного учреждения обычно очень трудно в течение относительно короткого времени сформировать выборку подходящих для исследования пациентов со схожими базисными характеристиками и в количестве, достаточном для проведения исследования. Наиболее значимые для клинической практики выводы, которые служат основой научно обоснованных рекомендаций и стандартов ведения больных, делаются с использованием преимущественно данных многоцентровых исследований, особенно если изучается такой показатель, как общая смертность пациентов.

Рандомизированные и нерандомизированные

По способу отбора пациентов в исследование различают рандомизированные и нерандомизированные исследования.

В рандомизированном исследовании пациенты, прошедшие критерии включения, распределяются по группам случайным образом (например, с помощью таблицы случайных чисел или последовательности случайных чисел, генерируемой компьютером). Процедура рандомизации исключает какой-либо сознательный или несознательный отбор пациентов в конкретную группу по тем или иным критериям (то есть исключается влияние как субъективности исследователей, так и систематической ошибки). Таким образом, каждый пациент имеет такой же шанс получить исследуемый или контрольный препарат (или плацебо), как и любой другой участник исследования. В нерандомизированном исследовании, соответственно, процедура рандомизации не проводится.

Как правило, рандомизированные исследования представляют гораздо больший интерес для ученых и практических врачей, что вполне оправданно. Однако отсутствие рандомизации далеко не всегда является недочетом. Для некоторых клинических исследований рандомизацию провести невозможно или нерационально, исходя из дизайна исследования. Например, протокол исследования может предполагать, что исследуемый препарат добавляется в схему лечения пациента тогда, когда в нем возникает потребность, что решается на усмотрение врача, исходя из симптоматики, клинических и лабораторных данных. Для ряда лекарственных средств или клинических ситуаций такой метод изучения также является целесообразным и предоставляет важные научные данные. Кроме того, для исследований I фазы, когда необходимо просто определить, оказывает ли новый лекарственный препарат прогнозированное влияние, как правило, рандомизация также не требуется. Более существенные доказательства эффективности препарата, в том числе его влияния на прогноз, будут впоследствии изучены в клинических исследования II и III фазы, для которых рандомизация уже принципиальна.

Хотелось бы также обратить внимание на некоторую идеализацию понятия рандомизации, которая наблюдается среди многих отечественных врачей. Недостаточно знать об исследовании, что оно рандомизированное, чтобы говорить о высокой доказательной силе полученных в нем результатов. Рандомизация может быть плохо организованной – например, при разделении больных на группы по номеру истории болезни, страхового полиса или дате рождения. Более целесообразна рандомизация с помощью таблицы случайных чисел, метода конвертов или компьютерного распределения. Существует также так называемая стратификационная рандомизация – в начале исследования пациенты разделяются организаторами на подгруппы (например, подгруппы высокого, умеренного и низкого риска) и только потом рандомизируются – отдельно в каждой подгруппе. Доказательные данные, полученные с использованием стратификационной рандомизации, могут иметь меньшую доказательную силу. Кроме того, рандомизация (независимо от способа) может быть неправильно проведена. Если в научной статье не указывается способ рандомизации, это само по себе ставит под сомнение хорошую организацию исследования.

Как рандомизация, так и многоцентровость исследования не исключают ошибочных или некорректных результатов, однако они делают их распределение в группах пациентов все более хаотичным и равномерным, «уравнивая их в правах» для разных групп пациентов, что фактически равноценно устранению этих ошибок и некорректностей. Эту же задачу преследует «масштабность» исследования – набор в исследование как можно большего количества участников обеспечивает не меньшую вероятность ошибок, но их менее выраженное влияние на результаты исследования.

Открытые и слепые

По степени открытости данных исследование может быть открытым или слепым.

В открытом клиническом исследовании все участники (организаторы, наблюдатели, врачи, пациенты) знают, какой препарат используется у конкретного больного. В связи с большим потенциальным субъективизмом такие исследования котируются очень невысоко, хотя из-за своей простоты и дешевизны они могут быть полезны в качестве небольших пилотных исследований для определения перспективности дальнейшего изучения препарата. Для определенных клинических ситуаций, когда имитация вмешательства невозможна или нецелесообразна, этот вид исследований остается единственной перспективой. Так, открытыми являются все исследования, посвященные сравнению консервативного лечения и оперативных вмешательств (например, изучению преимуществ ангиопластики/стентирования артерий в сравнении с фармакотерапией атеросклероза и атеротромбоза).

Слепые исследования подразумевают различную степень закрытости сведений о том, кто из участников исследования какие препараты принимает. В простом слепом исследовании пациенты не знают, какие препараты им назначают; в двойном-слепом – этого не знают ни пациенты, ни врачи; в тройном-слепом (полном слепом) – данные до конца исследования закрыты даже для тех сотрудников, которые занимаются статистической обработкой данных. Чем больше степень закрытости данных, тем ниже субъективизм в результатах исследования, их сборе и трактовке. Однако слепые исследования проводить сложнее и дороже, чем обычные открытые. Поэтому тройной-слепой контроль, хотя и обеспечивает лучшие результаты, чем двойной-слепой, используется очень редко, и именно двойной-слепой стал считаться «золотым стандартом».

Контролируемые и неконтролируемые

Исследование может быть контролируемым или неконтролируемым. Следует обратить внимание практических врачей на возможные разночтения этих терминов.

В широком смысле под контролируемым исследованием подразумевается исследование, в котором контролируются (по возможности минимизируются или исключаются) потенциальные источники систематических ошибок. В таком случае указание на контролируемость исследования – это просто обозначение того, что оно проводится в строгом соответствии с протоколом, мониторируется специальными комиссиями и проч. Большинство исследований, которые представлены в международных научных базах данных, являются контролируемыми, поскольку для авторитетных медицинских журналов контролируемость исследования входит в набор минимальных требований к оригинальной научной работе. Поэтому «контролируемость» в этом смысле, как правило, не упоминается специально – она подразумевается по умолчанию.

Гораздо чаще под «контролируемостью» имеется в виду характер изучения препарата в исследовании – в сравнении с «контрольным препаратом» или без такого сравнения.

В контролируемых исследованиях лекарственный препарат изучается параллельно с «контрольным средством». В качестве «контроля» может выступать плацебо (плацебо-контролируемое исследование) или препарат/препараты сравнения (сравнительное исследование). Часто также практикуется сравнение с тем же препаратом, но в другой дозе (с другим режимом приема), иногда – с группой, не получавшей никакого лечения (в том числе и плацебо).

В сравнительных исследованиях в качестве препарата сравнения, как правило, используется некий стандартный, наиболее изученный, традиционный для данной категории больных и в данной клинической ситуации препарат – по возможности той же фармакологической группы, что и исследуемый (новый) препарат. Например, в исследованиях, посвященных изучению новых инотропных средств, таким сравнительным препаратом обычно выступает добутамин или допамин, в исследованиях по изучению антикоагулянтов – нефракционированный гепарин или эноксапарин, в исследованиях по изучению антитромбоцитарных препаратов – ацетилсалициловая кислота. Иногда препарат сравнения выбирается по каким-то особым критериям, и в таком случае авторы подробно обосновывают свой выбор. Например, в исследовании ONTARGET телмисартан сравнивался с рамиприлом – препаратом другой (хотя и схожей) кардиологической группы. Это объяснялось тем, что, судя по имеющимся данным, оба препарата принадлежат к наиболее сильным по антигипертензивному и органопротекторному действию представителям своих групп (блокаторов рецепторов ангиотензина II и ингибиторов АПФ, соответственно), а рамиприл ранее в исследовании HOPE продемонстрировал высокую эффективность в снижении сердечно-сосудистой заболеваемости и смертности у больных высокого риска, и для авторов исследования ONTARGET было принципиальным обнаружить такие же или более выраженные преимущества у той же категории больных и для телмисартана.

В одной группе, в параллельных группах, в «перекрестной модели»

Дизайн (план, структура) исследований может быть простым и сложным. Существуют несколько наиболее часто используемых вариантов стандартных дизайнов: клиническое исследование в одной группе (single group design), в параллельных группах (parallel group design), в «перекрестной модели» (crossover group design).

Исследование в одной группе – самый простой вариант дизайна, все участники исследования получают один и тот же препарат. Целью такого исследования является сравнение результатов лечения с исходным состоянием пациентов. Соответственно, в этих исследованиях нет ни рандомизации на группы, ни «контроля» (препарата сравнения или плацебо). Но это не значит, что их проведение не рекомендуется в доказательной медицине. Как правило, клинические исследования с таким дизайном широко используются в I фазе исследований нового лекарственного препарата, и на основе полученных результатов (если они благоприятны) планируются более сложные исследования, позволяющие получить более сильные доказательные данные. Однако исследования в одной группе сами по себе не могут быть основанием для каких-либо серьезных выводов об эффективности или безопасности препарата и тем более – для практических рекомендаций по его применению в медицинской практике.

Клиническое исследование в параллельных группах может включать две группы пациентов и более. Это классический дизайн для плацебо-контролируемого исследования. Кроме того, в таких исследованиях изучаются разные препараты в сравнении друг с другом и/или с плацебо, один и тот же препарат в разных дозах или с разными режимами введения и т.д. Оптимально, если при этом распределение на группы будет случайным (рандомизация), а контроль будет подразумевать «ослепление» исследования. Большинство клинических испытаний проводятся в дизайне параллельных групп, поскольку именно такой дизайн обеспечивает получение максимально объективизированных выводов

Исследование в «перекрестной модели» подразумевает изменение тактики лечения по ходу исследования: сначала пациенты группы 1 получают препарат А, а пациенты группы 2 – препарат Б, а через определенный период времени (и, как правило, после «отмывочного» периода) в группе 1 применяется уже препарат Б, а в группе 2 – препарат А. Такой дизайн позволяет провести сравнение препаратов как в разных группах участников исследования, так и на одних и тех же пациентах. Исследования с таким дизайном обычно используют для изучения фармакокинетики и фармакодинамики лекарственного препарата, полезную информацию можно получить и о безопасности терапии, особенно в исследованиях I и II фазы. Кроме того, этот подход применим для оценки эффективности терапии у пациентов с хроническими заболеваниями, которые должны постоянно (пожизненно) принимать определенные медикаменты. Однако выводы об эффективности лечения на основе подобного рода данных могут иметь ограниченную доказательную ценность, учитывая ряд недостатков данного дизайна.

В ряде случаев авторы клинических исследований модифицируют стандартные варианты дизайна или разрабатывают свой оригинальный дизайн исследования, если этого требует его цель. В таком случае дизайн исследования подробно описывается авторами и, если это необходимо, изображается схематически.

Проспективные и ретроспективные

По способу планирования и организации исследования оно может быть проспективным или ретроспективным.

Проспективное исследование планируется и проводится с включением и распределением участников на группы de novo. Соответственно, в таком исследовании проводится само наблюдение за пациентами, сбор и анализ данных. Ретроспективное исследование использует данные, ранее полученные другими авторами, и не подразумевает наблюдения за пациентами, а только сбор данных и их анализ по определенным критериям. Организаторы не наблюдают сами за пациентами, а только анализируют архивные данные согласно поставленным задачам. Соответственно, ретроспективное исследование обычно проще и дешевле, чем проспективное, но имеет другую ценность с точки зрения доказательной медицины. Проспективные исследования имеют собственную концепцию и задачи, которым подчинены план, протокол, дизайн исследования. Это позволяет подтвердить или опровергнуть конкретную гипотезу, опираясь на данные, полученные специально с этой целью. Ретроспективное исследование вынуждено использовать данные, которые собирались ранее с некоторыми другими целями, и потому могут существенно отличаться по своей доказательной силе от результатов проспективного исследования. Поэтому в настоящее время без результатов проспективных исследований по определенному вопросу эксперты, как правило, не делают каких-либо серьезных выводов и практических рекомендаций, а если и делают, то с оговорками, что данные требуют подтверждения в проспективных клинических исследованиях. Об этих оговорках важно помнить. Тем не менее именно ретроспективные исследования обычно дают наиболее веские основания для организации проспективных, а в ряде случаев на протяжении многих лет служат единственными источниками доказательных данных по каким-то вопросам, для прояснения которых проспективные исследования организовать слишком сложно, дорого, долго.

Обсервационные («случай–контроль», серии случаев, клинический случай) и экспериментальные

По характеру клинические исследования подразделяются на

обсервационные:

– описательные (например, описание клинического случая, описание серии случаев);

– аналитические (например, исследование типа «случай–контроль»);
экспериментальные (не путать с доклиническим экспериментом на животных или с биологическими объектами – клетками, тканями и т.д.).

Обсервационное исследование основано на наблюдении за участниками. Наблюдение может быть полностью пассивным и выражаться только в описании клинической ситуации и мероприятий, предпринятых практическим врачом, либо носить аналитический характер (предназначаться для проверки какой-то гипотезы, сделанных прогнозов).

Исследование типа «случай–контроль» сравнивает группы пациентов одной и той же популяции, но при этом в одной из этих групп имеются какие-то заболевания, неблагоприятные исходы, осложнения, побочные явления приема лекарств и т.д. («случай»), а у пациентов другой группы этих проблем нет («контроль»). Выявленные различия между этими группами могут позволить выделить причину или предикторы риска развития заболевания, обнаружить связь между неблагоприятными исходами и воздействием каких-то факторов. Таким образом, в отличие от экспериментального клинического исследования, где сначала набирают пациентов и, к примеру, назначают им какой-то препарат, а затем оценивают количество неблагоприятных исходов, в обсервационном исследовании «случай–контроль» эти неблагоприятные исходы уже имеются в настоящем, остается лишь сравнить тех пациентов, у которых они развились, с «контрольной» популяцией для ретроспективной оценки факторов, которые могли повлиять на разницу между группами по этим исходам. Авторы предлагают гипотезу о потенциальном факторе риска, после чего им необходимо сравнить группы пациентов и определить наличие или отсутствие предполагаемого фактора риска в этих группах. Следовательно, исследования «случай–контроль» всегда ретроспективные.

Если исследование «случай–контроль» проводилось в рамках когортного исследования, оно называется вложенным исследованием «случай–контроль», или исследованием, проведенным методом вложенной выборки (nested case–control study), иногда используется выражение «гнездовое исследование» (некорректный перевод, калька с английского «nested»).

В исследовании типа «серия случаев» (case series) наблюдают за несколькими пациентами с одинаковой патологией и обычно получающих одинаковое лечение. Это самый распространенный способ описания клинической картины заболевания. При описании отдельного клинического случая (case report), соответственно, освещается и обсуждается лечение и исходы у одного пациента (иногда нескольких пациентов, но не более десяти).

Следует подчеркнуть, что доказательные данные, полученные в обсервационных исследованиях, в том числе в описании клинических случаев, не стоит расценивать как наименее значимые, «второсортные». Они занимают собственную нишу в доказательной медицине и играют важную роль сами по себе, а не только как начальный этап изучения проблемы. Обсервационные исследования бесценны для изучения очень многих вопросов, особенно тех, оценивать которые в экспериментальных клинических исследованиях невозможно или неэтично. Например, значительная часть важной информации о побочных эффектах лекарственных препаратов черпается именно из таких исследований; особую роль обсервационные исследования играют для описания ранее неизвестных, поздних, редких побочных эффектов. Так, именно обсервационные исследования являются основным источником доказательных данных о неблагоприятном влиянии нестероидных противовоспалительных препаратов и тиазолидиндионов на сердечно-сосудистую систему. Поэтому качественно проведенные обсервационные исследования предоставляют очень важные научные данные.

Обсервационные исследования даже имеют ряд важных преимуществ: они, как правило, выполняются быстро (могут быть проведены в сравнительно короткие сроки и дать ответы на вопросы, которые при другом подходе могли бы выясняться на протяжении многих лет), позволяют на большой популяции пациентов изучать редкие заболевания, а также болезни с длительным латентным периодом, к тому же это относительно недорогие исследования и фактически могут выполняться «на коленке», если пользоваться научным сленгом. Обсервационные исследования позволяют избежать некоторых систематических ошибок, свойственных экспериментальным клиническим исследованиям, хотя они при этом обладают высокой вероятностью появления собственных систематических ошибок – иного рода, чем в экспериментальных испытаниях. Следовательно, не стоит недооценивать научный потенциал обсервационных исследований, но нельзя и подменять клинически значимые выводы об эффективности и безопасности препаратов аргументами, полученными на основе только лишь обсервационных исследований.

Экспериментальные клинические исследования, о которых идет речь в этой классификации, называются так потому, что в основе исследования лежит определенная оригинальная гипотеза, которую необходимо подтвердить или опровергнуть в специально спланированном исследовании с помощью целенаправленного вмешательства (например, назначения нового лекарственного препарата). Таким образом, это уже не пассивное наблюдение и анализ данных, но активный эксперимент над участниками исследования. Однако не следует путать такой «эксперимент» в рамках клинических испытаний с экспериментальными доклиническими исследованиями. Впрочем, в связи с этим пересечением терминов и возможностью неверного трактования обозначение «экспериментальные клинические исследования» практически не используется, подменяясь другими характеристиками (проспективные, рандомизированные и т.д.). Некоторые отечественные авторы предлагают ввести для его обозначения термин «клиническое испытание», хотя это не очень удачная идея, учитывая, что слова «испытание» и «исследование» считаются взаимозаменяемыми, и термин «клиническое испытание» обычно воспринимается как полный синоним термину «клиническое исследование» вообще, без указания на его экспериментальный или обсервационный характер.

Хотелось бы отметить, что во многих источниках часто противопоставляются обсервационные и рандомизированные исследования. Это некорректно, исходя из того, что рандомизированность отбора участников исследования и принадлежность исследования к обсервационному или экспериментальному – разные категории («сравнивать теплое с мягким»). Обсервационное исследование действительно не может быть рандомизированным по своей природе, но это не значит, что его следует противопоставлять рандомизированному исследованию. И наоборот – экспериментальные клинические исследования, которые на самом деле противопоставлены обсервационным, могут быть как рандомизированными, так и нерандомизированными.

Продольные исследования и одномоментные срезы

В зависимости от способа сбора данных исследования могут быть продольными, или растянутыми во времени (longitudinal), и поперечными, или одномоментными срезами (cross-sectional).

Продольные исследования продолжаются определенный период времени, когда принимается лечение и проводится наблюдение за пациентами. Продольные исследования позволяют оценить эффективность и безопасность приема препаратов, поэтому большинство клинических исследований с лекарственными средствами являются продольными.

Часто термин «продольное исследование» используется как синоним термина «когортное исследование». Это разные категории, но, по сути, обычно указывают на одно и то же, и на практике эти термины действительно в какой-то мере взаимозаменяемы. Когортное исследование подразумевает, что определенную группу людей (когорту) наблюдают в течение некоторого времени. Часто такие исследования используются для определения степени риска определенных факторов (например, курение, избыточный вес). Когортные исследования могут быть как обсервационными, так и экспериментальными, а также как проспективными (если набрана группа пациентов, за которыми авторы ведут наблюдение), так и ретроспективными (если авторы используют архивные данные, ранее собранные в процессе наблюдения за пациентами), – обращаем на это внимание, поскольку в отечественной литературе часто ошибочно ставится знак равенства между «когортным» и «проспективным» исследованием. Но чаще всего когортные исследования именно проспективные, и наблюдение за пациентами может продолжаться на протяжении нескольких лет.

Одномоментные срезы необходимы для оценки распространенности определенного заболевания, факторов риска и т.д. В таких исследованиях информация от каждого пациента получается только однократно.

Выводы

Из всего этого многообразия характеристик клинических исследований многие врачи делают ошибочные выводы о том, что существуют «корректные» и «некорректные» методы проведения клинических исследований, и наиболее корректным является ставшее уже притчей во языцех двойное-слепое плацебо-контролируемое рандомизированное проспективное многоцентровое исследование. Такой набор характеристик действительно обеспечивает сильную доказательность, доброкачественность результатов, высокую объективность данных и сведение к минимуму возможных ошибок, связанных с влиянием на результаты различных известных (в первую очередь психологических) и неизвестных факторов. Однако такие исследования не являются единственным верным методом решения научных задач в медицине – другие подходы также имеют право на жизнь и во многих случаях являются оптимальными или даже безальтернативными вариантами изучения конкретной проблемы или необходимыми ступеньками на пути к получению более сильной доказательной базы, планированию и корректному выполнению тех самых двойных-слепых плацебо-контролируемых рандомизированных проспективных многоцентровых исследований. Кроме того, для определенных клинических ситуаций, препаратов, категорий пациентов такие исследования провести невозможно или нецелесообразно. Некоторые клинические ситуации не позволяют провести рандомизацию или выполнить плацебо-контроль, для некоторых категорий пациентов с редкими заболеваниями очень сложно и затратно организовать достаточно крупное проспективное продольное исследование, в некоторых исследованиях поставленная задача не требует сравнения с плацебо, для получения ответов на многие вопросы наиболее корректны именно ретроспективные обсервационные исследования и т.д. Двойные-слепые плацебо-контролируемые рандомизированные проспективные исследования просто неприменимы ко многим клиническим вопросам, так как врач не может намеренно подвергать пациентов риску какой-то болезни или развития побочных явлений лекарственных препаратов. Распространенной ситуацией, ограничивающей использование рандомизированных плацебо-контролируемых клинических исследований, является заведомая необходимость определенного лечения, когда намеренно лишать этого лечения часть пациентов, участвующих в исследовании, противоречит принципам врачебной этики. Во многих таких ситуациях (особенно если без лечения пациент может погибнуть) нельзя не только использовать плацебо-контроль, но зачастую очень сложно добиться проведения сравнительных исследований, так как для этого надо иметь высокую (подтвержденную ранее проведенными исследованиями) уверенность в том, что традиционное и новое лекарственное средство имеют как минимум равную эффективность. Часто такие исследования прекращаются досрочно, когда становится очевидным, что либо традиционное, либо новое лекарственное средство значительно более эффективно, чем препарат сравнения.

Очень важно помнить и следующее: хотя двойные-слепые плацебо-контролируемые рандомизированные проспективные исследования и характеризуются высокой достоверностью получаемых данных, но вместе с тем эти данные часто плохо поддаются обобщению. В таких исследованиях обычно изучается некая высокоселективная выборка пациентов с жесткими критериями включения и исключения. Поэтому переносить полученные в таких клинических испытаниях результаты в обычную медицинскую практику следует с осторожностью, указывая, для каких категорий пациентов эти данные применимы, для каких – потенциально применимы и для каких – вообще не могут быть использованы. Из большинства исследований исключаются пациенты с тяжелыми нарушениями функции почек, печени, другими сопутствующими заболеваниями, когорта участников исследования обычно ограничивается определенными возрастными рамками и многими другими факторами. В результате такое исследование может ответить не столько на вопрос «Как работает данный препарат?», сколько на вопрос «Как данный препарат работает в некоторых идеальных условиях?». Поэтому для экстраполирования результатов даже качественного двойного-слепого плацебо-контролируемого рандомизированного проспективного клинического исследования на рутинную практику имеется целый ряд препятствий, которые врач должен хорошо понимать и учитывать в своей работе. Хорошо спланированное и качественно проведенное обсервационное исследование может предоставить в этом отношении больше полезной для практики информации, чем проспективное экспериментальное испытание с рандомизацией и плацебо-контролем.

Негативные оценки обсервационного дизайна исследований опираются в основном на ту информацию, которая была получена еще в 70-80-е гг., когда было показано, что обсервационные исследования преувеличивают положительный эффект от лечения по сравнению с экспериментальными. Однако следует учитывать, что с тех пор методология и отношение к доброкачественности проведения клинических исследований значительно изменились, и в настоящее время эксперты, как правило, не находят существенных противоречий между обсервационными и экспериментальными исследованиями, если они хорошо спланированы и проведены в соответствии со всеми требованиями.

В конце концов, обсервационные и экспериментальные исследования не должны рассматриваться как конкуренты, – их следует планировать так, чтобы они отвечали на разные вопросы об одной и той же проблеме, а их результаты дополняли друг друга. Проводя простую аналогию с игрой в шахматы, можно сказать, что двойные-слепые плацебо-контролируемые рандомизированные проспективные исследования и метаанализы на их основе являются ферзем для доказательной медицины, но это не значит, что все остальные фигуры не нужны или вредны. В некоторых партиях и пешка может поставить шах и мат, хотя это не основная ее цель в игре.

Научно обоснованная клиническая практика предполагает, что врач, принимая решение об оптимальной тактике ведения пациента, использует лучшее доступное доказательство. Поэтому если результаты двойных-слепых плацебо-контролируемых рандомизированных проспективных многоцентровых исследований по какому-то вопросу отсутствуют или противоречивы, следует учитывать также и другие научные данные, а также мнения экспертов, изучавших этот вопрос. И даже при наличии «золотого стандарта» другие исследования могут иметь важное дополняющее и уточняющее значение. С другой стороны, если двойные-слепые плацебо-контролируемые рандомизированные проспективные исследования и метаанализы, проведенные на основе данных таких исследований, доказали неэффективность или опасность какого-то препарата, недопустимо продолжать применять этот препарат, опираясь на результаты других (обсервационных, нерандомизированных, ретроспективных, неконтролируемых и т.д.) исследований. В любом случае мы призываем учитывать не только характер исследования, но и его доброкачественность и степень соответствия дизайна исследования поставленной задаче. «Золотой стандарт» клинических исследований – это не метка, обозначающая идеальность имеющейся научной информации, а всего лишь инструмент, на котором можно как сыграть прекрасную мелодию, так и создать какофонию. Понимая и правильно используя ограничения и преимущества исследований, которые не принадлежат к «золотому стандарту», их можно успешно применять как на благо развития медицинской науки, так и для практического здравоохранения.

* * *

О разделении клинических исследований на исследования I, II, III, IV фазы, а также о систематических обзорах и метаанализах читайте в следующих выпусках рубрики «Ликбез». Кроме того, в ближайших номерах нашего журнала будут освещены наиболее важные аспекты оценки достоверности и доказательной силы научных данных, особенности систематических ошибок и методов их корректировки, использующиеся в клинических исследования, нюансы научного поиска в журналах и международных базах данных и другие вопросы, четкое понимание которых обеспечивает лучшую ориентировку в доказательных данных.

Автор обзора Александра Ратманова

Medicine Review 2009; 3 (08): 64-69

Клинические исследования. О «золотом стандарте» и проблеме «доказательного нигилизма»

Корисні посилання