Главная Другой Анализ данных по времени до события

Анализ данных по времени до события

Обзор

Программное обеспечение

Описание

Сайты

Чтения

Курсы

Обзор

На этой странице кратко описывается ряд вопросов, которые следует учитывать при анализе данных о времени до события, и приводится аннотированный список ресурсов для получения дополнительной информации.

Описание

В чем уникальность данных о времени до события (TTE)?

Данные о времени до события (TTE) уникальны, потому что интересующий результат заключается не только в том, произошло ли событие, но также и в том, когда это событие произошло. Традиционные методы логистической и линейной регрессии не подходят для включения в модель как событий, так и временных аспектов. Традиционные методы регрессии также не приспособлены для обработки цензуры, особого типа недостающих данных, который возникает при анализе времени до события, когда субъекты не испытывают интересующего события в течение периода последующего наблюдения. При наличии цензуры истинное время до события недооценивается. Специальные методы для данных TTE, как будет описано ниже, были разработаны для использования частичной информации по каждому субъекту с цензурированными данными и обеспечения объективных оценок выживаемости. Эти методы включают данные из нескольких временных точек по субъектам и могут использоваться для непосредственного расчета показателей, временных соотношений и соотношений рисков.

Каковы важные методологические аспекты данных о времени до события?

Есть 4 основных методологических соображения при анализе данных о времени до события или выживаемости. Важно иметь четкое определение целевого события, источника времени, временной шкалы и описать, как участники выйдут из исследования. Как только они будут четко определены, анализ станет более простым. Обычно существует одно целевое событие, но есть расширения анализа выживаемости, которые допускают множественные события или повторяющиеся события.

Каково происхождение времени?

Начало отсчета времени - это точка, в которой начинается отсчет времени. Данные TTE могут использовать различные источники времени, которые в значительной степени определяются дизайном исследования, каждое из которых имеет свои преимущества и недостатки. Примеры включают исходное время или исходный возраст. Источники времени также могут быть определены по определяющей характеристике, такой как начало воздействия или диагноз. Часто это естественный выбор, если результат связан с этой характеристикой. Другие примеры включают день рождения и календарный год. Для когортных исследований шкалой времени обычно является время исследования.

Есть ли другой вариант шкалы времени, кроме времени на учебу?

Возраст - еще одна широко используемая шкала времени, где базовый возраст - это время начала, а люди выходят на свое мероприятие или возраст цензуры. Модели с возрастом в качестве шкалы времени могут быть скорректированы с учетом календарных эффектов. Некоторые авторы рекомендуют использовать в качестве шкалы времени возраст, а не время обучения, поскольку это может дать менее предвзятые оценки.

Что такое цензура?

Одна из проблем, характерных для анализа выживаемости, заключается в том, что только некоторые люди испытают событие к концу исследования, и поэтому время выживания для подмножества исследуемой группы будет неизвестно. Это явление называется цензурой и может возникать по следующим причинам: участник исследования еще не испытал соответствующего результата, такого как рецидив или смерть, к моменту завершения исследования; участник исследования потерян для последующего наблюдения в течение периода исследования; или участник исследования переживает другое событие, которое делает невозможным дальнейшее наблюдение. Такие цензурированные интервалы времени недооценивают истинное, но неизвестное время до события. Для большинства аналитических подходов цензурирование предполагается случайным или неинформативным.

Существует три основных типа цензуры: правое, левое и интервальное. Если события происходят после окончания исследования, данные подвергаются цензуре справа. Данные, подвергнутые цензуре слева, появляются, когда событие наблюдается, но точное время события неизвестно. Данные с интервальной цензурой появляются, когда событие наблюдается, но участники входят и выходят из-под наблюдения, поэтому точное время события неизвестно. Большинство аналитических методов выживаемости разработаны для наблюдений с цензурой справа, но доступны методы для интервальных и лево-цензурированных данных.

Какой интересующий вопрос?

При выборе аналитического инструмента следует руководствоваться интересующим исследованием вопросом. С данными TTE вопрос исследования может принимать несколько форм, которые влияют на то, какая функция выживаемости наиболее актуальна для вопроса исследования. Три различных типа исследовательских вопросов, которые могут представлять интерес для данных TTE, включают:

  1. Какая часть людей не будет участвовать в мероприятии через определенное время?

  2. Какая часть людей будет иметь событие по прошествии определенного времени?

    император болезней
  3. Каков риск события в конкретный момент времени среди тех, кто выжил до этого момента?

Каждый из этих вопросов соответствует разному типу функции, используемой в анализе выживаемости:

  1. Функция выживания, S (t): вероятность того, что человек выживет после времени t [Pr (T> t)]

  2. Функция плотности вероятности, F (t), или функция совокупной вероятности, R (t): вероятность того, что время выживания человека будет меньше или равно t [Pr (T≤t)]

  3. Функция опасности, h (t): мгновенный потенциал переживания события в момент времени t, при условии, что вы дожили до этого времени.

  4. Кумулятивная функция риска, H (t): интеграл функции риска от момента времени 0 до момента времени t, который равен площади под кривой h (t) между моментом времени 0 и временем t.

Если одна из этих функций известна, другие функции можно вычислить по следующим формулам:

S (t) = 1 - F (t) Сумма функции выживания и функции плотности вероятности равна 1

h (t) = f (t) / S (t) Мгновенная опасность равна безусловной вероятности

переживает событие во время t, масштабированное на долю живущих в момент t

H (t) = -log [S (t)] Кумулятивная функция риска равна отрицательному логарифму выживаемости.

функция

S (t) = e –H (t) Функция выживания равна экспоненциальному отрицательному кумулятивному риску.

функция

Эти преобразования часто используются в методах анализа выживаемости, о чем будет сказано ниже. Как правило, увеличение h (t), мгновенной опасности, приводит к увеличению H (t), кумулятивной опасности, что приводит к уменьшению S (t), функции выживания.

Какие предположения необходимо сделать, чтобы использовать стандартные методы для данных о времени до события?

Основное допущение при анализе данных TTE - это неинформативная цензура: люди, подвергшиеся цензуре, имеют такую ​​же вероятность пережить последующее событие, как и люди, которые остаются в исследовании. Информативная цензура аналогична пропущенным данным, которые нельзя игнорировать, что искажает анализ. Не существует окончательного способа проверить, является ли цензура неинформативной, хотя изучение моделей цензуры может указать, является ли допущение неинформативной цензуры разумным. Если есть подозрение на информативную цензуру, можно использовать анализ чувствительности, такой как лучший и наихудший сценарии, чтобы попытаться количественно оценить влияние информативной цензуры на анализ.

Другое допущение при анализе данных TTE заключается в том, что существует достаточное время наблюдения и количество событий для адекватной статистической мощности. Это необходимо учитывать на этапе разработки исследования, поскольку большинство анализов выживаемости основано на когортных исследованиях.

Стоит упомянуть дополнительные упрощающие предположения, поскольку они часто делаются в обзорах анализа выживаемости. Хотя эти предположения упрощают модели выживаемости, они не являются необходимыми для проведения анализа с данными TTE. Если эти допущения нарушаются, можно использовать передовые методы:

  • Отсутствие влияния когорты на выживаемость: для когорты с длительным периодом набора предполагайте, что люди, которые присоединяются раньше, имеют такую ​​же вероятность выживания, как и те, которые присоединяются позже

  • Правильная цензура только данных

  • События не зависят друг от друга

Какие типы подходов можно использовать для анализа выживаемости?

Существует три основных подхода к анализу данных TTE: непараметрический, полупараметрический и параметрический подходы. Выбор подхода к использованию должен определяться интересующим исследованием вопросом. Часто в одном анализе могут быть уместно использованы несколько подходов.

Какие существуют непараметрические подходы к анализу выживаемости и когда они подходят?

Непараметрические подходы не основываются на предположениях о форме или форме параметров в основной совокупности. В анализе выживаемости используются непараметрические подходы для описания данных путем оценки функции выживаемости, S (t), а также медианы и квартилей времени выживания. Эти описательные статистические данные не могут быть рассчитаны непосредственно из данных из-за цензуры, которая недооценивает истинное время выживания подвергнутых цензуре субъектов, что приводит к искаженным оценкам среднего, медианного и других описательных значений. Непараметрические подходы часто используются в качестве первого шага в анализе для создания объективной описательной статистики и часто используются в сочетании с полупараметрическими или параметрическими подходами.

Оценщик Каплана-Мейера

Наиболее распространенным непараметрическим подходом в литературе является оценка Каплана-Мейера (или предела продукта). Оценщик Каплана-Мейера работает, разбивая оценку S (t) на серию шагов / интервалов, основанных на наблюдаемых временах событий. Наблюдения вносят вклад в оценку S (t) до тех пор, пока событие не произойдет или пока они не будут подвергнуты цензуре. Для каждого интервала рассчитывается вероятность дожить до конца интервала, учитывая, что субъекты подвергаются риску в начале интервала (это обычно обозначается как pj = (nj - dj) / nj). Оценка S (t) для каждого значения t равна произведению выживания в каждом интервале до времени t включительно. Основные допущения этого метода, помимо неинформативной цензуры, заключаются в том, что цензура происходит после неудач и нет влияния когорты на выживаемость, поэтому субъекты имеют одинаковую вероятность выживания независимо от того, когда они попали в исследование.

Оценку S (t) по методу Каплана-Мейера можно построить как ступенчатую функцию со временем по оси X. Этот график - хороший способ визуализировать опыт выживания когорты, а также может использоваться для оценки медианы (когда S (t) ≤0,5) или квартилей времени выживания. Эти описательные статистические данные также могут быть рассчитаны непосредственно с помощью оценщика Каплана-Мейера. 95% доверительный интервал (ДИ) для S (t) основан на преобразованиях S (t), чтобы гарантировать, что 95% доверительный интервал находится в пределах от 0 до 1. Наиболее распространенным в литературе методом является оценка Гринвуда.

Оценка продолжительности жизни

Оценка функции выживаемости в таблице смертности является одним из самых ранних примеров прикладных статистических методов, которые использовались более 100 лет для описания смертности в больших популяциях. Оценщик таблицы дожития аналогичен методу Каплана-Мейера, за исключением того, что интервалы основаны на календарном времени, а не на наблюдаемых событиях. Поскольку методы таблиц дожития основаны на этих календарных интервалах, а не на отдельных событиях / времени цензуры, эти методы используют средний размер набора рисков за интервал для оценки S (t) и должны предполагать, что цензура происходила равномерно в течение календарного интервала времени. По этой причине оценка таблицы дожития не так точна, как оценка Каплана-Мейера, но результаты будут аналогичными в очень больших выборках.

premed post bac программы

Оценщик Нельсона-Алена

Другой альтернативой Каплан-Мейеру является оценка Нельсона-Аалена, которая основана на использовании подхода процесса подсчета для оценки кумулятивной функции риска, H (t). Затем оценку H (t) можно использовать для оценки S (t). Оценки S (t), полученные с помощью этого метода, всегда будут больше, чем оценка K-M, но разница между двумя методами в больших выборках будет небольшой.

Можно ли использовать непараметрические подходы для одномерного или многомерного анализа?

Непараметрические подходы, такие как оценка Каплана-Мейера, могут использоваться для проведения однофакторного анализа представляющих интерес категориальных факторов. Факторы должны быть категориальными (либо по своей природе, либо как непрерывная переменная, разбитая на категории), потому что функция выживания, S (t), оценивается для каждого уровня категориальной переменной, а затем сравнивается между этими группами. Оценочные значения S (t) для каждой группы могут быть нанесены на график и визуально сопоставлены.

Ранговые тесты также можно использовать для статистической проверки разницы между кривыми выживаемости. Эти тесты сравнивают наблюдаемое и ожидаемое количество событий в каждый момент времени в разных группах при нулевой гипотезе о том, что функции выживания одинаковы во всех группах. Существует несколько версий этих ранговых тестов, которые различаются по весу, присвоенному каждой временной точке при вычислении статистики теста. Два из наиболее распространенных ранговых тестов, встречающихся в литературе, - это логарифмический ранговый тест, который дает каждой временной точке одинаковый вес, и тест Вилкоксона, который взвешивает каждую временную точку по количеству субъектов, находящихся в группе риска. Основываясь на этом весе, тест Вилкоксона более чувствителен к различиям между кривыми на ранних этапах наблюдения, когда большее количество субъектов подвержено риску. В других тестах, таких как тест Пето-Прентиса, используются промежуточные веса между значениями логарифмического ранга и критериями Вилкоксона. Ранговые тесты подчиняются дополнительному предположению, что цензурирование не зависит от группы, и все они ограничены небольшой мощностью для обнаружения различий между группами при пересечении кривых выживаемости. Хотя эти тесты предоставляют p-значение разницы между кривыми, они не могут использоваться для оценки величины эффекта (p-значение теста логарифмического ранга, однако, эквивалентно p-значению для категориального фактора, представляющего интерес в одномерном Cox модель).

Непараметрические модели ограничены тем, что они не предоставляют оценок воздействия и, как правило, не могут использоваться для оценки воздействия нескольких представляющих интерес факторов (многомерные модели). По этой причине непараметрические подходы часто используются в сочетании с полу- или полностью параметрическими моделями в эпидемиологии, где многомерные модели обычно используются для контроля искажающих факторов.

Можно ли настроить кривые Каплана-Мейера?

Это распространенный миф о том, что кривые Каплана-Мейера не могут быть скорректированы, и это часто упоминается как причина для использования параметрической модели, которая может генерировать кривые выживаемости с поправкой на ковариаты. Однако был разработан метод построения скорректированных кривых выживаемости с использованием обратного вероятностного взвешивания (IPW). В случае только одной ковариаты IPW могут быть оценены непараметрически и эквивалентны прямой стандартизации кривых выживаемости для исследуемой популяции. В случае нескольких ковариат необходимо использовать полу- или полностью параметрические модели для оценки весов, которые затем используются для создания кривых выживаемости, скорректированных по множественным ковариатам. Преимущества этого метода заключаются в том, что он не зависит от предположения о пропорциональных рисках, его можно использовать для изменяющихся во времени ковариат, а также для непрерывных ковариат.

Зачем нужны параметрические подходы для анализа данных о времени до события?

Непараметрический подход к анализу данных TTE используется для простого описания данных о выживаемости по отношению к исследуемому фактору. Модели, использующие этот подход, также называются одномерными моделями. Чаще всего исследователей интересует связь между несколькими ковариатами и временем до события. Использование полу- и полностью параметрических моделей позволяет анализировать время до события по отношению ко многим факторам одновременно и дает оценки силы эффекта для каждого составляющего фактора.

Что такое полупараметрический подход и почему он так широко используется?

Пропорциональная модель Кокса - это наиболее часто используемый многомерный подход для анализа данных о выживаемости в медицинских исследованиях. По сути, это регрессионная модель времени до события, которая описывает связь между частотой событий, выраженной функцией риска, и набором ковариат. Модель Кокса записывается следующим образом:

функция риска, h (t) = h0 (t) exp {β1X1 + β2X2 +… + βpXp}

Это считается полупараметрическим подходом, потому что модель содержит непараметрический компонент и параметрический компонент. Непараметрическая составляющая - это базовый риск h0 (t). Это значение риска, когда все ковариаты равны 0, что подчеркивает важность центрирования ковариат в модели для интерпретируемости. Не путайте базовый риск с опасностью в момент времени 0. Базовая функция риска оценивается непараметрически, и поэтому, в отличие от большинства других статистических моделей, предполагается, что время выживания не следует конкретному статистическому распределению и форме базовой линии. опасность произвольна. Базовую функцию риска не нужно оценивать, чтобы делать выводы об относительной опасности или соотношении рисков. Эта особенность делает модель Кокса более устойчивой, чем параметрические подходы, поскольку она не подвержена ошибкам при указании базовой опасности.

Параметрическая составляющая состоит из вектора ковариации. Вектор ковариаты умножает базовый риск на одну и ту же величину независимо от времени, поэтому эффект любой ковариаты одинаков в любое время во время последующего наблюдения, и это является основой для предположения о пропорциональности рисков.

Каково допущение о пропорциональных опасностях?

Допущение пропорциональных рисков жизненно важно для использования и интерпретации модели Кокса.

При таком предположении существует постоянная связь между результатом или зависимой переменной и вектором ковариации. Следствием этого предположения является то, что функции риска для любых двух людей пропорциональны в любой момент времени, а соотношение рисков не меняется со временем. Другими словами, если у человека есть риск смерти в какой-то начальный момент времени, который вдвое выше, чем у другого человека, то во все более поздние моменты времени риск смерти остается вдвое выше. Это предположение подразумевает, что кривые риска для групп должны быть пропорциональными и не должны пересекаться. Поскольку это предположение так важно, его обязательно нужно проверить.

Как вы проверяете предположение о пропорциональных рисках?

Существует множество методов, как графических, так и тестовых, для оценки обоснованности предположения о пропорциональных опасностях. Один из способов состоит в том, чтобы просто построить кривые выживаемости Каплана – Мейера, если вы сравниваете две группы без ковариант. Если кривые пересекаются, предположение о пропорциональных опасностях может быть нарушено. При проведении небольших исследований следует иметь в виду важное предостережение в отношении этого подхода. При оценке кривых выживаемости для исследований с малым размером выборки может быть большое количество ошибок, поэтому кривые могут пересекаться, даже если соблюдается предположение о пропорциональных рисках. Дополнительный логарифмический график представляет собой более надежный тест, который отображает логарифм отрицательного логарифма оцененной функции выживаемости против логарифма времени выживания. Если опасности для разных групп пропорциональны, на этом графике будут получены параллельные кривые. Другой распространенный метод проверки допущения о пропорциональности опасностей - это включение параметра временного взаимодействия, чтобы определить, изменяется ли HR с течением времени, поскольку время часто является виновником непропорциональности опасностей. Свидетельство того, что срок взаимодействия группа * время не равен нулю, свидетельствует против пропорциональных рисков.

Что, если предположение о пропорциональных рисках не выполняется?

Если вы обнаружите, что предположение PH не выполняется, вам не обязательно отказываться от использования модели Кокса. Есть варианты улучшения непропорциональности в модели. Например, вы можете включить в модель другие ковариаты, новые ковариаты, нелинейные члены для существующих ковариат или взаимодействия между ковариатами. Или вы можете стратифицировать анализ по одной или нескольким переменным. Это оценивает модель, в которой допускается различие исходной опасности в каждой страте, но ковариатные эффекты одинаковы для каждой страты. Другие варианты включают разделение времени на категории и использование индикаторных переменных, чтобы позволить соотношениям рисков изменяться во времени, а также изменение временной переменной анализа (например, от прошедшего времени к возрасту или наоборот).

Как вы проверяете соответствие полупараметрической модели?

Помимо проверки нарушений предположения о пропорциональности, необходимо изучить и другие аспекты соответствия модели. Статистические данные, аналогичные тем, которые используются в линейной и логистической регрессии, могут применяться для выполнения этих задач для моделей Кокса с некоторыми отличиями, но основные идеи одинаковы для всех трех параметров. Важно проверить линейность вектора ковариации, что можно сделать, исследуя остатки, так же, как мы это делаем в линейной регрессии. Однако остатки в данных TTE не так просты, как в линейной регрессии, отчасти потому, что значение результата для некоторых данных неизвестно, а остатки часто искажены. Было разработано несколько различных типов остатков для оценки соответствия модели Кокса данным TTE. Примеры включают, среди прочего, Мартингейл и Шенфельд. Вы также можете посмотреть на остатки, чтобы выявить очень важные и плохо подходящие наблюдения. Существуют также тесты согласия, специфичные для моделей Кокса, такие как тест Гроннесби и Боргана и прогностический индекс Хосмера и Лемешоу. Вы также можете использовать AIC для сравнения различных моделей, хотя использование R2 проблематично.

Зачем использовать параметрический подход?

Одним из основных преимуществ полупараметрических моделей является то, что не нужно указывать базовый риск для оценки отношений рисков, которые описывают различия в относительной опасности между группами. Однако может оказаться интересным сама оценка исходной опасности. В этом случае необходим параметрический подход. В параметрических подходах указываются как функция риска, так и влияние ковариат. Функция риска оценивается на основе предполагаемого распределения в основной популяции.

Преимущества использования параметрического подхода к анализу выживаемости:

  • Параметрические подходы более информативны, чем непараметрические и полупараметрические подходы. Помимо расчета оценок относительного эффекта, их также можно использовать для прогнозирования времени выживания, степени опасности, а также среднего и медианного времени выживания. Их также можно использовать для прогнозирования абсолютного риска с течением времени и построения кривых выживаемости с поправкой на ковариаты.

  • Когда параметрическая форма задана правильно, параметрические модели обладают большей мощностью, чем полупараметрические модели. Они также более эффективны, что приводит к меньшим стандартным ошибкам и более точным оценкам.

  • Параметрические подходы основаны на полной максимальной вероятности для оценки параметров.

  • Остатки параметрических моделей принимают знакомую форму разницы наблюдаемого и ожидаемого.

Основным недостатком параметрического подхода является то, что он основан на предположении, что основное распределение населения было правильно указано. Параметрические модели не устойчивы к ошибкам в спецификации, поэтому полупараметрические модели более распространены в литературе и менее опасны в использовании, когда существует неопределенность в отношении основного распределения населения.

Как выбрать параметрическую форму?

Выбор подходящей параметрической формы - самая сложная часть параметрического анализа выживаемости. Спецификация параметрической формы должна определяться гипотезой исследования, а также предшествующими знаниями и биологической достоверностью формы базовой опасности. Например, если известно, что риск смерти резко возрастает сразу после операции, а затем уменьшается и выравнивается, было бы неуместно указывать экспоненциальное распределение, которое предполагает постоянную опасность во времени. Данные можно использовать для оценки того, соответствует ли указанная форма данным, но эти методы, основанные на данных, должны дополнять, а не заменять выборки, основанные на гипотезах.

В чем разница между моделью пропорциональных опасностей и моделью ускоренного времени отказа?

Хотя модель пропорциональных рисков Кокса является полупараметрической, модели пропорциональных рисков также могут быть параметрическими. Параметрические модели пропорциональных опасностей можно записать как:

h (t, X) = h0 (t) ехр (Xi β) = h0 (t) λ

где базовый риск h0 (t) зависит только от времени t, но не от X, а λ - это зависящая от единицы функция ковариат, которая не зависит от t, которая масштабирует базовую функцию риска вверх или вниз. λ не может быть отрицательным. В этой модели уровень риска является мультипликативной функцией базового риска, а отношения рисков можно интерпретировать так же, как в полупараметрической модели пропорциональных опасностей.

Модели ускоренного времени отказа (AFT) - это класс параметрических моделей выживаемости, которые можно линеаризовать, взяв натуральный логарифм модели времени выживаемости. Простейшим примером модели AFT является экспоненциальная модель, которая записывается как:

ln (T) = β0 + β1X1 +…. + βpXp + ε *

Основное различие между моделями AFT и моделями PH заключается в том, что модели AFT предполагают, что эффекты ковариат мультипликативны по шкале времени, в то время как модели Кокса используют шкалу рисков, как показано выше. Оценки параметров из моделей AFT интерпретируются как эффекты на шкале времени, которые могут либо ускорять, либо замедлять время выживания. Exp (β)> 1 из модели AFT означает, что фактор ускоряет время выживания или приводит к более длительному выживанию. Опыт (β)<1 decelerates survival time (shorter survival). AFT models assume that estimated time ratios are constant across the time scale. A time ratio of 2, for example, can be interpreted as the median time to death in group 1 is double the median time to death in group 2 (indicated longer survival for group 1).

Некоторые распределения ошибок можно записать и интерпретировать как модели PH и AFT (например, экспоненциальные, Weibull), другие - только модели PH (например, Gompertz) или только модели AFT (например, лог-логистические), а другие не являются моделями PH или AFT. (т.е. установка шлицевого соединения).

Какие формы могут принимать параметрические модели?

Функция риска может принимать любую форму до тех пор, пока h (t)> 0 для всех значений t. Хотя в первую очередь при выборе параметрической формы следует учитывать предварительное знание формы базовой опасности, каждое распределение имеет свои преимущества и недостатки. Некоторые из наиболее распространенных форм будут кратко объяснены, а дополнительная информация доступна в списке ресурсов.

Экспоненциальное распределение

Экспоненциальное распределение предполагает, что h (t) зависит только от коэффициентов модели и ковариатов и является постоянным во времени. Основное преимущество этой модели состоит в том, что она является одновременно моделью пропорциональных опасностей и моделью ускоренного времени отказа, так что оценки воздействия могут интерпретироваться либо как отношения рисков, либо как отношения времени. Главный недостаток этой модели состоит в том, что часто неправдоподобно предполагать постоянную опасность с течением времени.

Распределение Вейбулла

Распределение Вейбулла похоже на экспоненциальное распределение. В то время как экспоненциальное распределение предполагает постоянный риск, распределение Вейбулла предполагает монотонный риск, который может либо увеличиваться, либо уменьшаться, но не одновременно. У него два параметра. Параметр формы (σ) определяет, увеличивается ли опасность (σ1) (в экспоненциальном распределении этот параметр установлен на 1). Параметр масштаба (1 / σ) exp (-β0 / σ) определяет масштаб этого увеличения / уменьшения. Поскольку распределение Вейбулла упрощается до экспоненциального распределения при σ = 1, нулевая гипотеза о том, что σ = 1, может быть проверена с помощью теста Вальда. Основным преимуществом этой модели является то, что она является одновременно моделью PH и AFT, поэтому можно оценить как отношения рисков, так и отношения времени. Опять же, главный недостаток состоит в том, что предположение о монотонности базового риска в некоторых случаях может быть неправдоподобным.

Gompertz Distribution

Распределение Гомпертца - это модель PH, которая равна распределению логарифма Вейбулла, поэтому логарифм функции риска линейен по t. Это распределение имеет экспоненциально увеличивающуюся частоту отказов и часто подходит для актуарных данных, поскольку риск смертности также экспоненциально возрастает с течением времени.

Логистическая дистрибуция

дом святой люси, выращенный волками

Логистическое распределение - это модель AFT с ошибкой, которая соответствует стандартному логистическому распределению. Он может соответствовать немонотонным опасностям и, как правило, лучше всего подходит, когда основная опасность возрастает до пика, а затем падает, что может быть правдоподобным для некоторых заболеваний, таких как туберкулез. Логистическое распределение - это не модель PH, а модель пропорциональных шансов. Это означает, что он зависит от предположения о пропорциональных шансах, но преимущество состоит в том, что коэффициенты наклона можно интерпретировать как временные отношения, а также как отношения шансов. Отношение шансов, равное 2, из параметрической лог-логистической модели, например, можно было бы интерпретировать как вероятность выживания за пределами времени t среди субъектов с x = 1 в два раза выше шансов среди субъектов с x = 0.

Обобщенное гамма-распределение (GG)

Обобщенное гамма-распределение (GG) - это фактически семейство распределений, которое содержит почти все наиболее часто используемые распределения, включая экспоненциальное, Вейбулловское, логнормальное и гамма-распределения. Это позволяет сравнивать различные распределения. Семейство GG также включает все четыре наиболее распространенных типа функций риска, что делает распределение GG особенно полезным, поскольку форма функции риска может помочь оптимизировать выбор модели.

Сплайновый подход

Поскольку единственным общим ограничением спецификации базовой функции риска является то, что h (t)> 0 для всех значений t, сплайны могут использоваться для максимальной гибкости при моделировании формы базовой опасности. Ограниченные кубические сплайны - это один из методов, который недавно был рекомендован в литературе для параметрического анализа выживаемости, поскольку этот метод допускает гибкость формы, но ограничивает линейность функции на концах, где данные разрежены. Сплайны могут использоваться для улучшения оценки, а также полезны для экстраполяции, поскольку они максимально подходят для наблюдаемых данных. При правильном указании оценки эффекта от моделей, подогнанных с использованием сплайнов, не должны быть искаженными. Как и в других регрессионных анализах, проблемы с подгонкой шлицев могут включать выбор количества и местоположения узлов, а также проблемы с чрезмерной подгонкой.

Как вы проверяете соответствие параметрической модели?

Наиболее важным компонентом оценки соответствия параметрической модели является проверка того, поддерживают ли данные указанную параметрическую форму. Это можно оценить визуально, построив график кумулятивного риска на основе модели в сравнении с оцененной функцией кумулятивного риска Каплана-Мейера. Если указанная форма верна, график должен проходить через начало координат с наклоном 1. Тест согласия Греннесби-Боргана также можно использовать для определения того, значительно ли наблюдаемое количество событий отличается от ожидаемого количества событий. в группах, дифференцированных по шкале риска. Этот тест очень чувствителен к количеству выбранных групп и имеет тенденцию слишком широко отвергать нулевую гипотезу адекватного соответствия, если выбирается много групп, особенно в небольших наборах данных. Однако тесту не хватает мощности для обнаружения нарушений модели, если выбрано слишком мало групп. По этой причине кажется нецелесообразным полагаться только на критерий согласия при определении разумности заданной параметрической формы.

AIC также можно использовать для сравнения моделей, запускаемых с различными параметрическими формами, причем самый низкий AIC указывает на лучшее соответствие. Однако AIC нельзя использовать для сравнения параметрических и полупараметрических моделей, поскольку параметрические модели основаны на наблюдаемых временах событий, а полупараметрические модели основаны на порядке времени событий. Опять же, эти инструменты следует использовать для проверки того, соответствует ли указанная форма данным, но достоверность указанной базовой опасности по-прежнему является наиболее важным аспектом выбора параметрической формы.

После того, как указанная параметрическая форма была определена, чтобы хорошо соответствовать данным, можно использовать методы, аналогичные тем, которые ранее были описаны для моделей полупропорциональной опасности, для выбора между различными моделями, такими как графики остатков и критерии согласия.

Что, если предикторы меняются со временем?

В описанных выше модельных утверждениях мы предположили, что воздействие будет постоянным в течение периода наблюдения. Воздействия со значениями, которые меняются с течением времени, или изменяющиеся во времени ковариаты, могут быть включены в модели выживания, изменив единицу анализа с индивидуума на период времени, когда воздействие является постоянным. Это разбивает человеко-время индивидов на интервалы, которые каждый человек вносит в набор рисков, подверженных и не подвергнутых воздействию для этой ковариаты. Основное предположение включения таким образом изменяющейся во времени ковариаты состоит в том, что эффект изменяющейся во времени ковариаты не зависит от времени.

Для модели пропорциональных рисков Кокса включение изменяющейся во времени ковариаты могло бы иметь форму: h (t) = h0 (t) e ^ β1x1 (t). Изменяющиеся во времени ковариаты также могут быть включены в параметрические модели, хотя это немного сложнее и труднее для интерпретации. Параметрические модели также могут моделировать изменяющиеся во времени ковариаты с использованием сплайнов для большей гибкости.

Обычно следует использовать изменяющиеся во времени ковариаты, когда предполагается, что риск больше зависит от более поздних значений ковариаты, чем от значения ковариаты на исходном уровне. Проблемы, возникающие с изменяющимися во времени ковариатами, включают отсутствие данных о ковариате в разные моменты времени и потенциальную погрешность в оценке риска, если изменяющаяся во времени ковариата на самом деле является посредником.

Что такое анализ конкурирующих рисков?

Традиционные методы анализа выживаемости предполагают, что происходит только один тип интересующего события. Однако существуют более продвинутые методы, позволяющие исследовать несколько типов событий в одном исследовании, например, смерть от нескольких причин. В этих исследованиях используется анализ конкурирующих рисков, в которых продолжительность выживания заканчивается первым из нескольких событий. Необходимы специальные методы, потому что анализ времени до каждого события в отдельности может быть необъективным. В частности, в этом контексте метод КМ имеет тенденцию переоценивать долю субъектов, переживающих события. В анализе конкурирующих рисков используется метод совокупной вероятности, в котором общая вероятность события в любой момент времени является суммой вероятностей конкретного события. Модели обычно реализуются путем ввода каждого участника исследования несколько раз - по одному для каждого типа события. Для каждого участника исследования время до любого события оценивается по времени, когда пациент пережил первое событие. Для получения дополнительной информации посетите страницу advancedepidemiology.org на конкурирующие риски .

Что такое модели хрупкости и почему они полезны для коррелированных данных?

Коррелированные данные о выживаемости могут возникать из-за повторяющихся событий, пережитых человеком, или когда наблюдения сгруппированы в группы. Либо из-за недостатка знаний, либо из-за осуществимости некоторые ковариаты, относящиеся к интересующему событию, могут не быть измерены. Модели хрупкости учитывают неоднородность, вызванную неизмеряемыми ковариатами, путем добавления случайных эффектов, которые мультипликативно действуют на функцию риска. Модели хрупкости по сути являются расширением модели Кокса с добавлением случайных эффектов. Хотя для описания этих моделей используются различные схемы классификации и номенклатура, четыре общих типа моделей хрупкости включают общую, вложенную, совместную и аддитивную хрупкость.

Есть ли другие подходы к анализу данных о повторяющихся событиях?

Данные о повторяющихся событиях коррелированы, поскольку в одном и том же субъекте может происходить несколько событий. Хотя модели хрупкости являются одним из методов учета этой корреляции при анализе повторяющихся событий, более простой подход, который также может учитывать эту корреляцию, - это использование устойчивых стандартных ошибок (SE). С добавлением надежных SE анализ повторяющихся событий может быть выполнен как простое расширение полупараметрических или параметрических моделей.

Несмотря на простоту реализации, существует несколько способов моделирования данных повторяющихся событий с использованием надежных SE. Эти подходы различаются тем, как они определяют набор рисков для каждого повторения. Таким образом, они отвечают на несколько разные вопросы исследования, поэтому выбор метода моделирования для использования должен основываться на гипотезе исследования и обоснованности допущений моделирования.

Процесс подсчета, или подход Андерсена-Гилла к моделированию повторяющихся событий, предполагает, что каждое повторение является независимым событием, и не принимает во внимание порядок или тип события. В этой модели время последующего наблюдения для каждого субъекта начинается в начале исследования и разбивается на сегменты, определяемые событиями (повторениями). Субъекты вносят свой вклад в набор рисков для события, пока они находятся под наблюдением (без цензуры). Эти модели легко вписываются в модель Кокса с добавлением надежной оценки SE, а отношения рисков интерпретируются как влияние ковариаты на частоту рецидивов в течение периода последующего наблюдения. Однако эта модель была бы неуместной, если предположение о независимости не является разумным.

Условные подходы предполагают, что субъект не подвергается риску последующего события, пока не произойдет предыдущее событие, и, следовательно, учитывает порядок событий. Они подбираются с использованием стратифицированной модели с номером события (или количеством повторений, в данном случае) в качестве переменной страты и включая надежные SE. Есть два разных условных подхода, которые используют разные временные шкалы и, следовательно, имеют разные наборы рисков. Подход с условной вероятностью использует время с начала исследования для определения временных интервалов и подходит, когда интерес проявляется в полном ходе процесса повторяющегося события. Подход с интервалом времени, по существу, сбрасывает часы для каждого повторения, используя время, прошедшее с момента предыдущего события, для определения временных интервалов, и он более уместен, когда представляют интерес оценки специфического для события (или повторения) эффекта.

Наконец, маргинальные подходы (также известные как подход WLW - Вей, Лин и Вайсфельд) рассматривают каждое событие как отдельный процесс, поэтому субъекты подвержены риску всех событий с самого начала наблюдения, независимо от того, испытали ли они предыдущее событие. Эта модель подходит, когда считается, что события являются результатом различных процессов, лежащих в основе, так что субъект может испытать, например, 3-е событие, но не испытать 1-е. Хотя это предположение кажется неправдоподобным с некоторыми типами данных, такими как рецидивы рака, его можно использовать для моделирования рецидивов травм в течение определенного периода времени, когда субъекты могут испытывать различные типы травм в течение периода времени, которые не имеют естественного порядка. Маржинальные модели также могут быть подогнаны с использованием стратифицированных моделей с устойчивыми SE.

Чтения

Этот проект был направлен на описание методологических и аналитических решений, с которыми можно столкнуться при работе с данными о времени до события, но он ни в коем случае не является исчерпывающим. Ниже приведены ресурсы для более глубокого изучения этих тем.

Учебники и главы

Виттингоф Э., Глидден Д.В., Шибоски С.К., Маккалок CE (2012). Методы регрессии в биостатистике, 2-й Нью-Йорк, Нью-Йорк: Springer.

  • Вводный текст к линейным моделям, моделям логистики, выживания и повторяющимся измерениям, лучше всего подходит для тех, кому нужна основная отправная точка.

  • В главе «Анализ выживаемости» дается хороший обзор, но не глубина. Примеры основаны на STATA.

Хосмер Д.В., Лемешоу С., Мэй С. (2008) Прикладной анализ выживаемости: регрессионное моделирование данных времени до события, 2-е изд. Хобокен, Нью-Джерси: John Wiley & Sons, Inc.

  • Углубленный обзор непараметрических, полупараметрических и параметрических моделей Кокса, лучший для тех, кто разбирается в других областях статистики. Подробно не рассматриваются передовые методы, но даются ссылки на другие учебники по специальностям.

Клейнбаум Д.Г., Кляйн М. (2012). Анализ выживания: самообучающийся текст, 3-е изд. Нью-Йорк, штат Нью-Йорк: Springer Science + Business Media, LLC

  • Отличный вводный текст

Klein JP, Moeschberger ML (2005). Анализ выживания: методы обработки цензурированных и усеченных данных, 2-е изд. Нью-Йорк, штат Нью-Йорк: Springer Science + Business Media, LLC

  • Эта книга, предназначенная для аспирантов, содержит множество практических примеров

Therneau TM, Grambsch PM (2000). Моделирование данных о выживании: расширение модели Кокса. Нью-Йорк, штат Нью-Йорк: Springer Science + Business Media, LLC

  • Хорошее введение в процесс подсчета и анализ коррелированных данных о выживаемости. Также автор написал пакет выживания на R

Эллисон П.Д. (2010). Анализ выживаемости с использованием SAS: Практическое руководство, 2-е изд. Кэри, Северная Каролина: Институт SAS

  • Отличный прикладной текст для пользователей SAS

Багдонавичюс В, Никулин М (2002). Модели ускоренной жизни: моделирование и статистический анализ. Бока-Ратон, Флорида: Chapman & Hall / CRC Press.

  • Хороший ресурс для получения дополнительной информации о параметрических и полупараметрических моделях ускоренного времени отказа и их сравнении с моделями пропорциональных опасностей.

Методические статьи

Вводные / обзорные статьи

Hougaard P (1999). Основы данных о выживании. Биометрия 55 (1): 13-22. PMID: 11318147 .

Кларк Т.Г., Брэдберн М.Дж., Лав С.Б., Альтман Д.Г. (2003). Анализ выживания, часть I: основные концепции и первые анализы. Br J Cancer 89 (2): 232-8. PMID: 12865907

Кларк Т.Г., Брэдберн М.Дж., Лав С.Б., Альтман Д.Г. (2003). Анализ выживаемости, часть II: многомерный анализ данных - введение в концепции и методы. Br J Cancer 89 (3): 431-6. PMID: 1288808

Кларк Т.Г., Брэдберн М.Дж., Лав С.Б., Альтман Д.Г. (2003). Анализ выживаемости, часть II: многомерный анализ данных - выбор модели и оценка ее адекватности и соответствия. Br J Cancer 89 (4): 605-11. PMID: 12951864

Кларк Т.Г., Брэдберн М.Дж., Лав С.Б., Альтман Д.Г. (2003). Анализ выживаемости, часть IV: дополнительные концепции и методы анализа выживаемости. Br J Cancer 89 (5): 781-6. PMID: 12942105

  • Цикл из четырех вышеперечисленных статей представляет собой отличный вводный обзор методов анализа выживаемости, который чрезвычайно хорошо написан и прост для понимания - настоятельно рекомендуется.

Возраст как шкала времени

Корн Э.Л., Граубард Б.И., Мидсюн Д. (1997). Промежуточный анализ продольного наблюдения за опросом: выбор шкалы времени. Am J Epidemiol 145 (1): 72-80. PMID: 8982025

  • Документ, в котором пропагандируется использование возраста в качестве шкалы времени, а не времени учебы.

Инграм Д.Д., Макук Д.М., Фельдман Дж.Дж. (1997). Re: Анализ времени до события для продольного наблюдения за опросом: выбор шкалы времени. Am J Epidemiol 146 (6): 528-9. PMID: 9290515 .

  • Прокомментируйте статью Korn, описывающую меры предосторожности при использовании возраста в качестве шкалы времени.

Thiébaut AC, Bénichou J (2004). Выбор шкалы времени в модельном анализе Кокса эпидемиологических когортных данных: имитационное исследование. Стат Мед 30; 23 (24): 3803-20. PMID: 15580597

  • Имитационное исследование, показывающее величину систематической ошибки для различных степеней связи между возрастом и интересующей ковариатой при использовании времени учебы в качестве шкалы времени.

Канчола А.Дж., Стюарт С.Л., Бернштейн Л. и др. Регрессия Кокса с использованием разных шкал времени. Доступны на: http://www.lexjansen.com/wuss/2003/DataAnalysis/i-cox_time_scales.pdf .

  • Хорошая статья, в которой сравниваются 5 регрессионных моделей Кокса с вариациями либо времени обучения, либо возраста в виде шкалы времени с кодом SAS.

Цензура

Хуанг Ц.Й., Нин Дж., Цинь Дж. (2015). Полупараметрический вывод правдоподобия для усеченных слева и подвергнутых цензуре справа данных. Биостатистика [epub] PMID: 25796430 .

  • Эта статья содержит хорошее введение в анализ данных, подвергнутых цензуре, и новую процедуру оценки распределения времени выживания с усеченными влево и цензурированными вправо данными. Он очень плотный и имеет расширенную статистическую направленность.

Каин К.К., Харлоу С.Д., Литтл Р.Дж., Нан Б., Йосеф М., Таффе-младший, Эллиотт М.Р. (2011). Смещение из-за усечения и цензуры слева в продольных исследованиях процессов развития и болезней. Am J Epidemiol 173 (9): 1078-84. PMID: 21422059 .

  • Отличный ресурс, который объясняет предвзятость, присущую данным, подвергнутым цензуре слева, с эпидемиологической точки зрения.

Сунь Дж., Сунь Л., Чжу С. (2007). Тестирование модели пропорциональных шансов для данных с интервальной цензурой. Lifetime Data Anal 13: 37–50. PMID 17160547 .

Какова политика Мексики в отношении абортов?
  • Еще одна статистически насыщенная статья о нюансах анализа данных TTE, но дает хорошее объяснение данных с интервальной цензурой.

Робинс Дж. М. (1995a) Аналитический метод для рандомизированных испытаний с информативной цензурой: Часть I. Анализ данных за всю жизнь 1: 241–254. PMID 9385104 .

Робинс Дж. М. (1995b) Аналитический метод для рандомизированных испытаний с информативным цензурированием: Часть II. Анализ данных за всю жизнь 1: 417–434. PMID 9385113 .

  • Две статьи, в которых обсуждаются методы работы с информативным цензурированием.

Непараметрические методы выживания

Борган Ø (2005) Оценщик Каплана-Мейера. Энциклопедия биостатистики DOI: 10.1002 / 0470011815.b2a11042

  • Отличный обзор оценки Каплана-Мейера и ее связи с оценкой Нельсона-Алена

Родригес Дж. (2005). Непараметрическая оценка в моделях выживания. Доступна с: http://data.princeton.edu/pop509/NonParametricSurvival.pdf

  • Введение в непараметрические методы и модель пропорциональных рисков Кокса, которая объясняет взаимосвязь между методами с помощью математических формул

Коул С.Р., Эрнан М.А. (2004). Скорректированные кривые выживаемости с обратными весами вероятности. Computing Methods Programs Biomed 75 (1): 35-9. PMID: 15158046

  • Описывает использование IPW для создания скорректированных кривых Каплана-Мейера. Включает пример и макрос SAS.

Чжан М. (2015). Надежные методы повышения эффективности и уменьшения систематической ошибки при оценке кривых выживаемости в рандомизированных клинических испытаниях. Анализ данных за всю жизнь 21 (1): 119-37. PMID: 24522498

  • Предлагаемый метод построения кривых выживаемости с поправкой на ковариату в РКИ

Полупараметрические методы выживания

Cox DR (1972) Модели регрессии и таблицы дожития (с обсуждением). J R Statist Soc B 34: 187–220.

  • Классическая ссылка.

Christensen E (1987) Многомерный анализ выживаемости с использованием регрессионной модели Кокса. Heepatology 7: 1346–1358. PMID 3679094 .

  • Описывает использование модели Кокса на мотивирующем примере. Отличный обзор ключевых аспектов анализа модели Кокса, включая то, как подобрать модель Кокса и проверку допущений модели.

Grambsch PM, Therneau TM (1994) Тесты и диагностика пропорциональных рисков, основанные на взвешенных остатках. Биометрика 81: 515–526.

  • Подробный документ о проверке предположения о пропорциональных рисках. Хорошее сочетание теории и расширенного статистического объяснения.

Ng’andu NH (1997) Эмпирическое сравнение статистических тестов для оценки допущения о пропорциональных опасностях модели Кокса. Stat Med 16: 611–626. PMID 9131751 .

  • Еще один подробный документ о проверке допущения о пропорциональных рисках, он включает обсуждение проверки остатков и эффектов цензуры.

Параметрические методы выживаемости

Родригес, Г. (2010). Параметрические модели выживания. Доступна с: http://data.princeton.edu/pop509/ParametricSurvival.pdf

  • краткое введение в наиболее распространенные распределения, используемые в параметрическом анализе выживаемости

Нарди А, Шемпер М (2003). Сравнение моделей Кокса и параметрических моделей в клинических исследованиях, Стат. Мед. 22 (23): 2597-610. PMID: 14652863

  • Предоставляет хорошие примеры сравнения полупараметрических моделей с моделями, использующими общие параметрические распределения, и фокусируется на оценке соответствия модели.

Ройстон П., Пармар МК (2002). Гибкие параметрические модели пропорциональных рисков и пропорциональных шансов для цензурированных данных о выживаемости с применением для прогностического моделирования и оценки эффектов лечения. Stat Med 21 (15): 2175-97. PMID: 12210632

  • Хорошее объяснение основ моделей пропорциональных рисков и шансов, а также сравнения с кубическими сплайнами

Кокс С., Чу Х., Шнайдер М.Ф., Муньос А. (2007). Параметрический анализ выживаемости и таксономия функций риска для обобщенного гамма-распределения. Статист Мед 26: 4352–4374. PMID 17342754 .

  • Предоставляет отличный обзор параметрических методов выживаемости, включая таксономию функций риска и подробное обсуждение семейства обобщенных гамма-распределения.

Кроутер MJ, Lambert PC (2014). Общая основа для параметрического анализа выживаемости. Stat Med 33 (30): 5280-97. PMID: 25220693

  • Описывает ограничительные допущения для часто используемых параметрических распределений и объясняет методологию ограниченного кубического сплайна.

Спарлинг YH, Юнес Н., Лачин JM, Баутиста OM (2006). Параметрические модели выживаемости для данных с интервальной цензурой с ковариатами, зависящими от времени. Биометрия 7 (4): 599-614. PMID: 16597670

  • Расширение и пример использования параметрических моделей с данными с интервальной цензурой

Ковариаты, зависящие от времени

Фишер Л.Д., Лин Д.Ю. (1999). Зависящие от времени ковариаты в регрессионной модели пропорциональных рисков Кокса. Анну Рев Общественное здравоохранение 20: 145-57. PMID: 10352854

  • Подробное и легкое для понимания объяснение изменяющихся во времени ковариат в моделях Кокса с математическим приложением

Петерсен Т. (1986). Подгонка параметрических моделей выживаемости с зависящими от времени ковариатами. Appl Statist 35 (3): 281-88.

  • Плотная статья, но с полезным прикладным примером

Анализ конкурирующих рисков

См. Конкурирующие риски

Tai B, Machin D, White I, Gebski V (2001) Анализ конкурирующих рисков у пациентов с остеосаркомой: сравнение четырех различных подходов. Stat Med 20: 661–684. PMID 11241570 .

  • Хороший подробный документ, в котором описаны четыре различных метода анализа данных о конкурирующих рисках и используются данные рандомизированного исследования пациентов с остеосаркомой для сравнения этих четырех подходов.

    как получить неограниченное количество монет в NBA Live Mobile

Чекли В., Брауэр Р., Муньос А. (2010). Вывод для взаимоисключающих конкурирующих событий посредством смеси обобщенных гамма-распределений. Эпидемиология 21 (4): 557–565. PMID 20502337 .

  • Статья о конкурирующих рисках с использованием обобщенного гамма-распределения.

Анализ сгруппированных данных и моделей уязвимости

Yamaguchi T, Ohashi Y, Matsuyama Y (2002) Модели пропорциональных рисков со случайными эффектами для изучения центральных эффектов в многоцентровых клинических испытаниях рака. Stat Methods Med Res 11: 221–236. PMID 12094756 .

  • Статья с отличным теоретическим и математическим объяснением учета кластеризации при анализе данных о выживаемости из многоцентровых клинических испытаний.

О’Куигли Дж., Стэр Дж. (2002) Модели пропорциональных опасностей со слабостями и случайными эффектами. Stat Med 21: 3219–3233. PMID 12375300 .

  • Прямое сравнение моделей слабости и моделей со случайными эффектами.

Балакришнан Н., Пэн Ю. (2006). Обобщенная гамма-модель неустойчивости. Статист Мед. 25: 2797–2816. PMID

  • Статья о моделях хрупкости, использующих обобщенное гамма-распределение в качестве распределения хрупкости.

Рондо V, Мазруи Y, Гонсалес JR (2012). frailtypack: пакет R для анализа коррелированных данных о выживаемости с моделями хрупкости с использованием оценки правдоподобия или параметрической оценки. Журнал статистического программного обеспечения 47 (4): 1-28.

  • Виньетка из пакета R с хорошей справочной информацией о хрупких моделях.

Шаубель Д.Е., Цай Дж. (2005). Анализ кластеризованных данных о повторяющихся событиях с приложением к частоте госпитализации среди пациентов с почечной недостаточностью Биостатистика 6 (3): 404-19. PMID 15831581 .

  • Отличная статья, в которой авторы представляют два метода анализа данных сгруппированных повторяющихся событий, а затем сравнивают результаты предложенных моделей с результатами, основанными на нестабильной модели.

Гарибванд Л., Лю Л. (2009). Анализ данных о выживании с кластеризованными событиями. SAS Global Forum 2009 Paper 237-2009.

  • Краткий и простой для понимания источник для анализа данных о времени до события с кластеризованными событиями с помощью процедур SAS.

Анализ повторяющихся событий

Twisk JW, Smidt N, de Vente W. (2005). Прикладной анализ повторяющихся событий: практический обзор. J Epidemiol Community Health 59 (8): 706-10. PMID: 16020650

  • Очень простое для понимания введение в моделирование повторяющихся событий и концепцию наборов рисков

Виллегас Р., Хулиа О., Оканья Дж. (2013). Эмпирическое исследование коррелированного времени выживания для повторяющихся событий с пропорциональными границами рисков и эффектом корреляции и цензуры. BMC Med Res Methodol 13:95. PMID: 23883000

  • Использует моделирование для проверки устойчивости различных моделей к данным о повторяющихся событиях.

Келли П.Дж., Лим Л.Л. (2000). Анализ выживаемости для данных о повторяющихся событиях: приложение к детским инфекционным заболеваниям. Стат. Мед. 19 (1): 13-33. PMID: 10623190

  • Прикладные примеры четырех основных подходов к моделированию данных повторяющихся событий

Вэй Л.Дж., Линь Д.Й., Вайсфельд Л. (1989). Регрессионный анализ многомерных данных о времени неполного отказа путем моделирования маржинальных распределений. Журнал Американской статистической ассоциации 84 (108): 1065-1073

Оригинальная статья с описанием маргинальных моделей для анализа повторяющихся событий.

Курсы

Летний институт эпидемиологии и здоровья населения Колумбийского университета (EPIC)

Statistical Horizons, частный провайдер специализированных статистических семинаров, проводимых экспертами в данной области.

  • Пятидневный семинар по истории событий и анализу выживаемости, проводимый с 15 по 19 июля 2015 года в Филадельфии, проводит Пол Эллисон. Никаких предварительных знаний об анализе выживаемости не требуется. Для получения дополнительной информации см. http://statisticalhorizons.com/seminars/public-seminars/eventhistory13

Летняя программа Межуниверситетского консорциума политических и социальных исследований (ICPSR) по количественным методам социальных исследований, часть Института социальных исследований Мичиганского университета

  • 3-дневный семинар по анализу выживаемости, моделированию истории событий и анализу продолжительности, который проводится 22-24 июня 2015 года в Беркли, Калифорния, проводит Тенко Райков из Университета штата Мичиган. Всесторонний обзор методов выживания в различных дисциплинах (не только в области общественного здравоохранения): http://www.icpsr.umich.edu/icpsrweb/sumprog/courses/0200

Институт статистических исследований предлагает два онлайн-курса по анализу выживаемости, которые проводятся несколько раз в год. Эти курсы основаны на учебнике прикладного анализа Кляйна и Кляйнбаума (см. Ниже) и могут быть пройдены по меню или как часть программы сертификации по статистике:

  • Введение в анализ выживаемости с акцентом на полупараметрические модели Кокса, преподаваемые Дэвидом Клейнбаумом или Мэттом Стриклендом: http://www.statistics.com/survival/

  • Расширенный анализ выживаемости, включая параметрические модели, анализ рецидивов и модели слабости, преподанный Мэттом Стриклендом: http://www.statistics.com/survival2/

Институт цифровых исследований и образования Калифорнийского университета в Лос-Анджелесе предлагает на своем веб-сайте так называемые семинары по анализу выживаемости с использованием различных статистических программ. Эти семинары демонстрируют, как проводить прикладной анализ выживаемости, уделяя больше внимания коду, чем теории.

Интересные статьи

Выбор редакции

Как обеспечить финансирование музыкального образования в государственных школах
Как обеспечить финансирование музыкального образования в государственных школах
Ища источники финансирования, учителя могут заложить основу для предоставления передовой учебной программы следующему поколению музыкантов.
Джон Кристофер Депп II против News Group Newspapers Ltd. и Дэна Вуттона
Джон Кристофер Депп II против News Group Newspapers Ltd. и Дэна Вуттона
Columbia Global Freedom of Expression направлена ​​на углубление понимания международных и национальных норм и институтов, которые наилучшим образом защищают свободный поток информации и выражения мнений во взаимосвязанном глобальном сообществе, которому необходимо решать основные общие проблемы. Для достижения своей миссии Global Freedom of Expression проводит и поручает исследованиям и политическим проектам, организует мероприятия и конференции, а также участвует и вносит свой вклад в глобальные дискуссии о защите свободы слова и информации в 21 веке.
Келлен Р. Функ
Келлен Р. Функ
Келлен Р. Функ - историк права, специализирующийся на гражданском процессе и средствах правовой защиты. Он писал об истории практики гражданского судопроизводства в США, развитии и реформировании американской системы освобождения под залог, а также юридических процессах церквей и религиозных групп. Функ присоединился к юридическому факультету Колумбийского университета в 2018 году после получения докторской степени. по американской истории в Принстонском университете, где он был научным сотрудником Портера Огдена Якоба. Его первая книга, Кодекс юристов, будет опубликована издательством Oxford University Press в 2020 году. В ней исследуется, как принятие в 1848 году Полевого кодекса штата Нью-Йорк сформировало сферу американского гражданского судопроизводства, объединив право и справедливость, ускорив использование средств правовой защиты кредиторами и предоставив верховенство адвокатов над правилами судебного разбирательства. Стипендия Фанка сочетает в себе методы исторических исследований с наукой о данных, и он пилотирует проект по оцифровке бумажных документов почти по каждому гражданскому делу, возбужденному в округе Нью-Йорк в XIX веке. Он получил премию Гарольда Бермана от Секции права и религии Американской ассоциации юридической школы за свою статью в 2017 году в Journal of Law & Religion, церковных корпорациях и конфликте законов в довоенной Америке.
United States Telecom Association против FCC
United States Telecom Association против FCC
Columbia Global Freedom of Expression стремится к углублению понимания международных и национальных норм и институтов, которые наилучшим образом защищают свободный поток информации и выражения мнений во взаимосвязанном глобальном сообществе, которому необходимо решать основные общие проблемы. Для достижения своей миссии Global Freedom of Expression проводит и поручает исследованиям и политическим проектам, организует мероприятия и конференции, а также участвует и вносит свой вклад в глобальные дискуссии о защите свободы слова и информации в 21 веке.
Томас В. Меррилл
Томас В. Меррилл
Один из наиболее цитируемых ученых-юристов в Соединенных Штатах, Томас Меррилл преподает и пишет, среди прочего, об административном, конституционном и имущественном праве. Опыт Меррилла в государственном и частном секторах лежит в основе его педагогических и исследовательских работ. После клерка главного судьи Дэвида Л. Базелона в Апелляционном суде США по округу округа Колумбия и судьи Гарри А. Блэкмана в Верховном суде США, Меррил был заместителем генерального солиситора Министерства юстиции США и сотрудником фирмы. компании Sidley & Austin LLP, где он также работал советником более 20 лет. Он написал научные статьи и несколько информационных бюллетеней Верховного суда о том, когда и какой вес суды должны придавать административное толкование права в различных контекстах. Он является соавтором (с Генри Смит) сборников прецедентов «Собственность: принципы и политика» и «Оксфордские введения в законодательство США: собственность». Среди его основополагающих журнальных статей - Оптимальная стандартизация в праве собственности: принцип Numerus Clausus о роли информационных затрат в структуре права собственности и The Origins of the American Public Trust Doctrine: What Really Happened in Illinois Central о роли общественности. права собственности на развитие набережной Чикаго. На праздновании 125-й годовщины 2-го Окружного апелляционного суда США Меррилл прочитал ежегодную лекцию о руках и выступил с докладом на тему «Обученная рука» и «Статутное толкование: теория и практика». В настоящее время он является со-репортером отчета Американского юридического института о собственности и заканчивает работу над книгой (с Джозефом Кирни) по истории района Чикаго Лейкфронт под предварительным названием Lakefront: общественное доверие и частное право в Чикаго ( Корнелл У. Пресс). Помимо Колумбийского университета, Меррилл работал на факультетах Северо-западной школы права и Йельской школы права. Он является членом Американского института права и Американской академии искусств и наук.
Паола Коссермелли Мессина
Паола Коссермелли Мессина
Паола Коссермелли Мессина - звукорежиссер и звукорежиссер с исследовательскими интересами, которые находятся на пересечении музыки, политики и пола. В качестве менеджера проекта Sound Thinking NYC, программы CUNY-Creative Arts Team, она недавно заинтересовалась связью ее работы в области музыки и технологий с инициативами в области образования. Она имеет степень бакалавра искусств. в музыке
Блог библиотеки журналистики
Блог библиотеки журналистики