Учитывая широко распространенный и эффективный характер пандемии коронавирусной болезни 2019 года (COVID-19), было разработано множество моделей для прогнозирования различных показателей заболевания, таких как количество ожидаемых инфекций и связанных с ними госпитализаций, что позволяет медицинским службам подготовиться к таким вспышкам. В статье, недавно загруженной на сервер препринтов medRxiv, описана простая модель с возможностью прогнозирования вероятного числа госпитализаций по COVID-19 в краткосрочной перспективе, требующая меньше входной информации и генерирующая более точные прогнозы, чем другие модели.
Ранние модели, разработанные на начальных этапах пандемии COVID-19, как правило, были сосредоточены на оценке воздействия немедикаментозных вмешательств. Напротив, разработанная здесь модель, называемая COVID Near Term, предназначена для прогнозирования числа больниц COVID-19 на две – четыре недели в будущем.
Авторы намеревались создать модель прогнозирования, которая позволила бы избежать многих из этих источников изменчивости, вместо этого полагаясь на данные, полученные в больницах, такие как тенденции поступления в последние недели, чтобы установить вероятность вспышки COVID-19.
Число людей, госпитализированных с COVID-19, как и с другими инфекционными заболеваниями, следует экспоненциальному росту и снижению. Группа начала с того, что представила это математически, где сегодняшние госпитализации кратны вчерашним дням плюс вероятность случайной ошибки.
Набор обучающих данных был использован для определения коэффициента умножения и взвешивания данных, чтобы более тщательно учитывать самые последние наблюдения. В конечном счете, это позволило группе оценить будущие показатели госпитализации на основе предыдущего ежедневного приема, когда темпы увеличения или снижения являются репрезентативными для предстоящей или прошлой вспышки.
Чтобы проверить валидность модели COVID Near Term, группа сравнила ее с моделью CalCAT, ранее использовавшейся на ранних стадиях пандемии. Данные из шести округов района залива в период с 4 мая 2020 года по 14 июня 2020 года были использованы в качестве учебного набора для разработки прогнозов через две, три и четыре недели в дополнение к долгосрочному прогнозу состояния больниц 1 мая 2021 года.
Затем прогноз, полученный с помощью модели, был сопоставлен с фактическими числами на эти даты, что позволило установить точность модели. 14-дневные прогнозы имели среднюю процентную погрешность 16-36% во всех шести округах и 34-54% в течение четырех недель. Наименьшая разница между прогнозируемыми и фактическими цифрами всегда была в наиболее густонаселенном округе с наибольшим размером выборки, в то время как наибольшие ошибки всегда были в наименее населенном округе.
Ошибки в модели CalCAT были значительно больше, чем в модели COVID Near Term. Например, в округе Санта-Клара первое из них привело к ошибкам в 31%, 42% и 58% за одну, две и три недели соответственно. Для сравнения, последнее дало только 16%, 23% и 34% ошибок в соответствующий момент времени.
Группа также сравнила несколько других моделей краткосрочного прогнозирования с использованием того же набора данных, обнаружив, что другие методы в некоторых случаях дают более точные результаты. Однако из 18 сравнений COVID Near Term был наиболее точным в десяти случаях, демонстрируя, что данные о поступлении в больницу могут быть использованы для моделирования случаев COVID-19 в краткосрочной перспективе, по крайней мере, так же эффективно, как и другие источники данных, такие как широко распространенное традиционное тестирование для определения скорости передачи в сообществе. Информацией поделился портал News-Medical.