Прем Пурсвани, Пушпак Гупта и Махеш Шарма (CogniAIm Inc)

Въведение

Случаите на COVID-19 продължават да нарастват с всеки изминал ден и това завладява обществото ни. Прогнозирането на бъдещи случаи на COVID-19 ще играе основна роля в подпомагането на правителствата, здравните работници и политиците, които отговарят за реагирането на такива пандемии и които оптимизират грижите за общностите, които обслужват.

Нововъзникващите технологии и методологии като машинното обучение са изключително полезни при прогнозиране чрез прогнозно моделиране за целенасочени усилия за обществено здравеопазване и за намаляване на заболеваемостта и смъртността. CogniAIm Inc., компания със седалище в Далас, Тексас, използва модели за машинно обучение и епидемиология, за да предвиди въздействието на COVID-19 в Индия. Тази статия обяснява избора на подходящи модели за машинно обучение и епидемиология, прогнозни резултати въз основа на анализ на данни.

Прогнози

Фигура 1 показва тенденцията на нарастване на COVID-19, започнала в началото на февруари. Броят на потвърдените положителни случаи нарасна рязко през април и май и продължава да расте с много по-високи темпове сега. Според нашите прогнози общият брой на потвърдените случаи се очаква да нарасне през май, юни и юли, преди да се стабилизира до края на юли, нараствайки с по-бавни темпове след юли. Прогнозираната инфлексна точка ще бъде на 29 юли с 444 132 потвърдени случая. Кривата ще започне да излиза на плато след 29 юли с малко над 468 000 общо случая през септември. Фигурата също сравнява отчетената крива на потвърдените случаи на COVID-19 (в зелено) и кривата на прогнозиране (в червено).

Такива прогнози ще бъдат валидни, ако всички други влиятелни кофактори останат постоянни за прогнозирания период. Моделът отчита строгите превантивни мерки, които са въведени за намаляване на процента на инфекцията, разпоредбите за ранно откриване чрез тестване и скрининг, изолиране на положителни случаи с бърз медицински отговор и намаляване на смъртността. Всяка промяна в тези променливи може да повлияе на прогнозите по положителен или отрицателен начин.

Фигура 2 показва анализа на тенденциите, който прогнозира броя на новите потвърдени случаи. Фигурата също така показва, че пикът ще настъпи на 7 юни с 6618 нови случая за един ден, последван от други високи пикове в определени дни.

Прецизността при прогнозирането на моделирането е особено важна и до голяма степен зависи от избора на подходящи инструменти, променливи и надеждни набори от данни. Тестването на точността на прогнозите чрез сравняване на съществуващата и прогнозираната информация е от решаващо значение. Ако променливостта на данните е 5 процента или по-малко, прогнозите могат да се считат за валидни и избраният математически модел е подходящ. Аналитичният екип на CogniAim Inc. също сравни разликата между прогнозите и действителните докладвани тенденции, за да проучи променливостта и точността на прогнозния анализ. Резултатите отговарят на критериите, споменати по-горе (‹5%) в този анализ.

Фигура 3 показва анализа на докладваните потвърдени нови случаи и смъртни случаи, дължащи се на COVID19. Това беше използвано за прогнозно моделиране за прогнозиране на бъдещия растеж на случаите на COVID-19.

Методология

Изследователи от CogniAIm Inc. използваха модел на машинно обучение (епидемиология) (модел SEIR) за прогнозиране на пандемия от COVID19, за да открият как тези резултати могат да помогнат и да подкрепят вземащите решения в криза на общественото здраве като COVID19.

Модел SEIR — SEIR (S =Податливи случаи E= Изложени случаи I= Инфектирани случаи R=Възстановени случаи): сумата от тях е еквивалентна на общото население в изследваната география. Този модел е избран, защото позволява разделяне на населението въз основа на специфични за заболяването фази, което е идеално за прогнозиране на епидемии и тяхното разпространение.

Източници на данни

Данните са получени от Джон Хопкинс – Центърът за системни науки и
инженерство (CSSE), набор от данни за открити изследвания на COVID-19 (CORD-19) и други хранилища, базирани на общността. Променливите включват кумулативния брой потвърдени случаи на COVID19, активни случаи, възстановени случаи и смъртни случаи в Индия.

Заключение

В заключение, по време на пандемията от COVID19 моделирането и прогнозирането на бъдещи случаи, както е показано по-горе, допринесоха за жизненоважни прозрения за тежестта на огнищата и ще продължат да ни насочват при бъдещи предизвикателства. Тези резултати показват как техниките за машинно обучение и математическите модели могат да бъдат използвани за извършване на усъвършенствани анализи по по-ефективен начин и с много по-бързи темпове, като се използват нововъзникващи данни.

Индия е втората по население страна в света с население от около 1,3 милиарда души. Централното правителство работи с правителствата на съответните щати и властите предприемат сериозни мерки за прилагане на социално дистанциране и се опитват да овладеят инфекцията, тъй като страната преминава към 4-та фаза на блокиране. Тези прогнози помагат на експертите по обществено здравеопазване да вземат чувствителни към времето решения, планове за готовност при бедствия, целево разпределение на ресурси за конкретни фази и обществено образование, основано на данни, за намаляване на заболеваемостта и смъртността.

Референции

https://www.cogniaim.com
https://systems.jhu.edu
https://github.com/CSSEGISandData/COVID-19/
https://www. kaggle.com/c/covid19-global-forecasting-week-4/data
https://datacatalog.worldbank.org/dataset/population-estimates-and-projections

Тази работа беше извършена в рамките на инициативата на общността COVID-19 на CogniAIm Inc и не бяха включени финансови интереси от никоя страна.