
Which Machine Learning method for outbreaks predictions?
Publié
dans : In 2021 IEEE
11th Annual Computing and Communication Workshop and Conference (CCWC) (pp.
825-828).
DOI : 10.1109/CCWC51732.2021.9376061
Indexé dans : IEEE; Scopus ; DBLP;
Abstact:
African swine fever (ASF), dengue fever, influenza, norovirus disease are names of outbreaks that have taken some parts of the world by surprise and caused several deaths.
The advent of coronavirus disease at the end of 2019 is clear proof that the issue of outbreaks is more topical than ever. The Machine Learning (ML) comes to the rescue of medicine by offering predictive analysis methods to predict the reappearance of outbreaks and thus help the healthcare system and decisionmakers to take the necessary measures in advance. But which ML method should be used to predict an outbreak? Given the large number of ML methods, it is sometimes difficult to know which method to use.
This is why we
conducted this study. We looked at the above-mentioned outbreaks and identified
the following ML methods as the most commonly used: LR, C4.5, NB, SVM, ANN and
RF. Of these six methods, the random forest method (RF) stands out from the
others because it was used in all four outbreaks considered, has the best
accuracy for two outbreaks (ASF and dengue fever) and has been designated by
several independent researchers as the most suitable ML method for outbreak
prediction.
Résumé :
La peste porcine Africaine, la dengue, la grippe, la maladie à norovirus sont des noms des épidémies qui ont pris de court certaines régions du globe et ont causé plusieurs morts. L’avènement de la maladie à coronavirus en fin 2019 est une preuve évidente que la question des épidémies est plus que jamais d’actualité.
Le Machine Learning (ML) vient au secours de la médecine en proposant des méthodes d’analyse prédictive afin de prédire la réapparition des épidémies et ainsi aider le corps soignant et les décideurs à prendre d’avance les mesures nécessaires. Mais quelle méthode ML utiliser pour prédire une épidémie ? Face au grand nombre des méthodes ML, il est parfois difficile de savoir quelle méthode utiliser. C’est pour répondre à cette problématique que nous avons mené cette étude.
Nous avons considéré les
épidémies précitées et avons identifié les méthodes ML suivantes comme étant
les plus utilisées : LR, C4.5, NB, SVM, ANN et RF. De ces six méthodes, la
méthode random forest (RF) se démarque des autres parce qu’elle a été utilisée
dans toutes les quatre épidémies considérées, elle a la meilleure précision
pour deux épidémies (la PPA et la dengue) et a été désignée par plusieurs
chercheurs indépendants comme étant la plus adaptée pour la prédiction des
épidémies.