Analysis of Mortality-Based Global Health Metrics: A Principle Component Analysis (PCA) – K-Means Approach to Country-Level Data


Önder G., Uslu Y., Önder E., Tüzün Ü.

Alphanumeric Journal, vol.12, no.2, pp.75-106, 2024 (Peer-Reviewed Journal)

  • Publication Type: Article / Article
  • Volume: 12 Issue: 2
  • Publication Date: 2024
  • Journal Name: Alphanumeric Journal
  • Journal Indexes: TR DİZİN (ULAKBİM)
  • Page Numbers: pp.75-106
  • Istanbul Medipol University Affiliated: Yes

Abstract

Abstract

In this study, principal component analysis and the k-means algorithm were employed for the analysis of Mortality-Based Global Health Metrics. The aim of this study is to create homogeneous clusters of countries in terms of MortalityBased Global Health Metrics, to identify similar countries within clusters using within-cluster exploratory data analysis methods, and to investigate the common characteristics of these countries. At the country level, a dataset comprising 34 indicators was compiled. However, due to the curse of dimensionality inherent in machine learning, the dataset was reduced to 6 principal components through principal component analysis (PCA). Countries were then clustered into 6 groups using the K-means clustering analysis method. The elbow method and silhouette method were utilized for optimal cluster selection. The cluster information resulting from dimensionality reduction analysis and clustering analysis can serve as a valuable input for policymakers in healthcare, particularly regarding cluster centroids and the countries constituting each cluster. Healthcare policymakers for each country can develop much more rational policies in their decisionmaking processes by evaluating their own countries, other countries within the same cluster, the characteristic features of their own clusters, and the distances to successful cluster centroids. This enables better examination of positive and negative indicators in country comparisons.

Keywords: Health, Mortality, World Development Indicators, Principal Component Analysis, Clustering

Özet

Bu çalışmada, Ölümlülüğe Dayalı Küresel Sağlık Ölçütlerinin analizi için temel bileşenler analizi ve k-ortalamalar algoritması kullanılmıştır. Bu çalışmanın amacı, Ölümlülüğe Dayalı Küresel Sağlık Ölçütleri açısından homojen ülke kümeleri oluşturmak, küme içi keşfedici veri analizi yöntemlerini kullanarak kümeler içindeki benzer ülkeleri belirlemek ve bu ülkelerin ortak özelliklerini araştırmaktır. Ülke düzeyinde 34 göstergeden oluşan bir veri seti derlenmiştir. Ancak, makine öğreniminin doğasında bulunan boyutluluk laneti nedeniyle, veri seti temel bileşen analizi (PCA) yoluyla 6 temel bileşene indirgenmiştir. Ülkeler daha sonra K-ortalamalar kümeleme analizi yöntemi kullanılarak 6 grupta kümelenmiştir. Optimum küme seçimi için dirsek yöntemi ve siluet yöntemi kullanılmıştır. Boyut indirgeme analizi ve kümeleme analizinden elde edilen küme bilgileri, özellikle küme merkezleri ve her bir kümeyi oluşturan ülkelerle ilgili olarak sağlık alanındaki politika yapıcılar için değerli bir girdi olarak hizmet edebilir. Her ülke için sağlık politika yapıcıları kendi ülkelerini, aynı kümede yer alan diğer ülkeleri, kendi kümelerinin karakteristik özelliklerini ve başarılı küme merkezlerine olan uzaklıklarını değerlendirerek karar alma süreçlerinde çok daha rasyonel politikalar geliştirebilirler. Bu da ülke karşılaştırmalarında olumlu ve olumsuz göstergelerin daha iyi irdelenmesini sağlar.

Anahtar Kelimeler: Sağlık, Ölümlülük, Dünya Kalkınma Göstergeleri, Temel Bileşen Analizi, Kümeleme