O abordare cluster bazată pe date reale pentru țări pe baza indicelui fericirii
Autor:Aditya Chakraborty și Chris P Tsokos
JEL:C00, C02, C19, C40, C49, C65, Y91, Y10
DOI:10.24818/EA/2021/S15/1031
Cuvinte cheie:algoritmi de grupare, bunăstare subiectivă (SWB), măsuri de stabilitate, algoritmi de clasificare a învățării automate
Abstract:
În literatura de învățare automată și știința datelor, clusterizarea are rolul de a împărți observațiile (punctele de date) în mai multe categorii în așa fel încât punctele de date care se încadrează într-un grup sunt diferite de punctele de date care se încadrează în celelalte grupuri, astfel încât în cadrul unui grup este minimizată și variația dintre grupuri este maximizată. Acst tip de abordare se încadrează în clasa tehnicilor de învățare nesupravegheată. Este în primul rând un instrument de clasificare a indivizilor pe baza asemănării și diferențierii dintre ei. Prezentul nostru studiu utilizează datele despre fericirea mondială din 156 de țări colectate pe baza sondajul GallupWorld. Studiul nostru propune cel mai precis (dacă nu chiar cel mai bun) algoritm de grupare cu un grad foarte ridicat de acuratețe pentru a clasifica diferite țări ale lumii pe baza mai multor indicatori economici și sociali. Cel mai potrivit algoritm de grupare a fost selectat pe baza diferitelor metode statistice. De asemenea, continuăm să clasăm primele zece țări din fiecare dintre cele trei clustere în funcție de scorul lor de fericire. Cele mai performante trei țări în ceea ce privește fericirea din grupul 1 (fericire medie), grupul 2 (fericire ridicată) și grupul 3 (fericire scăzută) sunt Oman, Danemarca și, respectiv, Guyana, urmate de Emiratele Arabe Unite, Finlanda și Pakistan . În cele din urmă, folosim patru algoritmi populari de clasificare a învățării automate pentru a valida algoritmul nostru bazat pe cluster și am obținut rezultate foarte consistente cu o precizie ridicată.