Klasifikasi Status Bekerja Individu di Provinsi Banten Tahun 2020 dengan Menggunakan Metode LASSO dan Adaptive LASSO

Pardomuan Robinson Sihombing, Khairil Anwar Notodiputro, Bagus Sartono

Abstract


Penelitian ini bertujuan membandingkan metode LASSO dan Adaptive LASSO dengan penggunaan imbalanced data pada regresi binary logistik.  Studi kasus yang digunakan adalah pemodelan klasifikasi status bekerja individu di Provinsi Banten tahun 2020. Hasil yang didapat performa LASSO maupun Adaptive LASSO memberikan hasil yang sama baiknya. Dengan mempertimbangkan berbagai kriteria performa dalam accuracy, sensitivity dan specificity, maka model terbaik adalah model LASSO dengan simulasi data balanced 60 persen dan 40 persen dengan nilai masing-masing sebesar 79,16 persen; 80.29 persen dan 68,75 persen. Terdapat beberapa paradoks/anomali dalam hasil penelitian di antaranya peluang status tidak bekerja seseorang menurut lokasi tempat tinggal, gender dan pendidikan. Status disabilitas masih menjadi masalah dalam mencari pekerjaan. Semakin banyak anggota rumah tangga maka akan semakin tinggi peluangnya berstatus tidak bekerja. Semakin tinggi usia seseorang maka akan semakin kecil peluangnya berstatus tidak bekerja. Peluang status tidak bekerja seseorang yang menikah lebih kecil daripada yang belum/tidak kawin

Keywords


adaptive, imbalanced, lasso, logistik, regresi

Full Text:

PDF

References


Ardiansyah, M., Notodiputro, K. A., & Sartono, B. (2020). Peningkatan Presisi Dugaan Berat Gabah Melalui Proses Seleksi Peubah Dalam Pembelajaran Mesin Statistika. Prosiding Seminar Nasional VARIANSI , (pp. 171-183).

Cahyono, S. A. (2017, Desember ). Penyandang Disabilitas: Menelisik Layanan Rehabilitasi Sosial Difabel Pada Keluarga Miskin. Media Informasi Penelitian Kesejahteraan Sosial, 41(3), 239-254.

Dhanani. (2004). Unemployment and Underemployment in Indonesia,. Switzeland: International Labour Office.

Fan, J., & Li, R. (2001). Variable Selection via Nonconcave Penalized Likelihood and Its Oracle Properties. Journal of the American Statistical Association, 96, 1348–1360.

Han, Jiawei, Kamber, M., & Pei, J. (2012). Data Mining: Concepts and Techniques 3rd Edition. Massachusetts: Elsevier Inc.

King, G., & Zeng, L. (2001). Logistic Regression in Rare Events Data. Journal of Political Analysis, 9(2), 137-163.

Maalouf, M., & Trafalis, T. (2011). Rare Events and Imbalanced Datasets: An Overview. . Int. Journal Data Mining, Modelling and Management, 3(4), 375-385.

Meinshausen, N., & Bühlmann, P. (2006). High-dimensional graphs and variable selection with the lasso. Annals of statistics, 34(3), 1436-1462.

Mutiadanu, S., Adry, M. R., & Putri, D. Z. (2018, November). Analisis Sosial Ekonomi Terhadap Pengangguran Muda. Ecosains, 7(2), 89-98.

Nisbet, Robert, Elder, J., & Miner, G. ( 2009). Handbook of Statistical Analysis and Data. California: Elsevier Inc.

Pasay, N., & Indrayanti, R. (2012). Pengangguran, Lama Mencari Kerja, dan Reservation Wage Tenaga Kerja Terdidik. Jurnal Ekonomi danPembangunan Indonesia , 12(2), 116-135.

Putranto, N., Silvianti, P., & Soleh, A. M. (2017). Klasifikasi Data Curah Hujan Menggunakan Metode Regresi Logistik dengan Teknik Lasso, Stepwise dan Komponen Utama. Skripsi, Statistika. Bogor: IPB. Retrieved from http://repository.ipb.ac.id/handle/123456789/88901

Sumarsono, S. (2003). Ekonomi Manajemen Sumber Daya Manusia dan Ketenaga kerjaan. Yogyakarta: Graha Ilmu.

Tibshirani, R. (1996). Regression Shrinkage and Selection Via the Lasso. Journal of the Royal Statistical Society, 58(1), 267–288. Retrieved from https://www.jstor.org/stable/2346178

Yuliatin, Huseno, T., & Febriani. (2011, Mei). Pengaruh Karakteristik Kependudukan Terhadap Pengangguran di Sumatera Barat. Jurnal Manajemen dan Kewirausahaan, 2(2).

Zou, H. (2006). The Adaptive Lasso and Its Oracle Properties. Journal of the American Statistical Association, 101(476), 1418-1429.




DOI: https://doi.org/10.29313/jstat.v21i1.7810

Refbacks

  • There are currently no refbacks.


Copyright Notice

Creative Commons License
STATISTIKA is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License