Program Makan Bergizi Gratis (MBG) menjadi topik hangat berita nasional ketika artikel ini ditulis. Namun, artikel ini tidak akan membahas program itu melainkan topik yang serupa, yaitu tentang pangan. Secara lebih khusus, artikel ini akan menyingkap pola konsumsi pangan penduduk Indonesia per provinsi dengan menggunakan analisis komponen utama (AKU) atau principal component analysis (PCA). Kita awali pembahasannya dengan mengenal apa itu AKU.
Sekilas Tentang AKU
AKU merupakan sebuah metode untuk menganalisis data yang titik-titik datanya dideskripsikan dengan beberapa variabel kuantitatif yang saling berkorelasi. Tujuan AKU adalah untuk:
mengekstrak informasi yang paling penting dari data;
memampatkan ukuran data dengan menyimpan informasi yang penting saja;
menyederhanakan deskripsi dari data; dan
menganalisis struktur dari titik-titik data dan variabel-variabelnya.
Untuk mencapai tujuan-tujuan tersebut, AKU menghitung variabel-variabel baru yang dinamakan komponen utama (principal component). Komponen utama yang pertama dibuat agar memiliki variansi atau inersia sebesar mungkin. Alhasil, komponen ini akan menjelaskan atau mengekstrak sebagian besar dari variansi data. Komponen utama yang kedua dihitung agar tegak lurus dengan komponen utama yang pertama dan memiliki variansi sebesar mungkin. Komponen-komponen utama berikutnya dihitung dengan cara yang serupa. Ringkasnya, komponen utama yang pertama didesain agar dapat menjelaskan variansi data sebesar mungkin, sedangkan komponen-komponen utama berikutnya menjelaskan variansi sisanya (yang tidak dijelaskan komponen utama yang pertama).
Jika kamu ingin melihat bagaimana ide mendasar AKU, silakan kunjungi media-media interaktif pada laman berikut: Analisis Komponen Utama: Bagaimana Ide Dasarnya? dan Eksplorasi Analisis Komponen Utama, lihat Gambar 1.
Media interaktif yang ditunjukkan pada Gambar 1 (a) akan memandumu untuk memahami AKU, khususnya terkait penentuan komponen-komponen utamanya, dengan pendekatan geometris. Media yang ditunjukkan pada Gambar 1 (b) mengajakmu untuk mengeksplorasi AKU secara lebih lanjut.
Konsumsi Pangan Penduduk Indonesia
Kembali ke tujuan awal, selanjutnya kita mengaplikasikan AKU untuk menyingkap pola konsumsi penduduk Indonesia berdasarkan jenis pangan mulai dari tahun 2018 sampai 2024. Untuk melakukannya, kita menggunakan data dari Badan Pangan Nasional yang tersedia di satudata.badanpangan.go.id. Data ini menunjukkan nilai rata-rata konsumsi, dalam kg/kapita/tahun, penduduk Indonesia tiap provinsi berdasarkan jenis pangan pada tahun 2018 sampai 2024. Jenis-jenis pangan tersebut merupakan variabel-variabel kuantitatif yang akan kita selidiki. Variabel tersebut ada delapan, yaitu Buah/biji berminyak
, Gula
, Kacang-kacangan
, Minyak dan Lemak
, Padi-Padian
, Pangan Hewani
, Sayuran dan buah
, dan Umbi-umbian
.
Gambar 2 menunjukkan visualisasi hasil AKU terhadap data tersebut. Gambar 2 (a) menunjukkan komponen-komponen utama yang dihasilkan beserta dengan besarnya variansi data yang dapat dijelaskan oleh masing-masing komponen tersebut. Dari gambar tersebut kita dapat melihat bahwa KU1 (komponen utama pertama) dapat menjelaskan variansi terbesar, diikuti dengan KU2. Dengan demikian, selanjutnya kita gunakan dua komponen utama ini untuk menginterpretasi data. Secara total, kedua komponen utama tersebut dapat menjelaskan 44,35% variansi dalam data.
Gambar 2 (b) menyajikan arah dan kekuatan hubungan antara variabel-variabel asli dan dua komponen utama yang pertama: KU1 dan KU2. Misalnya, variabel Sayuran dan buah
mengarah ke kiri atas. Artinya, variabel ini memiliki korelasi negatif dengan UK1 tetapi positif dengan UK2. Panjang panah menunjukkan besarnya korelasi. Meskipun sama-sama berkorelasi negatif dengan KU1, Sayuran dan buah
korelasi lebih kuat dibandingkan dengan Kacang-kacangan
. Tanda-tanda panah variabel tersebut juga menunjukkan korelasi antarvariabel:
jika tanda-tanda panahnya searah, variabel-variabel yang direpresentasikannya memiliki korelasi yang positif, misalnya antara
Gula
danPangan Hewani
;jika berlawanan arah, variabel-variabelnya berkorelasi negatif, misalnya antara
Padi-Padian
danUmbi-umbian
; danjika tegak lurus, variabel-variabelnya tidak berkorelasi, misalnya
Gula
danBuah/biji berminyak
.
Selain untuk melihat korelasi, Gambar 2 (b) sangat berguna untuk menginterpretasi apa yang disajikan Gambar 2 (c). Gambar tersebut menyajikan proyeksi titik-titik data pada bidang AKU. Untuk menginterpretasi titik-titik data pada Gambar 2 (c) dengan Gambar 2 (b) secara lebih mudah, kita terlebih dahulu mengidentifikasi pencilan-pencilan datanya. Perhatikan Gambar 3!
Berdasarkan Gambar 3, kita dapat melihat bahwa titik “2018_Kalimantan Tengah” berada jauh dari kumpulan titik-titik lainnya, sehingga titik tersebut merupakan pencilan. Selain itu, titik tersebut searah dengan tanda panah variabel-variabel Gula
dan Pangan Hewani
, perhatikan kembali Gambar 2 (b). Dengan demikian, Provinsi Kalimantan Tengah pada tahun 2018 konsumsi pangannya pada kategori Gula
atau Pangan Hewani
lebih tinggi dari rerata provinsi-provinsi lainnya. Interpretasi yang serupa dapat kita lakukan untuk titik “2023_Papua”. Kita dapat menginterpretasi bahwa rerata konsumsi Provinsi Papua pada tahun 2023 untuk kategori Umbi-umbian
lebih besar daripada provinsi-provinsi lainnya. Untuk mengkonfirmasi interpretasi tersebut, kita dapat membandingkannya dengan provinsi-provinsi lain yang bukan pencilan, misalnya “2020_Sumatera Barat” dan “2021_Jawa Timur”. Perhatikan Gambar 4!
Gambar 4 mengkonfirmasi interpretasi kita sebelumnya:
Rata-rata konsumsi pangan Provinsi Kalimantan Tengah pada tahun 2018 di kategori
Pangan Hewani
danGula
lebih besar dari provinsi-provinsi lainnya. Karena kedua variabel tersebut berkorelasi negatif denganSayuran dan buah
(lihat Gambar 2 (b)), rata-rata konsumsiSayuran dan buah
provinsi ini di tahun 2018 lebih rendah dibandingkan provinsi-prinvinsi lainnya.Rata-rata konsumsi pangan Provinsi Papua pada tahun 2023 di kategori
Umbi-umbian
lebih besar dari provinsi-provinsi lainnya. Berdasarkan Gambar 3, hal ini juga terjadi untuk tahun-tahun 2018, 2019, 2021, dan 2024. Karena variabel tersebut berkorelasi negatif denganPadi-Padian
(lihat Gambar 2 (b)), konsumsiPadi-Padian
provinsi Papua cenderung lebih rendah dibandingkan provinsi-provinsi lainnya.
Lebih lanjut, kita dapat melihat perubahan pola konsumsi pangan dari tahun ke tahun untuk provinsi tertentu. Misalnya, mari kita selidiki pola konsumsi pangan untuk Provinsi Kalimantan Timur. Perubahannya dapat kita lihat pada Gambar 5.
Gambar 5 memperlihatkan bagaimana titik yang merepresentasikan Provinsi Kalimantan Timur pada bidang AKU bergerak dari Kuadran III, kemudian ke Kuadran IV (yang searah dengan Minyak dan Lemak
) pada tahun 2023, dan berhenti di Kuadran I (yang berlawanan arah dengan Padi-Padian
, lihat kembali Gambar 2 (b)) pada tahun 2024. Dengan demikian, kita dapat menginterpretasi bahwa konsumsi pangan provinsi ini pada kategori Minyak dan Lemak
bertambah mulai tahun 2023, tetapi konsumsi pada kategori Padi-Padian
berkurang.
Untuk mengkonfirmasi interpretasi ini, kita dapat membuat diagram batang konsumsi pangan per kategorinya untuk Provinsi Kalimantan Timur pada tahun 2019 (sebagai perwakilan lima tahun pertama yang tersedia di data), 2023, dan 2024. Perhatikan Gambar 6!
Gambar 6 menunjukkan secara jelas bahwa konsumsi penduduk Kalimantan Timur bertambah pada kategori Minyak dan Lemak
tetapi berkurang pada kategori Padi-Padian
mulai tahun 2023. Hal ini mengkonfirmasi interpretasi kita terhadap Gambar 5.
Catatan Akhir
Kita telah mengenal metode statistika multivariat yang ampuh untuk mereduksi dimensi data, yaitu AKU. Hal ini kita lakukan pada Bagian 1. Metode ini kita gunakan untuk mereduksi dimensi data rata-rata konsumsi penduduk Indonesia, yang awalnya memiliki delapan variabel kuantitatif menjadi dua komponen utama saja. Dengan hanya menggunakan dua komponen utama tersebut, kita tetap masih dapat melihat struktur titik-titik data dan variabel-variabelnya. Misalnya dalam Bagian 2, kita menemukan hal-hal menarik tentang titik-titik pencilan dalam data, khususnya untuk Provinsi Kalimantan Tengah pada tahun 2018 dan Provinsi Papua pada Tahun 2023. Selain itu, dengan hanya dua komponen utama saja, kita dapat melihat perubahan konsumsi pangan Provinsi Kalimantan Timur dari tahun ke tahun, seperti yang ditunjukkan pada Gambar 5 dan Gambar 6.
Apa selanjutnya? Untuk menjawab pertanyaan ini, baik kalau kita kembali ke bagian paling awal artikel ini, yaitu tentang program MBG. Mungkin 2 – 5 tahun ke depan kita dapat menggunakan AKU untuk menyelidiki dampak program tersebut terhadap konsumsi pangan penduduk Indonesia. Hal ini bukannya tanpa tantangan. Untuk melakukannya, kita memerlukan data yang lebih detail, khususnya terkait dengan penggolongan penduduk (misalnya dari segi usia) karena tidak semua penduduk Indonesia terdampak (secara langsung) program tersebut. Meskipun demikian, menilik data kependudukan dari BPS, sasaran program tersebut cukup besar. Dengan demikian, tak ada salahnya jika kita tetap melihat dampaknya meskipun kesulitan mengakses data yang lebih detail. Tak hanya melihat pola konsumsi berdasarkan jenis pangannya, tetapi baik juga jika kita melihat hal-hal lain yang lebih detail dan relevan, seperti konsumsi energi dan protein.