Analisis Komponen Utama

Menyingkap Konsumsi Pangan Penduduk Indonesia

Analisis Komponen Utama (AKU) merupakan metode statistika multivariat yang ampuh untuk mereduksi dimensi data. Artikel ini mendemonstrasikan penggunaan metode tersebut untuk menyelidiki pola konsumsi pangan Indonesia yang awalnya memiliki delapan variabel kuantitatif. Dengan AKU, dimensi data tersebut tereduksi secara signifikan tetapi strukturnya relatif tidak banyak berubah.
statistik nasional
studi kasus
pangan
Pengarang
Afiliasi
Terbit

October 6, 2025

Kata kunci

analisis data eksploratif, analisis komponen utama, reduksi dimensi, pangan, statistika multivariat, visualisasi data

Program Makan Bergizi Gratis (MBG) menjadi topik hangat berita nasional ketika artikel ini ditulis. Namun, artikel ini tidak akan membahas program itu melainkan topik yang serupa, yaitu tentang pangan. Secara lebih khusus, artikel ini akan menyingkap pola konsumsi pangan penduduk Indonesia per provinsi dengan menggunakan analisis komponen utama (AKU) atau principal component analysis (PCA). Kita awali pembahasannya dengan mengenal apa itu AKU.

Sekilas Tentang AKU

AKU merupakan sebuah metode untuk menganalisis data yang titik-titik datanya dideskripsikan dengan beberapa variabel kuantitatif yang saling berkorelasi. Tujuan AKU adalah untuk:

  • mengekstrak informasi yang paling penting dari data;

  • memampatkan ukuran data dengan menyimpan informasi yang penting saja;

  • menyederhanakan deskripsi dari data; dan

  • menganalisis struktur dari titik-titik data dan variabel-variabelnya.

Untuk mencapai tujuan-tujuan tersebut, AKU menghitung variabel-variabel baru yang dinamakan komponen utama (principal component). Komponen utama yang pertama dibuat agar memiliki variansi atau inersia sebesar mungkin. Alhasil, komponen ini akan menjelaskan atau mengekstrak sebagian besar dari variansi data. Komponen utama yang kedua dihitung agar tegak lurus dengan komponen utama yang pertama dan memiliki variansi sebesar mungkin. Komponen-komponen utama berikutnya dihitung dengan cara yang serupa. Ringkasnya, komponen utama yang pertama didesain agar dapat menjelaskan variansi data sebesar mungkin, sedangkan komponen-komponen utama berikutnya menjelaskan variansi sisanya (yang tidak dijelaskan komponen utama yang pertama).

Menyingkap Ide Mendasar AKU

Jika kamu ingin melihat bagaimana ide mendasar AKU, silakan kunjungi media-media interaktif pada laman berikut: Analisis Komponen Utama: Bagaimana Ide Dasarnya? dan Eksplorasi Analisis Komponen Utama, lihat Gambar 1.

Tangkapan layar media interaktif untuk menemukan ide mendasar Analisis Komponen Utama (AKU) secara geometris.
(a) Analisis Komponen Utama: Bagaimana Ide Dasarnya?
Tangkapan layar media interaktif untuk mengeksplorasi Analisis Komponen Utama (AKU).
(b) Eksplorasi Analisis Komponen Utama
Gambar 1: Media-media interaktif untuk mengenal AKU

Media interaktif yang ditunjukkan pada Gambar 1 (a) akan memandumu untuk memahami AKU, khususnya terkait penentuan komponen-komponen utamanya, dengan pendekatan geometris. Media yang ditunjukkan pada Gambar 1 (b) mengajakmu untuk mengeksplorasi AKU secara lebih lanjut.

Konsumsi Pangan Penduduk Indonesia

Kembali ke tujuan awal, selanjutnya kita mengaplikasikan AKU untuk menyingkap pola konsumsi penduduk Indonesia berdasarkan jenis pangan mulai dari tahun 2018 sampai 2024. Untuk melakukannya, kita menggunakan data dari Badan Pangan Nasional yang tersedia di satudata.badanpangan.go.id. Data ini menunjukkan nilai rata-rata konsumsi, dalam kg/kapita/tahun, penduduk Indonesia tiap provinsi berdasarkan jenis pangan pada tahun 2018 sampai 2024. Jenis-jenis pangan tersebut merupakan variabel-variabel kuantitatif yang akan kita selidiki. Variabel tersebut ada delapan, yaitu Buah/biji berminyak, Gula, Kacang-kacangan, Minyak dan Lemak, Padi-Padian, Pangan Hewani, Sayuran dan buah, dan Umbi-umbian.

Gambar 2 menunjukkan visualisasi hasil AKU terhadap data tersebut. Gambar 2 (a) menunjukkan komponen-komponen utama yang dihasilkan beserta dengan besarnya variansi data yang dapat dijelaskan oleh masing-masing komponen tersebut. Dari gambar tersebut kita dapat melihat bahwa KU1 (komponen utama pertama) dapat menjelaskan variansi terbesar, diikuti dengan KU2. Dengan demikian, selanjutnya kita gunakan dua komponen utama ini untuk menginterpretasi data. Secara total, kedua komponen utama tersebut dapat menjelaskan 44,35% variansi dalam data.

(a) Variansi yang dijelaskan oleh setiap komponen utama
(b) Hubungan antara variabel dan dua komponen utama dalam bidang AKU
(c) Proyeksi titik-titik data (provinsi per tahun) pada bidang AKU
Gambar 2: Visualisasi hasil AKU

Gambar 2 (b) menyajikan arah dan kekuatan hubungan antara variabel-variabel asli dan dua komponen utama yang pertama: KU1 dan KU2. Misalnya, variabel Sayuran dan buah mengarah ke kiri atas. Artinya, variabel ini memiliki korelasi negatif dengan UK1 tetapi positif dengan UK2. Panjang panah menunjukkan besarnya korelasi. Meskipun sama-sama berkorelasi negatif dengan KU1, Sayuran dan buah korelasi lebih kuat dibandingkan dengan Kacang-kacangan. Tanda-tanda panah variabel tersebut juga menunjukkan korelasi antarvariabel:

  • jika tanda-tanda panahnya searah, variabel-variabel yang direpresentasikannya memiliki korelasi yang positif, misalnya antara Gula dan Pangan Hewani;

  • jika berlawanan arah, variabel-variabelnya berkorelasi negatif, misalnya antara Padi-Padian dan Umbi-umbian; dan

  • jika tegak lurus, variabel-variabelnya tidak berkorelasi, misalnya Gula dan Buah/biji berminyak.

Selain untuk melihat korelasi, Gambar 2 (b) sangat berguna untuk menginterpretasi apa yang disajikan Gambar 2 (c). Gambar tersebut menyajikan proyeksi titik-titik data pada bidang AKU. Untuk menginterpretasi titik-titik data pada Gambar 2 (c) dengan Gambar 2 (b) secara lebih mudah, kita terlebih dahulu mengidentifikasi pencilan-pencilan datanya. Perhatikan Gambar 3!

Gambar 3: Proyeksi data pada bidang AKU dengan pemberian label untuk titik-titik pencilan

Berdasarkan Gambar 3, kita dapat melihat bahwa titik “2018_Kalimantan Tengah” berada jauh dari kumpulan titik-titik lainnya, sehingga titik tersebut merupakan pencilan. Selain itu, titik tersebut searah dengan tanda panah variabel-variabel Gula dan Pangan Hewani, perhatikan kembali Gambar 2 (b). Dengan demikian, Provinsi Kalimantan Tengah pada tahun 2018 konsumsi pangannya pada kategori Gula atau Pangan Hewani lebih tinggi dari rerata provinsi-provinsi lainnya. Interpretasi yang serupa dapat kita lakukan untuk titik “2023_Papua”. Kita dapat menginterpretasi bahwa rerata konsumsi Provinsi Papua pada tahun 2023 untuk kategori Umbi-umbian lebih besar daripada provinsi-provinsi lainnya. Untuk mengkonfirmasi interpretasi tersebut, kita dapat membandingkannya dengan provinsi-provinsi lain yang bukan pencilan, misalnya “2020_Sumatera Barat” dan “2021_Jawa Timur”. Perhatikan Gambar 4!

Gambar 4: Perbandingan konsumsi per jenis pangan

Gambar 4 mengkonfirmasi interpretasi kita sebelumnya:

  • Rata-rata konsumsi pangan Provinsi Kalimantan Tengah pada tahun 2018 di kategori Pangan Hewani dan Gula lebih besar dari provinsi-provinsi lainnya. Karena kedua variabel tersebut berkorelasi negatif dengan Sayuran dan buah (lihat Gambar 2 (b)), rata-rata konsumsi Sayuran dan buah provinsi ini di tahun 2018 lebih rendah dibandingkan provinsi-prinvinsi lainnya.

  • Rata-rata konsumsi pangan Provinsi Papua pada tahun 2023 di kategori Umbi-umbian lebih besar dari provinsi-provinsi lainnya. Berdasarkan Gambar 3, hal ini juga terjadi untuk tahun-tahun 2018, 2019, 2021, dan 2024. Karena variabel tersebut berkorelasi negatif dengan Padi-Padian (lihat Gambar 2 (b)), konsumsi Padi-Padian provinsi Papua cenderung lebih rendah dibandingkan provinsi-provinsi lainnya.

Lebih lanjut, kita dapat melihat perubahan pola konsumsi pangan dari tahun ke tahun untuk provinsi tertentu. Misalnya, mari kita selidiki pola konsumsi pangan untuk Provinsi Kalimantan Timur. Perubahannya dapat kita lihat pada Gambar 5.

Gambar 5: Perubahan konsumsi pangan pada Provinsi Kalimantan Timur dari tahun 2018 sampai 2024

Gambar 5 memperlihatkan bagaimana titik yang merepresentasikan Provinsi Kalimantan Timur pada bidang AKU bergerak dari Kuadran III, kemudian ke Kuadran IV (yang searah dengan Minyak dan Lemak) pada tahun 2023, dan berhenti di Kuadran I (yang berlawanan arah dengan Padi-Padian, lihat kembali Gambar 2 (b)) pada tahun 2024. Dengan demikian, kita dapat menginterpretasi bahwa konsumsi pangan provinsi ini pada kategori Minyak dan Lemak bertambah mulai tahun 2023, tetapi konsumsi pada kategori Padi-Padian berkurang.

Untuk mengkonfirmasi interpretasi ini, kita dapat membuat diagram batang konsumsi pangan per kategorinya untuk Provinsi Kalimantan Timur pada tahun 2019 (sebagai perwakilan lima tahun pertama yang tersedia di data), 2023, dan 2024. Perhatikan Gambar 6!

Gambar 6: Konsumsi pangan Provinsi Kalimantan Timur per kategorinya pada tahun 2019, 2023, dan 2024.

Gambar 6 menunjukkan secara jelas bahwa konsumsi penduduk Kalimantan Timur bertambah pada kategori Minyak dan Lemak tetapi berkurang pada kategori Padi-Padian mulai tahun 2023. Hal ini mengkonfirmasi interpretasi kita terhadap Gambar 5.

Catatan Akhir

Kita telah mengenal metode statistika multivariat yang ampuh untuk mereduksi dimensi data, yaitu AKU. Hal ini kita lakukan pada Bagian 1. Metode ini kita gunakan untuk mereduksi dimensi data rata-rata konsumsi penduduk Indonesia, yang awalnya memiliki delapan variabel kuantitatif menjadi dua komponen utama saja. Dengan hanya menggunakan dua komponen utama tersebut, kita tetap masih dapat melihat struktur titik-titik data dan variabel-variabelnya. Misalnya dalam Bagian 2, kita menemukan hal-hal menarik tentang titik-titik pencilan dalam data, khususnya untuk Provinsi Kalimantan Tengah pada tahun 2018 dan Provinsi Papua pada Tahun 2023. Selain itu, dengan hanya dua komponen utama saja, kita dapat melihat perubahan konsumsi pangan Provinsi Kalimantan Timur dari tahun ke tahun, seperti yang ditunjukkan pada Gambar 5 dan Gambar 6.

Apa selanjutnya? Untuk menjawab pertanyaan ini, baik kalau kita kembali ke bagian paling awal artikel ini, yaitu tentang program MBG. Mungkin 2 – 5 tahun ke depan kita dapat menggunakan AKU untuk menyelidiki dampak program tersebut terhadap konsumsi pangan penduduk Indonesia. Hal ini bukannya tanpa tantangan. Untuk melakukannya, kita memerlukan data yang lebih detail, khususnya terkait dengan penggolongan penduduk (misalnya dari segi usia) karena tidak semua penduduk Indonesia terdampak (secara langsung) program tersebut. Meskipun demikian, menilik data kependudukan dari BPS, sasaran program tersebut cukup besar. Dengan demikian, tak ada salahnya jika kita tetap melihat dampaknya meskipun kesulitan mengakses data yang lebih detail. Tak hanya melihat pola konsumsi berdasarkan jenis pangannya, tetapi baik juga jika kita melihat hal-hal lain yang lebih detail dan relevan, seperti konsumsi energi dan protein.

Kembali ke atas

Penggunaan Kembali