Menghitung Akurasi Dengan Confusion Matrix

MATIIN LAUGIWA PRAWIRA PUTRA
3 min readJul 15, 2020

--

السَّلاَمُ عَلَيْكُمْ وَرَحْمَةُ اللهِ وَبَرَكَاتُهُ

Hallo Scientist Muda

kali ini penulis akan membahas sedikit apa itu Confussion Matrix dan bagaimana cara menghitung akurasi menggunakan Confussion Matrix dan apasaja komponen yang terdapat pada Confission Matrix tersebut.

Apa itu Confusion Matrix ?

Confussion Matrix merupakan suatu metode yang umum digunakan dalam melakukan perhitungan akurasi pada konsep Data Mining. Confusion Matrix digambarkan dengan tabel yang menyatakan jumlah data uji yang benar diklasifikasikan dan jumlah data uji yang salah diklasifikasikan.

Gambaran Confusion Matrix

untuk lebih jelasnya langsung aja kita cek gambarannya

Gambaran Confusion Matrix

seperti itulah kira-kira gambaran Confusion Matrix yang biasanya digunakan dalam hasil klasifikasi yang terdiri dari 10 komponen yang bisa saya gambarkan. dari setiap komponen tersebut memiliki penjelasannya masing-masing:

  • True Positives: merupakan jumlah record data positive yang diklasifikasikan sebagai nilai positive
  • False Positive: Merupakan jumlah record data negative yang diklasifikasikan sebagai nilai salah positive
  • False Negatives: Merupakan jumlah record data positive yang diklasifikasikan sebagai negative
  • True Negatives: Merupakan jumlah record data negative yang diklasifikasikan sebagai nilai negative

dari setiap nilai positive dan negative kita dapat melakukan perhitungan akurasi sebuah mesin. Akurasi merupakan jumlah record data yang diklasifikasikan (diprediksi) secara benar oleh algoritma yang digunakan. rumus yang digunakan dalam perhitungan akurasi adalah seperti berikut:

Dari hasil perhitungan tersebut kita dapat mengetahui seberapa besar akurasi yang dihasilkan oleh algoritma yagn digunakan tentu nilai akurasi tersebut kisarannya 0 hingga 1 bila dijadikan persentase menjadi 0 hingga 100%, artinya semakin tinggi nilai akurasi maka akan baiksebuah algoritma.

Tapi, hati-hati karena bukan hanya akurasi penentu seberapa baik algoritma yang digunakan banyak yang perlu diperhatikan akurasi hanya sebgaian kecil dari hal tersebut untuk lebih jelasnya ikuti tulisan saya berikutnya :)

Selanjutnya adalah bagaimana perhitungan Missclassification (Error) Rate, merupakan persentase jumlah record data yangdi prediksi secara salah oleh algoritma yagn digunakan. rumus yang digunakan dalam perhitungan Missclassification adalah:

Perhitungan missclassifikasi tersebut akan membuat kita mengetahui seberapa buruk model kita dalam melakukan prediksi, tentu saja para Scientist menginginkan nilai terkecil untuk Missclassification ini.

Segitu dulu ya Scientist muda untuk pembahasan Confusion Matrix kita kali ini, nantikan terus tulisan saya selanjutnya ya :)))

Reference

https://www.researchgate.net/publication/321714182_Klasifikasi_Untuk_Diagnosa_Diabetes_Menggunakan_Metode_Bayesian_Regularization_Neural_Network_RBNN

--

--

No responses yet