Pertanyaan
Misalkan dipunyai 100 data testing dengan dua buah label yang akan coba di prediksi labelnya oleh mesin , kemudian akan dibandingkan dengan label sebenarnya dari 100 data tersebut . Hasilnya adalah sebagai berikut: Ada 60 data dengan label '1' (positif)yang berhasil diprediksi '1' (positif)juga oleh mesin dan ada 20 data dengan label 'O' (negatif) yang berhasil diprediksi 'O' (negatif)juga oleh mesin . Selanjutny a, ada 12 data dengan label '0' (negatif)yang diprediksi '1' positif oleh mesin dan ada 8 data dengan label 11 (positif)yang diprediksi 'O' (negatif)oleh mesin .Guna mengetahui seberapa akurat mesin dalam melakukan klasifikasi dengan
Solusi
Jawaban
Dari data yang diberikan, kita dapat menghitung beberapa metrik untuk mengukur akurasi mesin klasifikasi. Berikut perhitungannya:**1. Matriks Konfusi:**Pertama, kita buat matriks konfusi untuk memvisualisasikan hasil prediksi:| | Prediksi Positif ('1') | Prediksi Negatif ('0') | Total ||-------------|-----------------------|-----------------------|-------|| **Aktual Positif ('1')** | 60 | 8 | 68 || **Aktual Negatif ('0')** | 12 | 20 | 32 || **Total** | 72 | 28 | 100 |**2. Akurasi:**Akurasi mengukur proporsi prediksi yang benar dari seluruh prediksi.Akurasi = (Jumlah prediksi benar) / (Total jumlah prediksi) = (60 + 20) / 100 = 0.8 atau 80%**3. Presisi:**Presisi mengukur proporsi prediksi positif yang benar dari semua prediksi positif.Presisi = (Jumlah prediksi positif yang benar) / (Total jumlah prediksi positif) = 60 / (60 + 12) = 60/72 ≈ 0.833 atau 83.3%**4. Recall (Sensitivity):**Recall mengukur proporsi aktual positif yang berhasil diprediksi dengan benar.Recall = (Jumlah prediksi positif yang benar) / (Total jumlah aktual positif) = 60 / (60 + 8) = 60/68 ≈ 0.882 atau 88.2%**5. F1-Score:**F1-score adalah rata-rata harmonik presisi dan recall. Ini memberikan keseimbangan antara presisi dan recall.F1-Score = 2 * (Presisi * Recall) / (Presisi + Recall) = 2 * (0.833 * 0.882) / (0.833 + 0.882) ≈ 0.857 atau 85.7%**Kesimpulan:**Mesin klasifikasi memiliki akurasi 80%. Namun, melihat presisi (83.3%), recall (88.2%), dan F1-score (85.7%), kita dapat melihat kinerja yang lebih rinci. Presisi yang tinggi menunjukkan bahwa ketika mesin memprediksi positif, prediksinya cenderung benar. Recall yang tinggi menunjukkan bahwa mesin berhasil mengidentifikasi sebagian besar kasus positif yang sebenarnya. F1-score memberikan gambaran keseluruhan yang seimbang dari kinerja model. Interpretasi dari metrik-metrik ini bergantung pada konteks masalah dan kepentingan relatif dari presisi dan recall. Misalnya, dalam deteksi penyakit, recall yang tinggi (mengurangi false negative) mungkin lebih penting daripada presisi yang tinggi.