Pertanyaan
Dalam tahap preprocessing data, Anda menemukan bahwa beberapa fitur memiliki missing values . Pilihan berikut mana yang paling tepat untuk menangani missing values dalam konteks model machine learning? Menghapus semua baris yang memiliki missing values untuk memastikan data bersih. Mengabaikan missing values karena model machine learning bisa menghadapir Iya secara otomatis. Mengisi missing values dengan nilai random untuk mempertaha inkan keragaman data. Mengisi missing values dengan mean atau median dari fitur tersebut.
Solusi
Jawaban
** Mengisi missing values dengan mean atau median dari fitur tersebut.
Penjelasan
**Dalam konteks machine learning, penanganan missing values adalah langkah penting dalam preprocessing data. Berikut adalah analisis dari setiap pilihan yang diberikan:1. **Menghapus semua baris yang memiliki missing values untuk memastikan data bersih.** - Menghapus baris dengan missing values bisa menjadi solusi, tetapi ini tergantung pada seberapa banyak data yang hilang. Jika banyak baris yang terpengaruh, ini bisa menyebabkan kehilangan informasi yang signifikan.2. **Mengabaikan missing values karena model machine learning bisa menghadapinya secara otomatis.** - Mengabaikan missing values tanpa penanganan lebih lanjut mungkin tidak selalu bijaksana. Beberapa algoritma mungkin tidak dapat menangani missing values dengan baik, dan bisa menyebabkan bias atau ketidakstabilan dalam model.3. **Mengisi missing values dengan nilai random untuk mempertahankan keragaman data.** - Mengisi missing values dengan nilai acak bisa merusak keragaman data dan mengurangi kualitas prediksi model. Ini bukan pendekatan yang umum digunakan karena dapat menambah noise ke dalam data.4. **Mengisi missing values dengan mean atau median dari fitur tersebut.** - Ini adalah metode yang umum digunakan dalam preprocessing data untuk missing values. Mengisi dengan mean atau median membantu mempertahankan informasi yang ada dan mengurangi bias yang mungkin timbul dari missing values.**