Outliers adalah data yang menyimpang terlalu jauh dari data yang lainnya
dalam suatu rangkaian data. Adanya data outliers ini akan membuat
analisis terhadap serangkaian data menjadi bias, atau tidak mencerminkan
fenomena yang sebenarnya. Istilah outliers juga sering dikaitkan dengan
nilai esktrem, baik ekstrem besar maupun ekstrem kecil. Sebagai
ilustrasi, jika ada empat mahasiswa, mahasiswa pertama mempunyai uang
saku per bulan Rp. 500 ribu, mahasiswa kedua Rp. 600 ribu, mahasiswa
ketiga Rp. 700 ribu, dan mahasiswa keempat karena merupakan anak orang
kaya, mempunyai uang saku per bulan sampai dengan Rp. 5 juta. Secara
sekilas tampak bahwa nilai 5 juta relatif jauh dibandingkan uang saku
ketiga mahasiswa yang lain.
Kalau kita rata-ratakan uang saku keempat mahasiswa tersebut, maka
rata-ratanya adalah sebesar (500 ribu + 600 ribu + 700 ribu + 5 juta)/4=
6,8 juta/4 = 1,7 juta. Tiga mahasiswa yang lain tentunya keberatan jika
dinyatakan bahwa rata-rata uang saku mereka adalah Rp. 1,7 juta per
bulan karena jauh sekali dari nilai yang sebenarnya. Contoh lain
misalnya kita ingin merata-ratakan kekayaan seorang PNS usia 30 tahunan,
dengan memasukkan seorang PNS yang kebetulan mempunyai kekayaan sekitar
Rp. 25 Milliar…he he he he
Penangangan Data Outliers
Harus kita apakah data outliers? Apakah harus kita keluarkan? Atau ada
treatment yang lain. Pengeluaran data outliers memang tidak disalahkan,
akan tetapi harus dikaji dulu, apakah data tersebut merupakan bagian
dari populasi atau bukan? Sebagai contoh, seorang PNS dengan kekayaan
dalam contoh di atas, sebaiknya dikeluarkan dari model penelitian karena
‘tidak’ mewakili fenomena PNS yang sebenarnya (jangan-jangan memang
begitu ya fenomenanya? He he). Dalam contoh keempat mahasiswa di atas,
jika tujuannya adalah untuk melihat apakah perlu menaikkan SPP atau
tidak, ya sebaiknya dikeluarkan karena tentunya 3 orang yang mempunyai
uang saku di bawah 1 juga akan keberatan. Akan tetapi dalam kasus yang
lain, data tersebut boleh saja dipergunakan jika memang mewakili kondisi
subjek penelitian. Misalnya, penelitian perusahaan selama krisis di
mana hampir semua perusahaan mengalami kerugian. Akan tetapi ada satu
atau beberapa perusahaan yang dengan jitu melakukan strategi sehingga
menghasilkan profit. Nah, hasil penelitian akan lebih menarik jika data
outliers tidak dikeluarkan. Dalam hal ini, peneliti bahkan dapat
mengkaji strategi apa yang digunakan sehingga dapat dijadikan rujukan
bagi perusahaan yang lain.
Dalam statistik, data outliers sering menimbulkan hasil yang bias. Oleh
karena itu, harus diberikan perlakuan khusus. Pengeluaran data outliers
atau penggunaan data outliers tidak semata-mata merujuk kepada
statistiknya, tetapi juga adjustment dari peneliti. Jika memang data
outliers tersebut tidak dapat dikeluarkan karena masih merupakan
fenomena subjek penelitian ya sebaiknya tetap dipergunakan. Agar efek
outliers dapat direduksi, maka data dilakukan transformasi data,
misalnya dengan logaritman natural, atau akar kuadrat. Atau juga bisa
menggunakan alat statistik non parametrik, sehingga data outliers tidak
akan nampak sebagai outliers karena data dianggap berskala ordinal.
Sebagai contoh, keempat mahasiswa tadi diubah menjadi data ordinal,
sehingga mahasiswa dengan uang saku Rp. 500 ribu menjadi 1, uang saku
Rp. 600 ribu menjadi 2, uang saku Rp. 700 ribu menjadi 3, dan yang
paling besar menjadi 4. Ini hanya contoh saja, dan sebagai informasi
data dalam bentuk ordinal tidak dapat dirata-ratakan, akan tetapi dapat
digunakan untuk mencari korelasi dengan variabel lain.
0 komentar:
Posting Komentar