Data Mining adalah serangkaian proses untuk menggali nilai tambah dari
suatu kumpulan data berupa pengetahuan yang selama ini tidak diketahui
secara manual. Patut diingat bahwa kata mining sendiri berarti usaha
untuk mendapatkan sedikit barang berharga dari sejumlah besar material
dasar. Karena itu Data Mining sebenarnya memiliki akar yang panjang dari
bidang ilmu seperti kecerdasan buatan (artificial intelligent), machine
learning, statistik dan database. Data mining adalah proses menerapkan
metode ini untuk data dengan maksud untuk mengungkap pola-pola
tersembunyi. Dengan arti lain Data mining adalah proses untuk penggalian
pola-pola dari data. Data mining menjadi alat yang semakin penting
untuk mengubah data tersebut menjadi informasi. Hal ini sering digunakan
dalam berbagai praktek profil, seperti pemasaran, pengawasan, penipuan
deteksi dan penemuan ilmiah. Telah digunakan selama bertahun-tahun oleh
bisnis, ilmuwan dan pemerintah untuk menyaring volume data seperti
catatan perjalanan penumpang penerbangan, data sensus dan supermarket
scanner data untuk menghasilkan laporan riset pasar.
Alasan utama untuk menggunakan data mining adalah untuk membantu dalam
analisis koleksi pengamatan perilaku. Data tersebut rentan terhadap
collinearity karena diketahui keterkaitan. Fakta yang tak terelakkan
data mining adalah bahwa subset/set data yang dianalisis mungkin tidak
mewakili seluruh domain, dan karenanya tidak boleh berisi contoh-contoh
hubungan kritis tertentu dan perilaku yang ada di bagian lain dari
domain . Untuk mengatasi masalah semacam ini, analisis dapat ditambah
menggunakan berbasis percobaan dan pendekatan lain, seperti Choice
Modelling untuk data yang dihasilkan manusia. Dalam situasi ini, yang
melekat dapat berupa korelasi dikontrol untuk, atau dihapus sama sekali,
selama konstruksi desain eksperimental.
Beberapa teknik yang sering
disebut-sebut dalam literatur Data Mining dalam penerapannya antara
lain: clustering, classification, association rule mining, neural
network, genetic algorithm dan lain-lain. Yang membedakan persepsi
terhadap Data Mining adalah perkembangan teknik-teknik Data Mining untuk
aplikasi pada database skala besar. Sebelum populernya Data Mining,
teknik-teknik tersebut hanya dapat dipakai untuk data skala kecil saja.
Tidak ada komentar:
Posting Komentar