Minggu, 30 September 2018

Tantangan dan Permasalahan Data Mining

Pengertian Data Mining

Data mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge) secara otomatis. Dengan perkembangan ilmu dan teknologi yang semakin pesat ini maka kita sering menjumpai implementasi atau penerapan data mining dilingkungan sekitar kita. Akan tetapi implementasi dari data mining tentu tidak bisa berjalan mulus, ada beberapa tantangan yang harus dihadapai dalam data mining


Baca Juga: Teknik Pencarian Pola Sekuensial (Sequence Mining) pada Data Mining

Tantangan Dalam Data mining

Tantangan dalam data mining meliputi :

  1. Scalability, yaitu besarnya ukuran basis data yang digunakan.
  2. Dimensionality, yaitu banyaknya jumlah atribut dalam data yang akan diproses.
  3. Complex and Heterogeneous Data, yaitu data yang kompleks dan mempunyai variasi yang beragam.
  4. Data'QuaIity, kualitas data yang akan diproses seperti data yang bersih dari noise, missing value, dsb.
  5. Data Ownership and Distribution, yaitu siapa yang memiliki data dan bagaimana distribusinya.
  6. Privacy Preservation, yaitu menjaga kerahasiaan data yang banyak diterapkan pada data nasabah perbankan.
  7. Streaming Data, yaitu aliran data itu sendiri.

Baca Juga: Teknik Kaidah Asosisasi(association rules Discovery/Descriptive) pada Data Mining

Permasalahan Dalam Data mining

Sistem data mining berdasar pada basis data yang menyediakan data mentah dan ini memunculkan permasalahan dalam basis data yang cenderung dinamis, tidak lengkap, ber-noise dan besar. Permasalahan lain muncul sebagai akibat dari kecukupan dan relevansi dari informasi yang disimpan.

Basis data seringkali didesain untuk tujuan yang berbeda dari data mining dan kadangkala properti atau atribut yang akan menyederhanakan pekerjaan pembelajaran tidak tersedia atau tidak dapat dimintai dari dunia nyata. Data yang tidak meyakinkan menyebabkan permasalahan karena jika ada atribut-atribut esensial bagi pengetahuan tentang domain aplikasi tidak ada dalam data tidak memungkinkan untuk menemukan pengetahuan yang tepat mengenai domain yang diberikan.

0 komentar: