Mengenal Data Science dan Data Mining untuk Prediksi Masa Depan
Kira-kira apa yang akan terjadi jika kita bisa mengetahui kejadian pada masa depan? Mungkin investasi saham kita bisa makin untung karena sudah tahu kapan sahamnya akan naik atau mungkin kita bisa mengantisipasi bencana alam. Meski terdengar seperti “ramalan”, nyatanya hal ini bisa dilakukan, atau setidaknya bisa diprediksi menggunakan data science dan data mining.
Pengaplikasian data science dan data mining dilakukan dalam prediksi tenggelamnya DKI Jakarta pada 2030. Proyeksi tersebut tidak asal-asalan, melainkan hasil dari analisis dan olahan data elevasi CoastalDEM yang digarap oleh Climate Central, sebuah lembaga independen yang meneliti dan melaporkan perubahan iklim.
Memangnya, apa yang sebetulnya dimaksud dengan data science dan data mining? Head of Information Systems Concentration, Doctor of Computer Science, BINUS University, Spits Warnars Harco Leslie Hendric, S.Kom M.T.I. Ph.D, menjelaskan lebih lanjut soal kedua hal tersebut.
Apa itu data mining?
Sebelum memahami data science dan data mining, Spits mengulas soal Artificial Intelligence (AI) yang merupakan “ibu” dari dua cabang ini. Ia menjelaskan bahwa pengembangan AI terdiri dari dua jenis, yakni bergerak seperti manusia (act like a human) dan berpikir seperti manusia (think like a human).
Sesuai dengan namanya, act like a human adalah robot yang mampu bergerak dengan meniru gerak manusia. Dalam teknologi ini, ada penerapan Internet of Things (IoT) dan penggunaan sensor-sensor, seperti sensor gerak, cahaya, dan lain sebagainya. Sementara itu, think like a human memungkinkan AI untuk menerjemahkan cara berpikir manusia ke dalam program komputer.
Spits menjelaskan bahwa program komputer merupakan sekumpulan algoritma yang di dalamnya terkandung data mining. Namun, data mining ini lebih mengutamakan pencarian pola atau pattern dari data yang bersifat terstruktur.
Sebagai informasi, ada dua jenis data yang perlu kita ketahui, yakni data terstruktur dan tidak terstruktur. “Data terstruktur itu adalah data berbentuk dua dimensi yang terdiri dari baris dan kolom, di mana baris merepresentasikan record atau tuple, sementara kolom dipresentasikan sebagai field yang merepresentasikan data-data seperti nama, jenis kelamin, alamat, dan seterusnya,” papar Spits. Sementara itu, data tidak terstruktur merujuk pada teks dokumen, pesan chat di WhatsApp, gambar, suara, atau video.
Data mining menggunakan data terstruktur itu untuk menemukan “data aneh” atau data yang tidak biasa. Data yang tidak biasa inilah yang disebut sebagai pola atau pattern. Hal ini bisa membantu perusahaan atau industri memprediksi tren demi memenangkan persaingan bisnis.
Apa itu data science?
Di sisi lain, data science merupakan sebuah cara bagaimana kita menggunakan data untuk suatu tujuan, misalnya bisnis. “Ketika data mining digunakan untuk mencari pola, pola ini bisa dipakai untuk mencari kebutuhan bisnis atau digunakan untuk mengambil keputusan, sifatnya begitu,” ungkap Spits.
Data science sendiri baru booming sekitar tahun 2010-an. Namun, istilah ini sudah pernah diperkenalkan oleh Peter Naur pada 1974. Menurut Spits, data science hanyalah “packaging” baru dari konsep yang sudah ada sebelumnya, sama seperti istilah big data yang beberapa waktu lalu sempat booming.
Melihat pentingnya kedua ilmu tersebut untuk masa depan, BINUS University memberikan dukungannya dengan membentuk program perkuliahan Doctor of Computer Science. Pada perkuliahannya, mahasiswa akan mendalami soal ilmu sains komputer dan belajar untuk mengelola data.