BERITA TERKINI
Kuliah Umum Matematika ITB Bahas Tantangan dan Tahapan Analisis Big Data

Kuliah Umum Matematika ITB Bahas Tantangan dan Tahapan Analisis Big Data

Kuliah umum Matematika ITB mengangkat topik implementasi analisis data, mulai dari peran big data hingga tahapan pengolahannya. Dalam pemaparannya, Sigit Prasetyo menggambarkan big data sebagai “minyak” di era saat ini karena hampir semua hal membutuhkan data. Ia mencontohkan Google sebagai salah satu perusahaan yang kuat karena mengakuisisi banyak data, serta menyinggung bahwa ketergantungan manusia pada telepon genggam juga dapat menghasilkan data tanpa disadari.

Sigit menekankan bahwa tantangan utama terletak pada kemampuan mengolah data secara cepat dan akurat, lalu memprosesnya menjadi informasi yang berguna. Menurutnya, banyak pengguna data tidak memiliki latar belakang analisis data. Karena itu, analis data perlu mampu menerjemahkan data agar dapat dimanfaatkan pengguna dalam pengambilan keputusan. Ia mencontohkan situasi pandemi, ketika data terkait Covid-19 berubah dengan cepat sehingga analisis yang cepat dan akurat menjadi kebutuhan mendesak.

Dalam sesi lain, Dana menjelaskan proses analisis data, khususnya metode yang diterapkan di Solusi247, salah satu bagian dari PT Dua Empat Tujuh. Data yang diproses berupa big data dengan karakteristik volume, velocity, variety, veracity, dan value yang besar. Dana menyampaikan bahwa ukuran data yang sangat besar dapat menyulitkan komputer untuk memuatnya. Ia juga menekankan pentingnya pembersihan data sebelum pemrosesan, karena keyakinan bahwa data sudah bersih akan meningkatkan kebergunaan hasil analisis.

Secara garis besar, proses analisis data disebut terdiri atas empat tingkatan: deskripsi, diagnosis, prediksi, dan preskripsi. Dana menjelaskan bahwa semakin tinggi tingkatannya, semakin besar pula kesulitan dan nilai luaran yang dihasilkan. Pada tahap deskripsi dan diagnosis, analis menggali informasi serta hubungan sebab-akibat di dalam data, dengan luaran berupa laporan atau dasbor. Sementara pada tahap prediksi dan preskripsi, analis menyusun prediksi kondisi data di masa depan serta rekomendasi tindakan yang perlu dilakukan. Produk berbasis data tersebut menjadi luaran utama dari proses analisis.

Dana juga memaparkan prosedur penambangan data CRISP-DM (Cross Industry Standard Processing for Data Mining) yang turut diterapkan di Solusi247. Prosedur ini mencakup sejumlah tahapan, yakni business understanding untuk mengonversi tujuan bisnis menjadi permasalahan penambangan data; data understanding untuk mengumpulkan data; data preparation untuk menyiapkan himpunan data yang siap dimodelkan; modeling untuk menerapkan model yang dipilih; evaluation untuk menilai hasil pemodelan; serta deployment untuk mempresentasikan model kepada pengguna.

Adapun PT Dua Empat Tujuh disebut sebagai perusahaan yang bergerak di bidang informasi dan teknologi data dengan empat pilar utama. Solusi247 berfokus pada konsultasi solusi database dan data warehouse, Labs247 pada pembuatan perangkat big data, Insights247 menyediakan pakar data sains, dan DataLearns247 menangani pelatihan serta sertifikasi.

Reporter: Reza Pahlawan (Aktuaria, 2020)