Aku ingin bisa meluangkan resource untuk mempelajari sesuatu yang menarik perhatianku sejak lama: memodelkan pertumbuhan aset perusahaan, dalam hal ini tempatku bekerja saat ini. Tapi tentu saja membuat model data yang komprehensif dan mempertimbangkan banyak hal itu tidaklah mudah.
Membersihkan Data.
Semuanya dimulai dari data awal yang dimiliki. Seakurat apa isinya? Perlu cek dan ricek sebelum diolah? Tentu saja! Mana mungkin menghitung durasi aktivitas bila salah (awal atau akhir waktu) diisi dengan teks? Model angka yang dimunculkan dalam format general atau disesuaikan dengan dd-Mmm-yy? Semakin bermacam tipe format yang digunakan, database akan semakin besar dan kalkulasi bakal makin lama. Tidak efisien.
Tentunya aku harus memutuskan seperti apa data yang ditampilkan dan dicatatkan. Selain itu semua bagian yang kosong atau tak mengikuti kaidah penulisan / pencatatan, harus dikoreksi. Tidak mungkin label dan identitas unik dibuat secara asal tanpa pengaturan khusus yang memungkinkan untuk kategorisasi awal yang lebih mudah. Selain itu apa lagi yang perlu dilakukan dalam membersihkan data? Aku perlu lebih banyak membaca.
Membersihkan Data.
Semuanya dimulai dari data awal yang dimiliki. Seakurat apa isinya? Perlu cek dan ricek sebelum diolah? Tentu saja! Mana mungkin menghitung durasi aktivitas bila salah (awal atau akhir waktu) diisi dengan teks? Model angka yang dimunculkan dalam format general atau disesuaikan dengan dd-Mmm-yy? Semakin bermacam tipe format yang digunakan, database akan semakin besar dan kalkulasi bakal makin lama. Tidak efisien.
Tentunya aku harus memutuskan seperti apa data yang ditampilkan dan dicatatkan. Selain itu semua bagian yang kosong atau tak mengikuti kaidah penulisan / pencatatan, harus dikoreksi. Tidak mungkin label dan identitas unik dibuat secara asal tanpa pengaturan khusus yang memungkinkan untuk kategorisasi awal yang lebih mudah. Selain itu apa lagi yang perlu dilakukan dalam membersihkan data? Aku perlu lebih banyak membaca.
Komentar
Posting Komentar