• Programming

    Tentang sedjat1.dx.am

    Awalnya, saya cuma punya 1 blog di sedjat1.zz.mu, pada suatu saat saya gak bisa akses web itu sama sekali. Sesudah beberapa jam saya gak bisa akses akhirnya saya putuskan untuk bikin blog lagi di hosting gratis yang lain. Dengan berbekal backup database yang ada di notebook, akhirnya saya bisa menduplikasi sedjat1.zz.mu ke blog.sedjat1.dx.am.

    Di tempat baru saya sengaja bikin sub domain sendiri untuk blog karena niatnya, saya bikin blog yang aneh bin ajaib, beda dari yang lain. Blog yang bentuknya seperti terminal console, yang kalo mau liat isinya, harus ngetik perintah dulu, biar kaya jaman DOS.

    Penampilan sedjat1.dx.am, bar putih yang paling bawah itu ngedip kaya kursor terminal.

    Rencananya kalo ngasih perintah dir baru muncul list entri blognya, terus ada perintah open untuk baca entry blog. Dan rencananya juga, engine blog nyimpen berkas blognya bukan di database. Karena ini buatan jaman dulu banget, jadi scriptnya juga masih cupu (klik READ MORE untuk source codenya).

    Tapi ternyata, sesudah blog baru selesai diinstall, ternyata hosting lama saya masih bisa di akses, akhirnya jadi punya 2 blog. Dan yang ini jadi blog ketiga. Uhuy.

  • Programming

    Data Harvest: POM.GO.ID

    Awalnya sederhana aja, abis baca “Kolom” di detik.com langsung inget, di Indonesia ada BPOM (Badan Pengawas Obat dan Makanan) dan dari websitenya kita bisa tau apakah sebuah produk obat dan makanan benar-benar aman untuk dikonsumsi. Entri pertama dari penelusuran Google dengan keyword “bpom” langsung tepat, dan disana ada sub-result menuju web yang saya mau: Cek Produk BPOM.

    Saya langsung cari nama produk berdasarkan kata kunci air kemasan yang ada di meja saya: Pristine. Hasilnya ada 9 data dan semuanya gak ada sangkut pautnya sama air mineral keluaran grup sinarmas. Saya coba ulang dengan nomor registrasinya: MD 265210006138, baru deh nongol datanya. Ternyata “Pristine” itu merk, sedangkan nama produknya sendiri adalah “Air Minum pH Tinggi”.

    Abis baca keterangan sekilas, langsung aja reflek: klik-kanan – View Source. Keliatan deh raw html-nya, ternyata halaman pencarian dibuat dengan table standar, data diload oleh script php (tidak pakai ajax) dan paging sederhana. Semua parameter ada di address bar browser, dan diantara parameter yang ada, si programmer nyisipin session php. Mungkin niatnya supaya datanya gak bisa di lihat tanpa melalui browser, tapi downside-nya orang gak bisa ngasih tautan referensi ke entri tertentu. Oh iya, satu lagi, baris data hasil pencarian bisa di klik untuk menampilkan detail entrinya, dan ini diload dengan ajax.

    Data detail muncul setelah row di-klik.

    Karena liat langsung raw html agak susah, jadi Ctrl+Shift+I untuk ngeluarin DevTools dari browser. Jaman dulu yg begini susah banget, satu2nya tools yang lumayan mumpuni addon dari Firefox yang namanya Firebug, tapi berhubung browser2 modern udah meng-embed fungsi ini jadi Firebug di-mati-in deh.

    Inspeksi raw html tabel hasil pencarian

    Dari inspeksi elemen, bisa dilihat dalam tiap <tr> produk ada custom attribute bernama urldetil yang digunakan untuk me-load data detail dari produk dengan ajax call.

    Request AJAX untuk mengambil data detail.
    Response berupa halaman html yang siap ditampilkan.

    Nah, sebenernya data detail ini yang harusnya di harvest, dan data dari table hasil search dibutuhkan untuk mendapatkan ID dari itemnya. Jadi ini langkah-langkah untuk harvest datanya:

    • Buka https://cekbpom.pom.go.id dan simpan cookie, ambil session_id php.
    • Request ke url untuk search https://cekbpom.pom.go.id/index.php/home/produk/ {PHP_SESSION_ID}/all/row/{ROW_PER_PAGE}/page/{PAGE_NUMBER}/order/4/DESC/search/{KATEGORI}/{KATA-KUNCI-PENCARIAN}
    • Parse response html-nya, ambil tiap urldetil dan request lagi ke
      https://cekbpom.pom.go.id/index.php/home/detil/{PHP_SESSION_ID}/produk/{URLDETIL}
    • Parse lagi response-nya untuk mendapatkan data detail.

    Cara paling gampang dan cepat yang terpikir oleh saya adalah dengan menggunakan PHP. Script yang saya gunakan bukan untuk dibuka oleh browser, tapi script php dipanggil lewat terminal php -f namafile.php [parameter]. Setelah beberapa kali mencoba, saya dapat draft kasarnya, beberapa parameter masih di hardcode dan hasil berupa json disimpan ke dalam satu file (klik READ MORE untuk source-code php-nya).

  • Komik,  Programming

    Metamorfosis

    Kutipan dari web KBBI:

    Tapi yang mau saya bahas di enrty blog ini bukan masalah biologi atau geologi. Ini tentang perubahan dari program koleksi komik (manga) saya. Yang sekarang bentuknya begini:

    Selain itu ada tambahan lagi juga, sekarang udah bikin versi mobile nya. Tapi versi mobile ini gak berdiri sendiri, tetep akses ke Web Reader lewat http.

    Versi mobile dibuat pake Cordova.

    Udah ah.

  • Memori,  Omong Kosong,  Programming,  Teknologi

    Ternyata…

    Alkisah, pada jaman dahulu kala, saya pernah kepikiran untuk bikin reporting server, dimana semua report yg direquest akan masuk ke daftar antrian dan akan di eksekusi sesuai prioritas. Di servernya akan ada daftar request dan statusnya. Data yang dihasilkan untuk setiap request report akan disimpan. Tiap report yg dicetak akan ada “signature” atau kode tertentu yang mengarah ke id request report. Itu sekitar tahun 2012.

    Tahun ini baru saya tau kalau ternyata udah ada yang bikin kaya gitu.