Belajar dan Berlatih Bersama Binary Search
Binary search adalah salah satu teknik pertama yang biasanya diajarkan kepada programmer yang sedang belajar algoritma. Pelajaran apa yang bisa kita ambil dari binary search?
Posted on 19/04/2022
Binary search adalah algoritma untuk mencari nilai di dalam array. Teknik ini sedikit lebih rumit dibandingkan dengan linear search biasa (cari dari kiri ke kanan) namun memiliki performance yang jauh lebih baik.
Pada tulisan ini saya ingin mengurai beberapa pelajaran yang mungkin berguna terutama untuk programmer yang sedang dalam tahap awal belajar.
Kompleksitas Algoritma
Kompleksitas algoritma dari binary search adalah O(Log N)
. Artinya, binary search membutuhkan maksimum Log(1000000)
= 20
kali operasi saja untuk memproses array dengan panjang 1.000.000. Bandingkan dengan linear search yang memiliki kompleksitas O(N)
:
| N Elements | O(N) | O(log N) | | ---------- | ------- | -------- | | 8 | 8 | 3 | | 16 | 16 | 4 | | 64 | 64 | 6 | | 1024 | 1024 | 10 | | 65536 | 65536 | 16 | | 1048576 | 1048576 | 20 |
Tips:
- Abaikan konstanta dalam menentukan Big O Notation. Algoritma dengan kompleksitas
O(1000N + 10)
dapat dianggap sama saja denganO(N)
meskipun secara runtime tetap akan berpengaruh. - Basis logaritma yang digunakan juga bisa kita abaikan. Untuk contoh binary search (dan algoritma lain yang memotong-motong data menjadi 2) basis logaritma yang digunakan adalah 2 karena kompleksitas binary search kira-kira artinya "berapa kali N harus dibagi 2 sampai nilainya menjadi 1".
- Latihan: Pelajari merge sort dan pahami mengapa kompleksitasnya O(N. Log N)
Prekondisi
Jika binary search memang cepat, mengapa kita tidak ganti saja semua pencarian agar menggunakan binary search? Karena binary search hanya dapat digunakan untuk array yang sudah terurut (ordered). Kalau datanya tidak terurut outputnya akan ngaco.
Linear search biasa tidak membutuhkan syarat pre-kondisi seperti itu.
Bagaimana kalau kita urutkan dulu datanya sebelum proses binary search dilakukan?
Tidak bisa. Kalau seperti itu maka benefit yang didapat dari efisiensi binary search akan hilang. Proses sorting saja paling cepat O(N Log N)
.
Kalau gitu kita cek saja apakah datanya sudah terurut atau belum. Kalau belum kita bisa fallback ke linear search biasa.
Tidak bisa juga, memeriksa apakah array sudah terurut atau belum membutuhkan proses O(N)
sendiri.
Tips: jangan karena mengejar performance di satu bagian kita justru memasukan proses-proses lain yang justru berdampak lebih buruk untuk sistem secara keseluruhan.
Keep it Simple
Selain memerlukan prekondisi, implementasi binary search juga sedikit lebih rumit. Kode yang lebih rumit memiliki potensi bug lebih banyak: proses penghitungan mid-point bisa berujung pada overflow, penentuan stop-condition bisa salah, atau parameter input array bisa tidak sengaja disalin dulu (dengan kompleksitas O(N)) saat fungsi dipanggil.
Make it work, Make it right, Make it fast
Pada saat menyelesaikan masalah, jangan langsung lompat ke teknik yang paling canggih. Coba dulu cara yang sederhana, mudah dipahami, mudah diimplementasikan, dan mudah di-debug.
Periksa dulu sebelum memutuskan untuk melakukan optimalisasi habis-habisan:
- Apakah user akan terbantu? Atau effort saya lebih baik dialihkan untuk memperbaiki bug yang membuat Pak Joko dari finance marah-marah setiap sore?
- Apakah biaya infrastruktur dapat berkurang secara signifikan?
- Apakah memang terbukti kalau bagian tersebut adalah sumber masalahnya? Atau emang kamu gak suka aja ngeliat kode si Mahmud?
Jangan buang waktu untuk mengoptimalisasi proses yang hanya dipanggil satu user sebulan sekali dan sebenarnya sudah lumayan kencang.
Waktunya Upgrade Server?
Aplikasi yang awalnya ngebut umumnya akan melambat seiring dengan berjalannya waktu. Mungkin karena jumlah data semakin banyak.. mungkin juga karena programmer seniornya sudah pada resign.
Pada saat seperti ini biasanya atasan menyuruh kita untuk throw money at the problem - upgrade server sekarang juga.
Apakah kita ikuti saja apa kata pak bos? Atau ikutan resign?
Sebelum memutuskan untuk mengirim one month notice, cari tahu dulu permasalahannya dimana. Ingat, algoritma yang buruk juga akan terasa kencang kalau datanya cuma ada 5 biji.
- Interview user untuk mencari tahu bagian mana dan proses apa yang lambat (bisa jadi sistem cuma lambat di laptop Intel Atom jadul punya Bu Dahlan).
- Umumnya persoalan performa hanya muncul di production environment karena data dev cuma dikit.
- Nyalakan instrumentasi untuk mendapatkan gambaran operasional sistem secara lebih jelas dan menyeluruh.
- Lakukan profiling untuk mencari tahu bagian mana yang menjadi sumber penyakit - biasanya disebut dengan hot spot.
Jika terbukti kalau memang ada bagian kode yang harus dioptimisasi, maka lakukan. Jangan tutupi implementasi jelek menggunakan server upgrade. Makin lama ongkos upgrade akan makin tidak sebanding dengan tambahan performance yang didapat.
Tips:
- Sebelum memperbaiki, buat unit testing terlebih dulu. Jangan mengutak-atik kode yang tidak memiliki test.
- Setelah perbaikan selesai, lakukan benchmark untuk memverifikasi kalau perbaikan tadi memang membuahkan hasil.
Latihan 1 - Membuat Unit Testing
Sebagai latihan, pelajari bagaimana cara kerja binary search lalu coba buat implementasinya menggunakan bahasa pemrograman kesukaan anda.
Jangan berhenti sampai disitu, buat unit testing untuk memastikan kalau implementasinya sudah benar.
Tips: Saat membuat unit testing, biasanya kita mulai dengan membuat test cases untuk skenario yang umum:
- Tes dengan nilai yang ada di dalam array, pastikan fungsi mengembalikan posisi index yang benar.
- Tes dengan nilai yang tidak ada. Pastikan fungsi mengembalikan nilai -1 (atau
false
tergantung implementasi anda).
Setelah kasus yang umum berhasil ditangani, kita pikirkan kasus-kasus selanjutnya terutama edge-case dimana bug mungkin ditemukan:
- Tes menggunakan array dengan jumlah element ganjil dan genap.
- Tes menggunakan array berisi 1 element.
- Tes menggunakan array kosong.
- Tes menggunakan array dengan elemen yang sama semua (index mana yang dikembalikan?).
- Tes dengan ukuran array sangat besar.
- Ada lagi..?
Pelajari Lebih Jauh:
- Code coverage adalah metrics yang memperlihatkan sebarapa banyak kode yang kita tulis sudah memiliki testing. Pelajari konsep code coverage dan teknik untuk melihatnya (tips: pakai library, tools, atau IDE, jangan hitung manual).
- Test driven development adalah teknik development dimana kita membuat test terlebih dahulu sebelum membuat programnya.
Latihan 2 - Membuat Versi Rekursif
Algoritma binary search bisa diimplementasikan secara natural dalam bentuk rekursif.
Ide utama dari teknik rekursif adalah memanggil kembali fungsi yang sama dengan scope permasalahan yang lebih kecil sampai kondisi tertentu ditemukan - biasanya disebut dengan base condition. Bagaimana dengan binary search?
Latihan:
- Implementasikan binary search secara rekursif lalu gunakan unit tests dari latihan 1 untuk memeriksa kebenarannya.
- Cara mana yang lebih mudah dipahami?
- Cari tahu dan pelajari soal tail call optimization.
Binary Search Sebagai Teknik Pemecahan Masalah
Tahukan anda kalau algoritma binary search bisa dilakukan untuk mencari jumlah cicilan yang harus dibayar per bulan? No kidding. Silahkan liat dan coba kerjakan soal latihan ini.
Pesan moralnya adalah, teknik pemecahan masalah yang sekilas memiliki ruang lingkup sangat spesifik ternyata dapat digunakan untuk menyelesaikan masalah lain.
Setelah mempelajari algoritma atau teknologi tertentu, coba pikirkan kira-kira dimana saja cara tersebut bisa diimplementasikan - baik yang memang terkenal atau yang out of the box.
Latihan:
Anda mungkin mengenal redis sebagai cache server. Coba pelajari bagaimana redis juga bisa digunakan sebagai queue system, stat counter, pub/sub, autocomplete, dan rate limiter.