Review Jurnal 4: Segmentasi Karakter pada Skrip Bahasa Bali Menggunakan Metode Canny Edge Detection

Segmentasi Karakter pada Skrip Bahasa Bali Menggunakan Metode Canny Edge Detection

I Kadek Agus Dwi Putra, Luh Putu Ayu Prapitasari
STIMIK Stikom Bali

Penelitian ini berfokus pada proses segmentasi karakter dengan inputan berupa teks dalam tulisan bahasa bali yang berasal dari buku berbahasa bali yang di scan dan disimpan dalam bentuk image. Adapun hasil keluarannya berupa karakter karakter tunggal aksara Bali yang telah tersegmentasi.

Segmentasi merupakan tahapan pra-proses dalam OCR. Tujuan dari segmentasi adalah untuk menyederkanakan gambar input sehingga lebih mudah untuk dianalisa dan doproses.  Hasil segmentasi akan sangat mempengatuhi hasil dari proses klasifikasi selanjutnya. Segmentasi dapat dibagi menjadi line segmentation, world segmentation, character segmentation dan scalling

Pada penelitian ini, digunakan metode canny edge fetection untuk melakukan segmentasi. Adapun tahapan dari deteksi tepi dengan canny edge detektion sebagaimana digunakan dalam penelitian yang dilakukan oleh I Kadek Agus Dwi Putra adalah sebagai berikut

Langkah 1
Langkah pertama yang harus dilakukan adalah menyaring dan membuang noise pada gambar asli sebelum mencoba untuk menetapkan dan mendeteksi tepi.

Langkah 2
Setelah menghaluskan gambar dan menyingkirkan noise, langkah selanjutnya adalah menemukan tepi dengan menggunakan gradient dari gambar tersebut.

Langkah 3
Menentukan arah tepian berdasarkan gradient.

Langkah 4
Setelah arah tepian ditemukan, langkah selanjutnya adalah merelasikan arah tepiannya ke arah yang dapat di-trace pada sebuah gambar. Jika pada sebuah gambar mempunyai piksel 5×5 sebagimana gambar dibawah :

jika dilihat piksel A memiliki 4 kemungkinan arah yaitu 0 derajat (horisontal), 45 derajat (diagonal positif), 90 derajat (vertikal), atau 135 derajat (diagonal negatif). Jadi orientasi tepi harus ditetapkan pada salah satu dari 4 arah tersebut tergantung dari arah yang terdekat.

Langkah 5

Setelah arah tepian diketahui, penindihan non-maksimum diaplikasikan. Penindihan ini digunakan untuk men-trace sepanjang tepian dalam arah tepiannya dan menindih piksel yang bernilai nol (= 0) yang tidak ada hubungannya dengan tepi. Hal ini akan menimbulkan garis kecil pada gambar keluaran.

Langkah 6
Akhirnya akan menghasilkan sebuah gambar yang sudah dieliminasi, dibutuhkan sebuah gradient garis tepi sehingga setiap piksel yang ada terhubung satu dengan yang lain

 

HasilPenelitian dan Kesimpulan

Dilihat dari hasil test yang dilakukan, untuk gambar input yang jelas dan tanpa noise, dari 814 karakter pada teks dikenali 810 karakter dengan hanya 4 karakter yang didak dikenali (99.5%). Namun pada pengujian lain dengan sample input yang memiliki noise akurasi yang dihasilkan hanya 50% (229 karakter terpotong dengan baik dari total 458 karakter).

Dalam kesimpulannya penulis menyebutkan beberapa faktor yang mempengaruhi keberhasillan dari segmentasi yang dilakukan, yaitu : hasil akuisisi sample data yang jelas (gambar hasil scan), noise pada gambar, serta jarak dan kerapatan per karakter.

 

Secara keseluruhan saya pribadi berpendapat hasil penelitian ini cukup menjanjikan, manun memang dibutuhkan pengembangan lebih lanjut sehingga mammpu mengatasi masalah seperti yang diungkapkan oleh penulis. Tantangan dalam segmentasi karakter, terutama krakter tulisan yang memiliki bentuk geometri unik seperti aksara bali yang digunakan oleh penulis, akrasa jawa atau sunda, adalah ketika algoritma segmentasi yang digunakan dituntut untuk mampun membedakan sebuah karakter individu yang memiliki part-karakter yang tidak terhubung sehingga tetap dianggap sebagai satu kesatuan, seperti yang saya tampilkan pada gambar dibawah.

Penelitian terkait segmentasi karakter masih menyisakan banyak tantangan, telebih mengingat setiap karakter dari setiap jenis sistem keaksaraan memiliki kehkasan dan keunikan tersendiri, sehingga bisa jadi sebuah metode akan sangat baik untuk jenis aksara tertentu namun kurang baik untuk jenis aksara yang lain.

Leave a Reply

Sumber Pencarian :