Teknologi OCR (Optical Character Recognition) sudah
lama kita dengar, tetapi apakah kita sudah mengetahui fungsi dan cara kerja
dari software tersebut?
Seperti yang sudah kita ketahui bahwa software OCR berfungsi untuk
merubah file Image/Gambar menjadi file Teks dengan
format TXT. Hal ini berguna apabila kita ingin mendapatkan file teks dari
sebuah surat tanpa harus mengetik ulang seluruh tulisan yang terdapat didalam
surat tersebut.
Pada dasarnya setiap scanner hanya menghasilkan file gambar/image
dalam format TIFF saja, setelah file gambar/image tersebut dihasilkan, file
tersebut di kirim ke dalam komputer dan langsung disambut dan diproses oleh
program OCR untuk diproses menjadi file teks, berikut ini saya jelaskan susunan
cara kerja software OCR tersebut:
1. Meratakan gambar (Auto Deskewing)
File image (gambar) akan diatur kemiringannya, apabila hasil scan ada kemiringan, maka gambar akan dibuat sejajar atau lurus.
File image (gambar) akan diatur kemiringannya, apabila hasil scan ada kemiringan, maka gambar akan dibuat sejajar atau lurus.
2. Menganalisa (Analysis)
Software (program) OCR akan menganalisa dan memisahkan bagian teks dan bagian gambar.
Software (program) OCR akan menganalisa dan memisahkan bagian teks dan bagian gambar.
3. Otomatis mengatur arah gambar (Auto Orientation)
Software (program) OCR akan mengambil sebagian area pada file image (gambar) dan mengidentifikasi arah teks yang benar. File image (gambar) akan diputar ke arah yang benar, pilihannya adalah 90°, 180°, atau 270°.
Software (program) OCR akan mengambil sebagian area pada file image (gambar) dan mengidentifikasi arah teks yang benar. File image (gambar) akan diputar ke arah yang benar, pilihannya adalah 90°, 180°, atau 270°.
4. Memisahkan setiap karakter huruf dan angka (Separating
single character)
Software (program) OCR akan memisahkan setiap karakter yang terdapat pada image (gambar) menjadi sebuah huruf atau angka.
Software (program) OCR akan memisahkan setiap karakter yang terdapat pada image (gambar) menjadi sebuah huruf atau angka.
5. Mengidentifikasi gambar (Capturing the features of the
characters and comparing)
Software (program) OCR akan mengidentifikasi satu persatu setiap gambar yang sudah dipisahkan, dan melakukan pengecekan terhadap database yang dimiliki oleh software (program) OCR, dan menetapkan huruf atau angka yang akan digunakan.
Software (program) OCR akan mengidentifikasi satu persatu setiap gambar yang sudah dipisahkan, dan melakukan pengecekan terhadap database yang dimiliki oleh software (program) OCR, dan menetapkan huruf atau angka yang akan digunakan.
6. Menghasilkan file akhir (Recognition result output)
Setelah setiap image (gambar) sudah dirubah menjadi huruf atau angka (format teks) maka software (program) OCR akan menghasilkan sebuah file dengan format teks, seperti Microsoft Word, Microsoft Excel, TXT, Rich Text dan Searchable PDF, tergantung dari pengaturan awal.
Setelah setiap image (gambar) sudah dirubah menjadi huruf atau angka (format teks) maka software (program) OCR akan menghasilkan sebuah file dengan format teks, seperti Microsoft Word, Microsoft Excel, TXT, Rich Text dan Searchable PDF, tergantung dari pengaturan awal.
Sumber :
Tidak ada komentar:
Posting Komentar