Optical Character Recognition (OCR) adalah sarana yang digunakan
untuk mengenali karakter optis untuk membaca informasi ke dalam sistem
komputer. Indentifikasi karakter yang tercetak ini dilakukan dengan
menggunakan pengindera cahaya seperti yang terdapat pada scanner.
Sistem pemrosesan data yang ideal merupakan sistem di mana data
diterima dari sumber dan diolah secepat mungkin. Dalam hal ini, mesin
mengenali simbol dan angka, langsung dalam format yang lama, seperti
yang digunakan manusia dalam aktivitas bisnis dan sosial sehari-hari.
Saat ini pola yang dapat dikenali komputer tidak cocok dibaca
manusia. Demikian juga, data yang berasal dari manusia biasanya tidak
diimpor langsung ke komputer. Meski demikian, penanganan data
dilambangkan dengan proses konversi dari format manusia ke format
komputer.
Tujuan utamanya adalah memungkinkan komputer langsung membaca dokumen
sumber. Masalah konversi pola di dokumen input ke signal elektronik,
yang cocok untuk diolah komputer merupakan salah satu pengenalan pola.
Pada saat ini terdapat dua sistem otomatis yang dirancang untuk dapat
mengenali karakter cetakan, yakni: OCR (Optlcal Character Recognition)
dan MICR (Magnetic Ink Character Recognition).
Pada awalnya, karakter dicetak dalam format typeface konvensional,
atau bar code. Biasanya bertinta hitam dengan latar belakang putih.
Kemudian karakter di-scan dengan mengukur pantulan optis. Dalam sistem
MICR, karakter dicetak dalam format yang mempunyai stylesheet sempurna,
dengan tinta yang difragmentasi dengan partikel bermagnet. Saat dokumen
MICR dibaca, tinta ditarik sebelum karakter berada pada head baca.
Signal output yang dihasilkan, diatur oleh partikel bermagnet yang
melewati head untuk memindai segala karakter proporsional terhadap
proyeksi vertikal suatu karakter.
Kemampuan mesin mengenali karakter yang dicetak dalam format yang
mudah dikenali manusia, mempunyai keuntungan besar dalam mengurangi
tugas pengumpulan data. Jadi, dapat mempercepat aliran data di sistem.
Biaya persiapan data dapat ditekan dan lebih akurat dibanding metode
yang lebih konvensional.
Sistem pengenalan karakter dikembangkan di berbagai organisasi dan
menghasilkan berbagai macam sumber typeface. Dengan adanya penyempurnaan
teknik pengenalan karakter, standarisasi telah ditetapkan, namun masih
terlihat perbedaan sumber yang digunakan.
Di bidang MICR, cenderung sedikit bervariasi, dan hanya ada dua
sumber, yakni E13B dan CMC7. Keduanya diterima sebagai standar
intemasional.
Di bidang sistem OCR, banyak terdapat variasi, meski organisasi
standar internasional telah mengajukan dua standar sumber yang bernama
OCR’A’ dan OCR’B’.
Dalam beberapa hal, MICR kurang fleksibel dibanding OCR. Sistem MICR
menghendaki bahwa karakter harus dicetak dalam format yang mempunyai
stylesheet sempurna, dan sangat akurat. Akan tetapi, sistem pengenalan
ini terletak pada partikel bermagnet yang membentuk setiap karakter.
Meskipun demikian, sulit dikritik, sistem OCR memiliki sejumlah
kelebihan ketika menangani dokumen yang rusak dan terlipat atau dokumen
yang telah kotor atau ditindih karakter.
Sistem OCR tidak terpengaruh oleh format dengan stylesheet tertentu.
Bahkan stylesheet yang kurang sempurna dapat dikenali. OCR juga dapat
mengenali karakter yang dibuat oleh mesin tik manual dan dapat
dikonversi ke dalam karakter yang terdapat dalam komputer. Aspek ini
memungkinkan kemudahan dan fleksibilitas dalam menentukan proses
pengumpulan data. Di kedua sistem, karakter yang dibaca, harus dicetak
di area dokumen yang ditentukan dengan standar registrasi pencetakan
yang cukup tinggi.
MICR telah digunakan dalam cek perbankan di seluruh dunia. MICR
sorter/reader digunakan untuk menyortir cek secara otomatis, untuk
membagi cek ke nasabah di berbagai cabang, dan cek sebelumnya dicetak
dengan kode cabang. Nomor cek dan nomor rekening nasabah juga dicetak
sebelumnya. Nantinya jumlah transaksi dapat ditambahkan dengan MICR
encoder. Perincian cek otomatis dapat dibaca pada memori komputer untuk
meng-update rekening pelanggan.
OCR telah digunakan sebagai turn around document dalam akuntansi
sewa-beli dan aplikasi serupa. Setiap pelanggan diberi buku voucher yang
dicetak beserta jumlah pembayaran dalam kontrak sewa.
Sebagai langkah pengenalan terhadap sistem OCR, marilah kita lakukan langkah-langkah pemindaian (scanning) berikut ini.
1. Aktifkan aplikasi FreeOCR.net melalui menu Start dan All Program sehingga muncul tampilan awal seperti ini.
2. Terdapat beberapa menu dan toolbar yang digunakan, yaitu :
File, digunakan jika kita akan melakukan :
.
.
Open ( membuka) file yang pernah di-scan atau gambar berupa teks.
Scan atau memindai suatu gambar teks.
Select Scanner, bila ada beberapa mesin secanner yang terhubung dengan komputer kita.
Save teks digunakan apabila kita akan menyimpan teks dalam file berektensi txt.
Exit untuk keluar dari software.
Start
OCR Process, digunakan ketika kita telah mendapatkan gambar (image)
berupa teks untuk merubahnya menjadi teks yang dapat disunting
(editing).
.
Pilihlah menu Settings, untuk melakukan setting bahasa.
3. Setelah diset, kini kita siap melakukan pemindaian (scanning) dengan menggunakan OCR.
4. Simpanlah atau letakkanlah teks yang akan kita scan dalam lensa Scanner. .
5. Pilihlah menu File lalu klik perintah Scan atau klik langsung toolbar Scan
dan tunggulah bebarapa saat ketika aplikasi melakukan Scanning Page kemudian klik toolbar OCR maka aplikasi melakukan Recognition Page, sehingga akhirnya muncul tampilan Text Editor.
6. Pada Text Editor inilah kita dapat mengolah, menyunting, dan
memperbaiki teks sesuai dengan aslinya sebelum kita menyalin dan
memindahkannya ke dalam aplikasi Iain (misalnya ke dalam Microsoft
Word).
7. Untuk memindahkan hasil scan pada kolom Text Editor ke
Microsoft Word, kita dapat menyorot teks atau paragraf yang kita
perlukan dan mengkopinya (CtrI+C) dan membuka halaman dokumen Word lalu
mem-pastenya (CtrI+V).
UJI KOMPETENSI
I. Uraian
1. Apa yang dimaksud dengan OCR?Apa fungsi utama OCR?
2. Aplikasi apa yang dibutuhkan untuk dapat mengentry data dengan OCR?
3. Apa perbedaan utama antara proses mengentry data image dengan data teks’?
4. Dapatkah aplikasi FreeOCR.net digunakan untuk mengedit (menyunting) teks yang kita scan?
5. Dapatkah kita mengentry data teks dengan OCR Iangsung
menggunakan aplikasi pengolah kata seperti Microsoft Word atau Adobe
PageMaker? Jelaskanlah pendapatmu berdasarkan pengalaman yang kamu
Iakukan!
II. Pengembangan Diri
1. Carilah sebuah majalah atau teks Iiteratur Iain sebagai
bahan. Pilih dan persiapkanlah salah satu teks yang dianggap menarik
olehmu.
2. Lakukan scanning atas teks yang telah kamu pilih dengan
menggunakan OCR sesuai dengan prosedur yang telah kamu pelajari. Lakukan
editing atau penyuntingan atas teks yang kurang jelas atau salah
menafsirkan karakter.
3. Pindahkan teks hasil scanning ke aplikasi pengolah kata
(Microsoft Word). Simpanlah (Save) dokumen hasil scanning tersebut dalam
format .doc. Namailah file tersebut dengan menggunakan judul teks yang
discan.
4. Lakukan pula penyimpanan dokumen hasil dengan format lain.
Misalnya menyimpan dengan format .rtf, .temp, atau yang lainnya sesuai
dengan software aplikasi yang terinstal dalam komputermu!
5. Cetaklah data hasil scan tersebut!
Tidak ada komentar:
Posting Komentar