Minggu, 28 April 2013

yang dimaksud optical character recognition

Optical Character Recognition (OCR) adalah sarana yang digunakan untuk mengenali karakter optis untuk membaca informasi ke dalam sistem komputer. Indentifikasi karakter yang tercetak ini dilakukan dengan menggunakan pengindera cahaya seperti yang terdapat pada scanner. Sistem pemrosesan data yang ideal merupakan sistem di mana data diterima dari sumber dan diolah secepat mungkin. Dalam hal ini, mesin mengenali simbol dan angka, langsung dalam format yang lama, seperti yang digunakan manusia dalam aktivitas bisnis dan sosial sehari-hari.
Saat ini pola yang dapat dikenali komputer tidak cocok dibaca manusia. Demikian juga, data yang berasal dari manusia biasanya tidak diimpor langsung ke komputer. Meski demikian, penanganan data dilambangkan dengan proses konversi dari format manusia ke format komputer.
Tujuan utamanya adalah memungkinkan komputer langsung membaca dokumen sumber. Masalah konversi pola di dokumen input ke signal elektronik, yang cocok untuk diolah komputer merupakan salah satu pengenalan pola.
Pada saat ini terdapat dua sistem otomatis yang dirancang untuk dapat mengenali karakter cetakan, yakni: OCR (Optlcal Character Recognition) dan MICR (Magnetic Ink Character Recognition).
Pada awalnya, karakter dicetak dalam format typeface konvensional, atau bar code. Biasanya bertinta hitam dengan latar belakang putih. Kemudian karakter di-scan dengan mengukur pantulan optis. Dalam sistem MICR, karakter dicetak dalam format yang mempunyai stylesheet sempurna, dengan tinta yang difragmentasi dengan partikel bermagnet. Saat dokumen MICR dibaca, tinta ditarik sebelum karakter berada pada head baca. Signal output yang dihasilkan, diatur oleh partikel bermagnet yang melewati head untuk memindai segala karakter proporsional terhadap proyeksi vertikal suatu karakter.
Kemampuan mesin mengenali karakter yang dicetak dalam format yang mudah dikenali manusia, mempunyai keuntungan besar dalam mengurangi tugas pengumpulan data. Jadi, dapat mempercepat aliran data di sistem. Biaya persiapan data dapat ditekan dan lebih akurat dibanding metode yang lebih konvensional.
Sistem pengenalan karakter dikembangkan di berbagai organisasi dan menghasilkan berbagai macam sumber typeface. Dengan adanya penyempurnaan teknik pengenalan karakter, standarisasi telah ditetapkan, namun masih terlihat perbedaan sumber yang digunakan.
Di bidang MICR, cenderung sedikit bervariasi, dan hanya ada dua sumber, yakni E13B dan CMC7. Keduanya diterima sebagai standar intemasional.
Di bidang sistem OCR, banyak terdapat variasi, meski organisasi standar internasional telah mengajukan dua standar sumber yang bernama OCR’A’ dan OCR’B’.
Dalam beberapa hal, MICR kurang fleksibel dibanding OCR. Sistem MICR menghendaki bahwa karakter harus dicetak dalam format yang mempunyai stylesheet sempurna, dan sangat akurat. Akan tetapi, sistem pengenalan ini terletak pada partikel bermagnet yang membentuk setiap karakter. Meskipun demikian, sulit dikritik, sistem OCR memiliki sejumlah kelebihan ketika menangani dokumen yang rusak dan terlipat atau dokumen yang telah kotor atau ditindih karakter.
Sistem OCR tidak terpengaruh oleh format dengan stylesheet tertentu. Bahkan stylesheet yang kurang sempurna dapat dikenali. OCR juga dapat mengenali karakter yang dibuat oleh mesin tik manual dan dapat dikonversi ke dalam karakter yang terdapat dalam komputer. Aspek ini memungkinkan kemudahan dan fleksibilitas dalam menentukan proses pengumpulan data. Di kedua sistem, karakter yang dibaca, harus dicetak di area dokumen yang ditentukan dengan standar registrasi pencetakan yang cukup tinggi.
MICR telah digunakan dalam cek perbankan di seluruh dunia. MICR sorter/reader digunakan untuk menyortir cek secara otomatis, untuk membagi cek ke nasabah di berbagai cabang, dan cek sebelumnya dicetak dengan kode cabang. Nomor cek dan nomor rekening nasabah juga dicetak sebelumnya. Nantinya jumlah transaksi dapat ditambahkan dengan MICR encoder. Perincian cek otomatis dapat dibaca pada memori komputer untuk meng-update rekening pelanggan.
OCR telah digunakan sebagai turn around document dalam akuntansi sewa-beli dan aplikasi serupa. Setiap pelanggan diberi buku voucher yang dicetak beserta jumlah pembayaran dalam kontrak sewa.
Sebagai langkah pengenalan terhadap sistem OCR, marilah kita lakukan langkah-langkah pemindaian (scanning) berikut ini.
1.  Aktifkan aplikasi FreeOCR.net melalui menu Start dan All Program sehingga muncul tampilan awal seperti ini.
2. Terdapat beberapa menu dan toolbar yang digunakan, yaitu :

File, digunakan jika kita akan melakukan :
.
.

Open ( membuka) file yang pernah di-scan atau gambar berupa teks.
Scan atau memindai suatu gambar teks.
Select Scanner, bila ada beberapa mesin secanner yang terhubung dengan komputer kita.
Save teks digunakan apabila kita akan menyimpan teks dalam file berektensi txt.
Exit untuk keluar dari software.
Start OCR Process, digunakan ketika kita telah mendapatkan gambar (image) berupa teks untuk merubahnya menjadi teks yang dapat disunting (editing).
.

Pilihlah menu Settings, untuk melakukan setting bahasa.
3.   Setelah diset, kini kita siap melakukan pemindaian (scanning) dengan menggunakan OCR.
4.   Simpanlah atau letakkanlah teks yang akan kita scan dalam lensa Scanner. .
5.   Pilihlah menu File lalu klik perintah Scan atau klik langsung toolbar Scan
dan tunggulah bebarapa saat ketika aplikasi melakukan Scanning Page kemudian klik toolbar OCR maka aplikasi melakukan Recognition Page, sehingga akhirnya muncul tampilan Text Editor.
6.    Pada Text Editor inilah kita dapat mengolah, menyunting, dan memperbaiki teks sesuai dengan aslinya sebelum kita menyalin dan memindahkannya ke dalam aplikasi Iain (misalnya ke dalam Microsoft Word).
7.    Untuk memindahkan hasil scan pada kolom Text Editor ke Microsoft Word, kita dapat menyorot teks atau paragraf yang kita perlukan dan mengkopinya (CtrI+C) dan membuka halaman dokumen Word lalu mem-pastenya (CtrI+V).
UJI KOMPETENSI
I.    Uraian
1.    Apa yang dimaksud dengan OCR?Apa fungsi utama OCR?
2.    Aplikasi apa yang dibutuhkan untuk dapat mengentry data dengan OCR?
3.    Apa perbedaan utama antara proses mengentry data image dengan data teks’?
4.    Dapatkah aplikasi FreeOCR.net digunakan untuk mengedit (menyunting) teks yang kita scan?
5.    Dapatkah kita mengentry data teks dengan OCR Iangsung menggunakan aplikasi pengolah kata seperti Microsoft Word atau Adobe PageMaker? Jelaskanlah pendapatmu berdasarkan pengalaman yang kamu Iakukan!
II.    Pengembangan Diri
1.      Carilah sebuah majalah atau teks Iiteratur Iain sebagai bahan. Pilih dan persiapkanlah salah satu teks yang dianggap menarik olehmu.
2.      Lakukan scanning atas teks yang telah kamu pilih dengan menggunakan OCR sesuai dengan prosedur yang telah kamu pelajari. Lakukan editing atau penyuntingan atas teks yang kurang jelas atau salah menafsirkan karakter.
3.      Pindahkan teks hasil scanning ke aplikasi pengolah kata (Microsoft Word). Simpanlah (Save) dokumen hasil scanning tersebut dalam format .doc. Namailah file tersebut dengan menggunakan judul teks yang discan.
4.      Lakukan pula penyimpanan dokumen hasil dengan format lain. Misalnya menyimpan dengan format .rtf, .temp, atau yang lainnya sesuai dengan software aplikasi yang terinstal dalam komputermu!
5.      Cetaklah data hasil scan tersebut!

Tidak ada komentar:

Posting Komentar