Optical Character Recognition
(OCR) adalah proses dimana gambar teks diubah menjadi format teks yang dapat
dibaca oleh mesin. Misalnya, jika Anda memindai formulir atau tanda terima,
komputer Anda akan menyimpan pindaian tersebut sebagai file gambar. Anda tidak
dapat menggunakan editor teks untuk mengedit, mencari, atau menghitung kata
dalam file gambar. Namun, OCR dapat digunakan untuk mengonversi gambar menjadi
dokumen teks dengan isinya sebagai data teks.
Mengapa OCR penting?
Sebagian besar alur kerja bisnis
melibatkan penerimaan informasi dari media cetak. Formulir cetak, faktur,
pindaian dokumen hukum, dan kontrak cetak adalah bagian dari proses bisnis.
Dokumen dalam jumlah besar ini membutuhkan banyak waktu dan ruang untuk
disimpan dan dikelola. Sementara manajemen dokumen digital dianjurkan,
mendigitalkan dokumen menciptakan tantangan. Prosesnya membutuhkan intervensi
manual dan bisa membosankan serta memakan waktu.
Selain itu, memindai konten
dokumen membuat file gambar dengan teks tersembunyi di dalamnya. Teks dalam
gambar tidak dapat diproses oleh perangkat lunak pengolah kata dengan cara yang
sama seperti dokumen teks. Teknologi OCR memecahkan masalah tersebut dengan
mengubah gambar teks menjadi data teks yang dapat diuraikan oleh perangkat lunak
bisnis lainnya. Anda kemudian dapat menggunakan data tersebut untuk melakukan
analitik, mengoptimalkan operasi, mengotomatiskan proses, dan meningkatkan
produktivitas.
Bagaimana cara kerja OCR?

Mesin OCR atau perangkat lunak
OCR bekerja melalui langkah-langkah berikut:
Akuisisi gambar
Pemindai membaca dokumen dan
mengubahnya menjadi data biner. Perangkat lunak OCR menganalisis gambar yang
dipindai dan mengklasifikasikan area terang sebagai latar belakang dan area
gelap sebagai teks .
Pra-pemrosesan
Perangkat lunak OCR pertama-tama
membersihkan gambar dan menghilangkan kesalahan untuk mempersiapkannya untuk
dibaca. Berikut adalah beberapa teknik pembersihan:
·
Luruskan atau miringkan sedikit dokumen yang
dipindai untuk memperbaiki ketidaksejajaran selama pemindaian.
·
Noda dihapus dari gambar digital atau tepi
gambar teks dihaluskan.
·
Bingkai dan garis gambar dibersihkan.
·
Skrip dikenali untuk teknologi OCR multibahasa.
Pengenalan teks
Dua jenis utama algoritma OCR
atau proses perangkat lunak yang digunakan oleh perangkat lunak OCR untuk
pengenalan teks disebut pencocokan pola dan ekstraksi fitur.
Pencocokan pola
Pencocokan pola mengisolasi
gambar karakter, yang disebut mesin terbang, dan membandingkannya dengan mesin
terbang yang disimpan serupa. Pengenalan pola hanya berfungsi jika mesin
terbang yang disimpan memiliki font dan skala yang sama dengan mesin terbang
input. Metode ini bekerja dengan baik dengan gambar dokumen yang dipindai yang
telah ditulis dalam font yang dikenal.
Ekstraksi Fitur
Ekstraksi fitur membagi atau
menguraikan mesin terbang menjadi fitur seperti garis, putaran, arah garis, dan
perpotongan garis. Kemudian menggunakan fitur ini untuk menemukan kecocokan
terbaik atau tetangga terdekat di antara mesin terbang yang disimpan.
Pengolahan pasca
Setelah analisis, sistem mengubah
data teks yang diekstraksi menjadi file terkomputerisasi. Beberapa sistem OCR
dapat membuat file PDF beranotasi yang menyertakan versi sebelum dan sesudah
dari dokumen yang dipindai.
Apa saja jenis-jenis OCR?
Ilmuwan data mengklasifikasikan
berbagai jenis teknologi OCR berdasarkan penggunaan dan aplikasinya. Berikut
beberapa contohnya:
Perangkat lunak pengenalan
karakter optik sederhana
Mesin OCR sederhana menyimpan
banyak pola gambar teks dan banyak font berbeda sebagai templat. Perangkat
lunak OCR menggunakan algoritme pencocokan pola untuk membandingkan gambar teks
, karakter demi karakter, dengan basis data internalnya. Jika sistem
mencocokkan teks kata demi kata, itu disebut pengenalan kata optik. Solusi ini
memiliki keterbatasan, karena font dan gaya penulisan hampir tidak terbatas,
dan tidak semua jenis dapat ditangkap dan disimpan dalam database.
Perangkat lunak pengenal
karakter optik cerdas
Sistem OCR modern menggunakan
teknologi Intelligent Character Recognition (ICR) untuk membaca teks dengan
cara yang sama seperti manusia. Mereka menggunakan metode canggih yang melatih
mesin untuk berperilaku seperti manusia menggunakan perangkat lunak
pembelajaran mesin . Sistem pembelajaran mesin yang disebut jaringan saraf
menganalisis teks di berbagai tingkatan dan memproses gambar berulang kali. Itu
mencari atribut gambar yang berbeda, seperti kurva, garis, persimpangan, dan
sirkuit, dan menggabungkan hasil dari semua tingkat analisis yang berbeda ini
untuk mendapatkan hasil akhir. Meskipun ICR biasanya memproses gambar satu
karakter dalam satu waktu, prosesnya cepat, dengan hasil yang dikirimkan dalam
hitungan detik.
Pengenalan kata yang cerdas
Sistem pengenalan kata yang
cerdas bekerja dengan prinsip yang sama seperti ICR, tetapi memproses gambar
kata penuh alih-alih melakukan pra-pemrosesan gambar karakter.
Pengenalan merek optik
Pengenalan Tanda Optik
mengidentifikasi logo, tanda air, dan simbol teks lainnya dalam dokumen.
Apa manfaat yang ditawarkan OCR?
Ilmuwan data mengklasifikasikan
berbagai jenis teknologi OCR berdasarkan penggunaan dan aplikasinya. Berikut
beberapa contohnya:
Perangkat lunak pengenalan
karakter optik sederhana
Mesin OCR sederhana menyimpan
banyak pola gambar teks dan banyak font berbeda sebagai templat. Perangkat
lunak OCR menggunakan algoritme pencocokan pola untuk membandingkan gambar teks
, karakter demi karakter, dengan basis data internalnya. Jika sistem
mencocokkan teks kata demi kata, itu disebut pengenalan kata optik. Solusi ini
memiliki keterbatasan, karena font dan gaya penulisan hampir tidak terbatas,
dan tidak semua jenis dapat ditangkap dan disimpan dalam database.
Perangkat lunak pengenal
karakter optik cerdas
Sistem OCR modern menggunakan
teknologi Intelligent Character Recognition (ICR) untuk membaca teks dengan
cara yang sama seperti manusia. Mereka menggunakan metode canggih yang melatih
mesin untuk berperilaku seperti manusia menggunakan perangkat lunak
pembelajaran mesin . Sistem pembelajaran mesin yang disebut jaringan saraf
menganalisis teks di berbagai tingkatan dan memproses gambar berulang kali. Itu
mencari atribut gambar yang berbeda, seperti kurva, garis, persimpangan, dan
sirkuit, dan menggabungkan hasil dari semua tingkat analisis yang berbeda ini
untuk mendapatkan hasil akhir. Meskipun ICR biasanya memproses gambar satu
karakter dalam satu waktu, prosesnya cepat, dengan hasil yang dikirimkan dalam
hitungan detik.
Pengenalan kata yang cerdas
Sistem pengenalan kata yang
cerdas bekerja dengan prinsip yang sama seperti ICR, tetapi memproses gambar
kata penuh alih-alih melakukan pra-pemrosesan gambar karakter.
Pengenalan merek optik
Pengenalan Tanda Optik
mengidentifikasi logo, tanda air, dan simbol teks lainnya dalam dokumen.
Apa manfaat yang ditawarkan
OCR?
Berikut adalah manfaat utama dari
teknologi OCR:
Teks yang dapat dicari
Bisnis dapat mengubah dokumen
lama dan baru mereka menjadi arsip pengetahuan yang dapat ditelusuri
sepenuhnya. Mereka juga dapat memproses database teks secara otomatis dengan
menggunakan perangkat lunak analisis data untuk pemrosesan pengetahuan lebih
lanjut.
Efektifitas operasional
Anda dapat meningkatkan efisiensi
dengan perangkat lunak OCR untuk secara otomatis mengintegrasikan alur kerja
dokumen dan alur kerja digital dalam bisnis Anda. Berikut adalah beberapa
contoh yang dapat dilakukan perangkat lunak OCR :
·
Pindai formulir yang diisi tangan untuk
verifikasi, peninjauan, pengeditan, dan analisis otomatis. Ini menghemat waktu
yang diperlukan untuk pemrosesan dokumen manual dan entri data.
·
Temukan dokumen yang diperlukan dengan mencari
istilah secara cepat di database sehingga Anda tidak perlu mengurutkan file
secara manual di dalam kotak.
·
Ubah catatan tulisan tangan menjadi teks dan
dokumen yang dapat diedit.
Solusi kecerdasan buatan
OCR sering menjadi bagian dari
solusi kecerdasan buatan lain yang dapat diterapkan oleh perusahaan. Misalnya,
memindai dan membaca pelat nomor dan rambu jalan di kendaraan otonom, mendeteksi
logo merek di postingan media sosial, atau mengidentifikasi kemasan produk
dalam gambar iklan. Teknologi kecerdasan buatan ini membantu perusahaan membuat
keputusan pemasaran dan operasional yang lebih baik yang mengurangi biaya dan
meningkatkan pengalaman pelanggan.
Untuk apa OCR digunakan?
Berikut adalah beberapa kasus
penggunaan umum untuk OCR di berbagai industri:
Perbankan
Industri perbankan menggunakan
OCR untuk memproses dan memverifikasi dokumen untuk dokumen pinjaman, cek
deposito, dan transaksi keuangan lainnya. Verifikasi ini meningkatkan
pencegahan penipuan dan meningkatkan keamanan transaksi. Misalnya, BlueVine
adalah perusahaan teknologi keuangan yang menyediakan pembiayaan untuk usaha
kecil dan menengah. Menggunakan Amazon Textract, layanan OCR berbasis cloud,
untuk mengembangkan produk bagi usaha kecil di AS agar dapat dengan cepat
mengakses pinjaman Program Perlindungan Gaji (PPP) sebagai bagian dari paket
stimulus dari bantuan COVID-19. Amazon Textract secara otomatis memproses dan menganalisis
puluhan ribu formulir PPP per hari sehingga BlueVine dapat membantu ribuan
bisnis memperoleh pendanaan, menghemat lebih dari 400.000 pekerjaan dalam
prosesnya.
Kesehatan
Industri perawatan kesehatan
menggunakan OCR untuk memproses catatan pasien, termasuk perawatan, tes,
catatan rumah sakit, dan pembayaran asuransi. OCR membantu merampingkan alur
kerja dan mengurangi pekerjaan manual di rumah sakit sambil terus memperbarui
catatan. Misalnya, nib Group memberikan asuransi kesehatan dan medis kepada
lebih dari satu juta warga Australia dan menerima ribuan permintaan medis
setiap hari. Pelanggan dapat mengambil foto tagihan medis mereka dan
mengirimkannya melalui aplikasi seluler nib. Amazon Texttract memproses gambar
ini secara otomatis sehingga perusahaan dapat menyetujui klaim lebih cepat.
Logistik
Perusahaan logistik menggunakan
OCR untuk melacak label paket, faktur, kuitansi, dan dokumen lainnya dengan
lebih efisien. Misalnya, Foresight Group menggunakan Amazon Textract untuk
mengotomatiskan pemrosesan faktur di SAP. Entri dokumen bisnis ini secara
manual memakan waktu dan rawan kesalahan, karena karyawan Foresight harus
memasukkan data ke dalam beberapa sistem akuntansi. Dengan Amazon Textract,
perangkat lunak Foresight dapat membaca karakter dengan lebih akurat di
berbagai tata letak, sehingga meningkatkan efisiensi bisnis.