Apakah Pengiktirafan Watak Optik (OCR)?

Pengiktirafan Watak Optik (OCR) merujuk kepada perisian yang membuat versi digital dokumen dicetak, ditaip, atau tulisan tangan yang boleh dibaca komputer tanpa perlu mengetik secara manual atau memasukkan teks. OCR biasanya digunakan pada dokumen yang diimbas dalam format PDF, tetapi juga boleh membuat versi teks yang boleh dibaca komputer dalam fail imej.

Apakah OCR?

OCR, juga dirujuk sebagai pengiktirafan teks, adalah teknologi perisian yang mengubah aksara seperti nombor, huruf, dan tanda baca (juga disebut glyphs) dari dokumen cetak atau bertulis ke bentuk elektronik yang lebih mudah dikenali dan dibaca oleh komputer dan program perisian lain. Sesetengah program OCR melakukan ini sebagai dokumen diimbas atau difoto dengan kamera digital dan orang lain boleh memohon proses ini kepada dokumen yang sebelum ini diimbas atau difoto tanpa OCR. OCR membolehkan pengguna mencari dalam dokumen PDF, menyunting teks, dan memformat semula dokumen.

Apakah yang digunakan OCR?

Untuk keperluan pengimbasan setiap hari yang cepat, OCR mungkin bukan masalah besar. Jika anda melakukan banyak imbasan, dapat mencari dalam PDF untuk mencari yang tepat yang anda perlukan dapat menyimpan sedikit waktu dan membuat fungsi OCR dalam program pengimbas anda lebih penting. Berikut adalah beberapa perkara lain OCR membantu dengan:

Pemprosesan data automatik dan kemasukan data (Contoh: Sistem pengesan pemohon pekerjaan untuk resume)
Membuat buku-buku yang diimbas dicari
Menukar imbasan tulisan tangan ke teks yang boleh dibaca komputer
Membuat dokumen lebih berguna oleh program pembaca yang membantu pengguna cacat penglihatan
Memelihara dokumen bersejarah dan akhbar, sementara juga membuatnya mudah dicari
Pengekstrakan data dan pemindahan ke program perakaunan (Contoh: Resit dan invois)
Mengindeks dokumen untuk digunakan oleh enjin carian
Pengiktirafan plat lesen pemandu dengan kamera kelajuan dan perisian kamera cahaya merah
Pensyarah pidato untuk orang yang tidak boleh bercakap - ahli fizik teori, Stephen Hawking, mungkin merupakan pengguna yang paling terkenal dalam program pensintesis pidato

Mengapa Menggunakan OCR?

Mengapa tidak mengambil gambar, bukan? Kerana anda tidak dapat mengedit apa-apa atau mencari teks kerana ia hanya akan menjadi imej. Mengimbas dokumen dan menjalankan perisian OCR boleh mengubah fail itu menjadi sesuatu yang anda boleh edit dan dapat mencari.

Sejarah OCR

Walaupun penggunaan pengiktirafan teks yang paling terawal pada tahun 1914, pembangunan dan penggunaan teknologi OCR yang meluas secara luas bermula dengan bersungguh-sungguh pada tahun 1950-an, khususnya dengan penciptaan fon yang sangat mudah yang mudah diubah menjadi teks yang boleh dibaca secara digital. Yang pertama fon mudah dibuat oleh David Shepard dan biasanya dikenali sebagai OCR-7B. OCR-7B masih digunakan hari ini dalam industri kewangan untuk font standard yang digunakan pada kad kredit dan kad debit. Pada tahun 1960-an, perkhidmatan pos di beberapa negara mula menggunakan teknologi OCR untuk mempercepat penyusunan mel, termasuk Amerika Syarikat, Great Britain, Kanada, dan Jerman. OCR masih merupakan teknologi teras yang digunakan untuk menyusun mel untuk perkhidmatan pos di seluruh dunia. Pada tahun 2000, pengetahuan utama had dan keupayaan teknologi OCR digunakan untuk membangunkan program CAPTCHA yang digunakan untuk menghentikan bot dan spammer.

Selama beberapa dekad, OCR telah berkembang lebih tepat dan lebih canggih disebabkan kemajuan dalam bidang teknologi yang berkaitan seperti kecerdasan buatan, pembelajaran mesin, dan penglihatan komputer. Hari ini, perisian OCR menggunakan pengiktirafan corak, pengesanan ciri, dan perlombongan teks untuk mengubah dokumen lebih pantas dan lebih tepat berbanding sebelum ini.