‘Optik Karakter Tanıma’ veya ‘Optik Karakter Okuyucu’ olarak adlandırılan bu yazılımlar, taranan bir belgede, bir fotoğrafta, el yazısıyla yazılmış bir metinde yer alan yazıların bilgisayar ortamına aktarılmasını sağlamak için geliştirilmiş yazılımlardır. Normal şartlarda bilgisayara tarayıcı vasıtasıyla aktarılan grafik dosyaları, bilgisayar tarafından resim olarak algılanır. Bu grafik dosyadaki yazılar ‘OCR’ yazılımları tarafından çözümlenip metin dosyasına çevrilebilir. Böylelikle klavye kullanmaya gerek kalmadan metin bilgisayara aktarılacaktır. ‘OCR’ ile metinleştirilen veriler, üzerinde düzenleme yapılabilecek verilerdir. Metin dosyaları, bilgisayarda görüntü dosyalarından daha az yer kaplar. ‘OCR’ yazılımlarının hata oranı sıfır olmasa da, günümüzde kullanımı oldukça yaygınlaşmıştır. Fotoğrafı metne dönüştürme programı denildiğinde kastedilen şey ‘OCR’ yazılımlarıdır.

‘Optik Karakter Tanıma’, en başta görme engelli kullanıcılar için metinlerin okunmasını sağlayacak cihazlar üretilmesi için ortaya çıkmıştır. Emanuel Golberg, 1914 yılında karakter okuması yapan ve onları telgraf kodlarına dönüştüren bir cihaz geliştirmiştir. Bu cihazı takip eden ‘Optophone’ ise, avuç içi büyüklüğünde bir tarayıcı olup, özel harfleri ve karakterleri de okuyabilen bir cihaz olarak ortaya çıkmıştır.

Optical Character Recognition OCR Nedir 1Optik Karakter Okuyucular’, akıllı telefon ve gözlüklerin ortaya çıkması ile yaygınlaşmış ve kullanılabilmesi için çeşitli uygulamalar geliştirilmiştir. Cihazların üzerindeki fotoğraf makineleri ile çekilen fotoğraflar veya belgeler, çok kısa bir süre içerisinde metin formatına dönüştürülebilmektedir.

İki temel ‘OCR’ algoritması bulunmaktadır. Matris eşleştirme, desen tanıma olarak da tanımlanabilecek olan bu algoritma, görüntüyü piksel-piksel tarayarak benzer bir dosya ile karşılaştırır ve metne döker. Bu algoritma, eski daktilo metinlerinde doğru bir biçimde çalışmaktadır. Ancak günümüzdeki yazı tiplerinde iyi sonuç vermemektedir.

Optical Character Recognition OCR Nedir 2Özellik özütleme ise grafikleri çizgiler, kapalı döngüler, çizgi kesişmeleri gibi özelliklere dönüştürür. Bu algoritma, verinin boyutunu azaltır ve tanımlama işlemini verimli hale getirir. Bilgisayarla görme ve el yazısını tanımak için kullanılan modern ‘OCR’ yazılımlarında bu yöntemden yararlanılır.

Bilinen en iyi OCR yazılımları

Tesseract: İşletim sistemleri için geliştirilmiştir. HP tarafından, kapalı kaynak kodlu bir yazılım olarak üretilmiş ve 2005 yılında HP ve UNLV tarafından yayınlanmıştır. Desteklediği diller arasında Türkçe de vardır. Birçok dilde kullanılabilir. Piyasadaki en hızlı ve etkili ücretsiz yazılımdır.

MODI: Microsoft tarafından geliştirilen bu yazılım, MS Office 2003-2007 sürümleri ile birlikte gelen ve araçlar klasöründe yer alan bir uygulamadır. Bu uygulamamanın kullanılabilmesi için bilgisayarlarda MS Office uygulamalarının yer alması şarttır. Taradığı dosyaları Word dokümanına dönüştürmektedir.