‘Optik Karakter Tanıma’ veya ‘Optik Karakter Okuyucu’ olarak adlandırılan bu yazılımlar, taranan bir belgede, bir fotoğrafta, el yazısıyla yazılmış bir metinde yer alan yazıların bilgisayar ortamına aktarılmasını sağlamak için geliştirilmiş yazılımlardır. Normal şartlarda bilgisayara tarayıcı vasıtasıyla aktarılan grafik dosyaları, bilgisayar tarafından resim olarak algılanır. Bu grafik dosyadaki yazılar ‘OCR’ yazılımları tarafından çözümlenip metin dosyasına çevrilebilir. Böylelikle klavye kullanmaya gerek kalmadan metin bilgisayara aktarılacaktır. ‘OCR’ ile metinleştirilen veriler, üzerinde düzenleme yapılabilecek verilerdir. Metin dosyaları, bilgisayarda görüntü dosyalarından daha az yer kaplar. ‘OCR’ yazılımlarının hata oranı sıfır olmasa da, günümüzde kullanımı oldukça yaygınlaşmıştır. Fotoğrafı metne dönüştürme programı denildiğinde kastedilen şey ‘OCR’ yazılımlarıdır.
‘Optik Karakter Tanıma’, en başta görme engelli kullanıcılar için metinlerin okunmasını sağlayacak cihazlar üretilmesi için ortaya çıkmıştır. Emanuel Golberg, 1914 yılında karakter okuması yapan ve onları telgraf kodlarına dönüştüren bir cihaz geliştirmiştir. Bu cihazı takip eden ‘Optophone’ ise, avuç içi büyüklüğünde bir tarayıcı olup, özel harfleri ve karakterleri de okuyabilen bir cihaz olarak ortaya çıkmıştır.
İki temel ‘OCR’ algoritması bulunmaktadır. Matris eşleştirme, desen tanıma olarak da tanımlanabilecek olan bu algoritma, görüntüyü piksel-piksel tarayarak benzer bir dosya ile karşılaştırır ve metne döker. Bu algoritma, eski daktilo metinlerinde doğru bir biçimde çalışmaktadır. Ancak günümüzdeki yazı tiplerinde iyi sonuç vermemektedir.
Bilinen en iyi OCR yazılımları
Tesseract: İşletim sistemleri için geliştirilmiştir. HP tarafından, kapalı kaynak kodlu bir yazılım olarak üretilmiş ve 2005 yılında HP ve UNLV tarafından yayınlanmıştır. Desteklediği diller arasında Türkçe de vardır. Birçok dilde kullanılabilir. Piyasadaki en hızlı ve etkili ücretsiz yazılımdır.
MODI: Microsoft tarafından geliştirilen bu yazılım, MS Office 2003-2007 sürümleri ile birlikte gelen ve araçlar klasöründe yer alan bir uygulamadır. Bu uygulamamanın kullanılabilmesi için bilgisayarlarda MS Office uygulamalarının yer alması şarttır. Taradığı dosyaları Word dokümanına dönüştürmektedir.