Merhabalar,
Doğru ve düzgün kullanılabilecek, Türkçe desteği olan bir ocr kütüphanesi var mı kullanabileceğimiz? Tercihen ücretsiz olacak. Abbyy'in lisansı var elimde, onun dev pack'i var mı acaba? Ya da farklı alternatif ne olabilir?
C# - Ocr
10
●556
- 18-11-2019, 16:37:36Tessaract sadece img to text yapıyor diye biliyorum. PDF ve imaj ağırlıklı çalışacağım için pdf te önem kazanıyor. iTextSharp ile pdf'i image yapıp tekrar tessaracte atıp text mi yapayım sizce? IronORC denemelerim başarılı oldu fakat yıllık 400 dolar vermeden çözmeye çalışıyorum.
- 19-11-2019, 04:04:12Hocam ben itextsharp’ı dijital imzalama için kullandım, tesseractı da searchable PDF oluşturmak için, İkisi de gayet güzel. Tesserract ile PDF de OCR işlemi yapabiliyorsun ekstra Bi dönüştürmeye gerek yok ki ben öyle çalışmıştım..
https://github.com/tesseract-ocr/tesseract/wiki/FAQ
Burdaki PDF başlığı altındakileri incele - 19-11-2019, 17:12:59Tesseract'ı kurcaladım biraz ama pdf to image to text dışında seçenek göremedim gibi. MODI kullanımını düşünüyorum ama orada da Office 2016'da daha düzgün bir DLL bulamadım. 2007'lerde microsoft kullanımı bırakmış ve paralıya mı dönmüş onu da çözemedim. 12'yi mi kullanmamız gerekiyor?