Merhaba arkadaşlar,
Elimde geliştirmem gereken bir proje var ve sistemi en doğru mantıkla kurgulamak istiyorum.
İlk etapta elimde 10 farklı evrak bulunuyor. Bunların bir kısmı metin, bir kısmı ise araç fotoğraflarından oluşuyor. Evrakları Gemini'ye inceleterek belirlediğimiz koşulları karşılayıp karşılamadığını, fotoğraflarda ise doğru plakaların yer alıp almadığını kontrol ettirmemiz gerekiyor. Ardından araçların, mevcut evraklarla uyumlu olup olmadığını eşleştirerek bir sonraki aşamaya geçeceğiz.
Öğrenmek istediğim; görüntü ve metin işleme konusunda en mantıklı model hangisidir? Gemini 2.5 Flash ile mi ilerlemeliyim? API maliyetlerini artırmadan, bu işlemi binlerce kez tekrarlayacak bir otomasyon için en verimli yol nedir?
Fotoğrafları işlemek için yine gemini 2.5 flash mı kullanmalıyım yoksa başka modelmi kullanmalıyım. Hem tasarruflu hemde sürdürülebilir olması gerekiyor.
Yapay Zeka ile Otomasyon
3
●166
- 04-04-2026, 21:14:04merhaba, maliyet açısından fotoğrafı ve belgeyi önce otomasyonla birleştirin ve pdf yapın. Böylece iki ayrı sorgu maliyeti oluşmaz. Doğru değerlendirme açısından şimdilik Claude daha başarılı görünüyor. İki modeli de aynı koşullarda api ile 100 kez test edin. İstatistik çıkarın. Böylece hem maliyet hem başarı ortalaması net biçimde ortaya çıkar. Sıfır maliyet ise ancak sunucuda işleyecek bir modelle mümkün olur. Bunun da başarısı modele göre değişse de çok yüksek olmaz. Ai dışında programlanarak yapılacak koşullu otomasyonda da sıfır maliyet çıkar. Plakalar için ocr okuyucular gerekli. Karmaşık evraklar varsa koşulların oluşturulması çok uzun sürebilir.
- 04-04-2026, 21:16:40local çalışan modeller ile maliyetsiz bir şekilde kolayca yapılabilir
- 04-04-2026, 21:25:00Merhaba,
Gemini 2.5 Flash Lite görsel okuyabiliyor maliyet olarakta daha düşük. İşinizi görürü mü bilmem ama bir şans verin.
Ayrıca AI API sağlıyorum yaklaşık %50 daha ucuza, herhangi bir sorunuz olursa yazabilirsiniz.