claude cli ile denedim hızı güzel; sanki gemma3 ten daha iyi, fakat aynı agent falan çalışmadı çalıştıramadım,
detaylı bakamadım live translate entegre ettim çeviriler çok iyi gelecek güncellemede live stream stt geliyormuş en çok beklediğim özellik.
qwen denedim daha önce nedense dil olaylarında sıkıntı yaratıyor doğal dil'de yani. çok güzel gelişmeler yaşanıyor ai dünyasında.
açıkçası hayal kırıklığına uğradığımı söyleyebilirim sebebiyse 24 gb kartta 22k token anca kullanabiliyorum. Gemma4 26B A4B Q4_K_M modelini kullandım; 110t/s hızlarda stabil takılıyor. kalite olarak harbiden sağlam olmuş ama bu token limiti ile uzun işlerde kullanılmaz maalesef. turboquant ile yeniden paylaşılınca tekrar deneyeceğim.
QWEN3.5-35B-A3B Q4_K_M /// 20k token - 110t/s
QWEN3.5-27B-Claude-4.6-opus-reasoning-distilled /// 20k token - 45t/s
QWEN3.5-9B Q8_0 /// 80k token - 80t/s
GEMMA 4 26B A4B Q4_K_M /// 22k token - 110t/s