3-5 dakikalık ve harekette algılanacak çoklu araç gesture'ları içeren bir kayıt örneği içeren video linki paylaşabilir misiniz?
Görüntüdeki hareketlere göre öneri getirmek daha kolay olur.


Yani, şu şekildeki bir görüntüde kaç tır, kaç suv, kaç panel var ayırmak zor olabilir.


Bir de, aynı türdeki araçların türevleri de birbirinden ayrıştırılacak mı?
örnek: