Site içi veya başka siteden gelen linklerde, gelen url robots.txt'de engellendiyse bile index alabilir. Bir linkten gelinen urlde robots.txt kontrol edilmez. Robot doğrudan sitenizi taramak için geldiyse robots.txt o zaman işe yarar, önceden indexlenmiş olan engellenen urli de siler ama bi nevi kısır döngüye sebeb olur.
Yaızılımda urlden gelen parametreleri kontrol edip istenmeyen parametre varsa meta noindex kullanmak bence en kesin çözümdür. İstenmeyen parametre asıl urlin sonuna eklendiyse yani doğru url biliniyorsa asıl urle yönlendirmek daha da faydalı olur kanaatindeyim.
Fringe izliyorum

alıntı falan yapılmasın artık