Bildiğim kadarıyla cevaplamaya çalışayım, aslında mantığının shazam ile aynı olduğunu düşünüyorum. Gelen sesin frekanslarını alıyorlar veritabanındaki frekanslar ile karşılaştırma yapıyor olabilirler.
Shazam çalışma algoritmasını inceleyerek daha fazla bilgi edinebilirsiniz.
Komut algılatmaktan ziyade her sese bir kimlik tanımla durumuna bir örnek arıyorum hocam ama teşekkür ederim shazama göz atacağım.