Shazam, Aradığınız Şarkıyı Saniyeler İçinde Nasıl Buluyor? Hem de Artta Gürültü Olsa Bile!

Shazam, Aradığınız Şarkıyı Saniyeler İçinde Nasıl Buluyor? Hem de Artta Gürültü Olsa Bile!

Oturduğumuz bir kafede, katıldığımız etkinliklerde ya da en kolayından havalı görüntü edit’lerinde duyduğumuz şarkılar güzelimize gittiğinde telefonumuzu açıp Shazam’a giriyoruz ve Shazam da saniyeler içinde o şarkıyı bize verebiliyor. 

Bunu bilhassa de kafe ve aktiflik üzere art plan seslerinin ağır olduğu ortamlarda yapabilmesi ise durup; “nasıl saniyeler içinde şarkıyı buluyor” diye düşündürüyor. Elbette şarkıyı bulduktan sonra, sıradaki şarkıyı Shazam’lama muhtaçlığı duyana kadar uygulamanın yüzüne bakmadığımız için art planda dönenlere pek de dikkat etmiyoruz. Ama işin o kısmı daha etkileyici.

Öncelikle kısaca Shazam’dan bahsedelim.

2022’de ayda 225 milyonu aşkın kullanıcıya ulaşmış olan uygulamamız epey kolay bir mantığa sahip. Uygulamayı açtığınızda yapmanız gereken tek şey büyük logoya bir sefer dokunmak. Bunun akabinde Shazam, mikrofonunuzu kullanarak müziği dinliyor ve ne olduğunu adeta bir kara büyü üzere saniyeler içinde buluyor.

Tabii biz tekrar de Orta Çağ geleneklerinden uzaklaşıp Shazam’a kara büyü dememeyi tercih edelim. İşte gerisindeki mantık:

Shazam’a müziği dinlettiğinizde uygulamada o müziğin ses dalgaları, bilgisayarın işleyebileceği datalara dönüşmüş oluyor. Bu sayede her müzik için eşsiz bir dalga oluştuğundan, bir parmak izi oluşturulmuş oluyor. Bu süreç bir basitleştirme temelinde ilerliyor. Sesin yükseldiği, inceldiği yahut kalınlaştığı yerleri tümüyle dahil etmek yerine bu olayların ses dalgalarındaki zirve noktaları dikkate alınıyor. Zati sürecin saniyeler sürmesini sağlayan da bu kolaylık.

Temel mantığı anladıktan sonra pratik örneğe geçelim. Diyelim ki kafede otururken çalan müzik hoşunuza gitti ve şarkıyı Shazam’ladınız. Logo’ya bastığınız an Shazam, sesi kaydederek bir spektrogram oluşturuyor. Mikrofona gelen tüm seslerin belli bir vakit (Shazam için maks. 20 saniye) aralığında kaydedildiği bu spektogram’da daha sonradan, az evvel bahsettiğimiz zirve noktaları oluşturuluyor ve üstte gördüğünüz karmaşa kolaylaşmış oluyor.

Son etapta ise artık veriye dönüşmüş olan bu zirve noktaları, birbiriyle eşleştirilerek Shazam’ın devasa kütüphanesinde öteki bilgi çiftleriyle karşılaştırılıyor. Şayet gereğince çift eşleşirse de Shazam, şarkıyı bulduğunu söyleyerek şarkı ismini ve sanatçıyı verebiliyor. Elbette bu uzun uzun anlattığımız süreç, bilgisayar tarafından geliştirildiğinden saniyeler içinde bitebiliyor.

Bu açıdan baktığımızda Shazam algoritması, bizim nefes alıp vermemiz kadar kolay ve tıpkı formda ayrıntılı.

Kaynaklar: Toptal, Wall Street Journal