Ako na radiju čujemo nepoznatu pjesmu koja nam se sviđa vrlo je vjerovatno da ćemo posegnuti za svojim pametnim telefonom, pokrenuti Shazam i saznati sve o toj pesmi. Ali, svima je velika misterija na koji to način Shazam uspjeva da prepozna svaku pesmu.
Shazam je glazbena aplikacija lansirana 2002. godine u Velikoj Britaniji, a široku popularnost dostiže pojavom u obliku Iphone aplikacije u SAD-u. Međutim, način na koji prepoznaje pjesme za mnoge korisnike i dalje je misterija.
Ova aplikacija posjeduje biblioteku sa više od 8 milijuna pjesama, a kompanija je razvila tehniku pomoću koje svaku pjesmu ili broj razlaže na jednostavan numerički potpis – kod jedinstven svakom glazbenom broju.
Kada želite da Shazam prepozna određenu pjesmu, aplikacija je pomoću iste metode pretvara u taj potpis. Nakon toga je potrebno samo uskladiti obrasce. Shazam pretražuje svoju biblioteku u potrazi za kodom koji je stvorio na temelju pjesme koju želite da prepozna, a kad prepozna taj dio, jednostavno zna da je pronašao traženu pjesmu.
Ipak, ostaje pitanje kako Shazam radi ove otiske? Pristup ove kompanije dugo se činio nepraktičnim. Smatralo se da unutar jedne pjesme postoji previše informacija da bi se stvorio jednostavan potpis. Shazam je to uspio da riješi na način da se unutar pjesme fokusirao isključivo na nekoliko "intenzivnih" trenutaka.
Za svaku pjesmu se u bazi stvara spektrogram – grafikon koji prikazuje tri dimenzije glazbe: frekvenciju nasuprot amplitude nasuprot vremena. Algoritam zatim bira samo ona mjesta koja se nalaze na samom vrhu grafikona – note koje posjeduju "energetski viši sadržaj" od ostalih oko njih.
Iako su mnogi smatrali da će ignoriranje gotovo svih informacija u vezi s nekom pjesmom dovesti do netačnih preklapanja, ova tehnika se pokazala izuzetno imunom na ometanje, a pjesmu može prepoznati i u bučnoj sredini. Također, algoritam može prepoznati različite verzije iste pjesme, uključujući i one ubrzane.
Što se neuspjeha tiče, najčešći razlog neuspjeha u prepoznavanju pjesme krije se u nedovoljnom broju podataka. Sistemu je potrebno barem 5 sekundi glazbe kako bi prepoznao pjesmu, a ljudi vrlo često ovu aplikaciju uključe na samom kraju pesme.
Osim toga, još jedan problem je i izvođenje pjesama uživo. Shazam je ovu mogućnost isključio zbog "poslovnih razloga". Kompanija također planira predstavljanje novih servisa.
Shazam je glazbena aplikacija lansirana 2002. godine u Velikoj Britaniji, a široku popularnost dostiže pojavom u obliku Iphone aplikacije u SAD-u. Međutim, način na koji prepoznaje pjesme za mnoge korisnike i dalje je misterija.
Ova aplikacija posjeduje biblioteku sa više od 8 milijuna pjesama, a kompanija je razvila tehniku pomoću koje svaku pjesmu ili broj razlaže na jednostavan numerički potpis – kod jedinstven svakom glazbenom broju.
Kada želite da Shazam prepozna određenu pjesmu, aplikacija je pomoću iste metode pretvara u taj potpis. Nakon toga je potrebno samo uskladiti obrasce. Shazam pretražuje svoju biblioteku u potrazi za kodom koji je stvorio na temelju pjesme koju želite da prepozna, a kad prepozna taj dio, jednostavno zna da je pronašao traženu pjesmu.
Ipak, ostaje pitanje kako Shazam radi ove otiske? Pristup ove kompanije dugo se činio nepraktičnim. Smatralo se da unutar jedne pjesme postoji previše informacija da bi se stvorio jednostavan potpis. Shazam je to uspio da riješi na način da se unutar pjesme fokusirao isključivo na nekoliko "intenzivnih" trenutaka.
Za svaku pjesmu se u bazi stvara spektrogram – grafikon koji prikazuje tri dimenzije glazbe: frekvenciju nasuprot amplitude nasuprot vremena. Algoritam zatim bira samo ona mjesta koja se nalaze na samom vrhu grafikona – note koje posjeduju "energetski viši sadržaj" od ostalih oko njih.
Iako su mnogi smatrali da će ignoriranje gotovo svih informacija u vezi s nekom pjesmom dovesti do netačnih preklapanja, ova tehnika se pokazala izuzetno imunom na ometanje, a pjesmu može prepoznati i u bučnoj sredini. Također, algoritam može prepoznati različite verzije iste pjesme, uključujući i one ubrzane.
Što se neuspjeha tiče, najčešći razlog neuspjeha u prepoznavanju pjesme krije se u nedovoljnom broju podataka. Sistemu je potrebno barem 5 sekundi glazbe kako bi prepoznao pjesmu, a ljudi vrlo često ovu aplikaciju uključe na samom kraju pesme.
Osim toga, još jedan problem je i izvođenje pjesama uživo. Shazam je ovu mogućnost isključio zbog "poslovnih razloga". Kompanija također planira predstavljanje novih servisa.