Tat Tune, Named

A Shazam áll a legközelebb a mobiltelefonok varázslatához. Tegyük fel, hogy egy étteremben ülsz, megszólal egy dal, és nem tudod hova tenni a dallamot. Régebben korlátozottak voltak a lehetőségeid; megpróbálhattad volna megkérdezni a házastársadat vagy a pincért, de ez a megközelítés azzal a kockázattal járt, hogy kiderült a tudatlanságod. (Ez a ” Sex Machine”, te hülye.) A Shazam – amely 2002-ben indult az Egyesült Királyságban telefonos szolgáltatásként, és tavaly vált széles körben ismertté az Egyesült Államokban, amikor megjelent az iPhone-on – néhány kattintással megoldja a dilemmát. Nyomj meg egy gombot a telefonodon, és másodperceken belül megkapod az előadó és a dal címét. A videojátékokon kívül ez a leghasznosabb dolog, amit a telefonoddal csinálhatsz.

Hirdetés

A múlt héten a Shazam bejelentette, hogy világszerte már több mint 50 millióan használják a szolgáltatást, szemben az év eleji 35 millióval. A cég azt is közölte, hogy meg nem nevezett befektetést kapott a KPCB nevű mesés szilícium-völgyi kockázati tőkecégtől. A Shazam sikere jogosnak tűnik – ez az az alkalmazás, amelyet megmutathatsz az iPhone-szkeptikusoknak, hogy újragondolják álláspontjukat (bár a Shazam Android, BlackBerry, Windows Mobile és nagyjából minden más telefonon is elérhető). Minden elismerés ellenére a Shazam belső működése meglehetősen rejtélyes. Hogyan azonosítja valójában a dalt? Hogyan keres pénzt a cég? (Egy tipp: az iPhone-felhasználóknak hamarosan fizetős verzióra kell számítaniuk.) És mik a hosszú távú kilátásai egy olyan cégnek, amelynek egyetlen célja egy akut, nagyon alkalmi igény kielégítése?

Először is, egy rövid magyarázat a Shazam működéséről. A cég több mint 8 millió zeneszámot tartalmazó könyvtárral rendelkezik, és kidolgozott egy olyan technikát, amellyel minden egyes zeneszámot egyszerű numerikus aláírássá – egy olyan kóddá – lehet bontani, amely minden egyes zeneszámra egyedi. “A lényeg itt az, hogy létrehozzuk az egyes előadások “ujjlenyomatát” – mondja Andrew Fisher, a Shazam vezérigazgatója. Amikor a telefonodat egy azonosítani kívánt dalhoz tartod, a Shazam ugyanezzel a módszerrel alakítja át a klipet aláírássá. Ezután már csak mintaillesztésről van szó – a Shazam átkutatja a könyvtárát a klipből létrehozott kód után; ha megtalálja ezt a bitet, tudja, hogy megtalálta a dalt.

Hirdetés

OK, de hogyan készíti a Shazam ezeket az ujjlenyomatokat? Ahogy Avery Wang, a Shazam vezető kutatója és egyik társalapítója 2003-ban a Scientific American-nek elmagyarázta, a cég megközelítését sokáig számítási szempontból kivitelezhetetlennek tartották – úgy gondolták, túl sok információ van egy dalban ahhoz, hogy egy egyszerű aláírást összeállítsanak. De miközben a problémával birkózott, Wangnak zseniális ötlete támadt: Mi lenne, ha egy dalban szinte mindent figyelmen kívül hagyna, és helyette csak néhány viszonylag “intenzív” pillanatra koncentrálna? Így a Shazam minden egyes dalhoz létrehoz egy spektrogramot az adatbázisában – egy grafikont, amely a zene három dimenzióját ábrázolja: frekvencia vs. amplitúdó vs. idő. Az algoritmus ezután kiválasztja azokat a pontokat, amelyek a grafikon csúcspontjait jelentik – azokat a hangjegyeket, amelyek “magasabb energiatartalmat” tartalmaznak, mint a körülöttük lévő összes többi hangjegy, ahogyan azt Wang a Shazam működésének leírására kiadott tudományos tanulmányában (PDF) elmagyarázta. A gyakorlatban ez körülbelül három adatpontot jelent másodpercenként és dalonként.

Azt gondolnánk, hogy a dalban lévő szinte összes információ figyelmen kívül hagyása pontatlan egyezésekhez vezet, de a Shazam ujjlenyomat-felvételi technikája figyelemre méltóan immunis a zavarokra – rossz mobilkapcsolatokon keresztül zajos környezetben is képes egyezni a dalokat. Fisher szerint a vállalat nemrégiben megtalálta a módját annak is, hogy olyan zenéket is összepárosítson, amelyeket észrevétlenül felgyorsítottak (ahogyan azt a klub DJ-k néha teszik, hogy egy bizonyos tempóhoz igazodjanak, vagy ahogyan a rádiós DJ-k teszik, hogy egy reklámszünet előtt beillesszenek egy dalt). És meg tudja különböztetni ugyanannak a dalnak a különböző változatait. Most próbáltam ki a “Landslide” három különböző változatán – a Fleetwood Mac eredeti változatán, valamint a Smashing Pumpkins és a Dixie Chicks feldolgozásain -, és mindegyiket eltalálta.

Hirdetés

Fisher nem volt hajlandó megmondani a Shazam általános találati arányát. Csak annyit mondott, hogy a szolgáltatás elég jó ahhoz, hogy az emberek visszatérjenek a szolgáltatáshoz – az átlagos felhasználó havonta nyolcszor keres dalokat. A Shazam leggyakrabban azért nem azonosít egy dalt, mert nincs elég adat. A rendszernek legalább öt másodpercnyi zenére van szüksége a találathoz, és néha az emberek éppen akkor kapcsolják be, amikor a dal véget ér. Gyakran előfordulnak hibák akkor is, amikor az emberek élő előadásokat keresnek – ha a Saturday Night Live zenei szegmense alatt a tévéhez tartja a telefonját, a Shazam nagy valószínűséggel nem fogja azonosítani a dalt. (Ha mégis találatot kap az SNL-ből, akkor valószínűleg azt az epizódot nézi Ashlee Simpsonnal – a Shazam nagyszerű módja annak, hogy elkapja a szájszinkronizálót). Fisher szerint a Shazam technikailag képes élő előadásokon is dolgozni, de ezt a képességet kikapcsolták, szerinte “üzleti okokból”. “Jelenleg az emberek bíznak a márkában – ha megpróbálnánk élő dalokat összevetni, nem lenne túl nagy a pontosság” – mondja. (Ha megragadt egy dallam a fejedben, próbáld ki a Midomit, a Shazam riválisát, amely a dúdolásod vagy éneklésed alapján képes azonosítani a dalokat.)

A Shazam iPhone-verziója kasszasiker volt, de még mindig csak a szolgáltatás ügyfélbázisának 20 százalékát teszi ki, amely több mint 150 országra és a világ nagyjából minden mobilszolgáltatójára kiterjed. Az iPhone-verzió egyben újdonságot is jelentett a vállalat számára – ez volt az első olyan verzió, amelyet a Shazam ingyenesen kínált. Fisher szerint ez jó ötletnek bizonyult; a Shazam azonnali hírnevet szerzett, és a vállalatnak most már elég nagy az ügyfélbázisa ahhoz, hogy tisztességes pénzt tudjon keresni az alkalmazáson belüli hirdetésekkel és azzal, hogy részesedést kap minden egyes dalvásárlásból, amelyet az emberek az alkalmazáson keresztül végeznek. Fisher szerint azonban nem fenntartható, ha örökké teljesen ingyenes marad a szolgáltatás. A vállalat nemrég mutatta be az alkalmazás Windows Mobile verzióját, amely egy “freemium” árképzési modell szerint működik – az ingyenes verziót letöltő felhasználók havonta öt dalt kereshetnek, míg a prémium verzió, amely egyszeri 5 dolláros díjért vásárolható meg, korlátlan dalkeresést tesz lehetővé. Fisher szerint az iPhone-ra (és a legtöbb más platformra) szánt 5 dolláros verzió az év végéig fog megjelenni.

Hirdetés

A vállalat azt is tervezi, hogy sokkal több szolgáltatást is hozzáad az alkalmazásaihoz – egy ajánlómotort, egy olyan lehetőséget, amellyel megoszthatjuk zenei ízlésünket barátainkkal, és olyan grafikonokat, amelyek megmutatják, hogy az emberek milyen dalokat keresnek. A Shazam minden hétfőn elküldi chartjait a lemezkiadóknak, és a vezetők az adatok alapján szerződtetnek előadókat. Ennek köszönhetően a művészek számára új lehetőség nyílt a mainstreambe való betörésre: a tévéreklámokban való megjelenés. 2005-ben például a Volkswagen Európában a Golf GTI-t reklámozta, amelyben a Mint Royale “Singin’ in the Rain” című dalának újrakevert változata szerepelt. A dal rengeteg keresést inspirált a Shazam-on – és arra késztette a zenekar kiadóját, hogy kiadja a számot, amely aztán az európai slágerlisták élére került. “Valószínűleg havonta legalább egyszer látjuk ezt világszerte” – mondja Fisher. Más szóval a Shazam nem csak abban segít, hogy a közönség zenét találjon. Néha a zenének is segít megtalálni a közönséget.

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé.