That Tune, Named

Shazam má nejblíže ke kouzlu mobilního telefonu. Řekněme, že jste v restauraci, zazní nějaká píseň a vy si ji nedokážete zařadit. V minulosti byly vaše možnosti omezené; mohli jste se zkusit zeptat manželky nebo číšníka na nápovědu, ale takový přístup znamenal riziko odhalení vaší neznalosti. (To je „Sex Machine“, hlupáku.) Shazam – který byl spuštěn ve Velké Británii v roce 2002 jako telefonická služba a ve Spojených státech se rozšířil loni, když se dostal na iPhone – vyřeší toto dilema několika kliknutími. Stiskněte tlačítko na telefonu a během několika sekund se dozvíte interpreta a název písně. Kromě hraní videoher je to nejužitečnější věc, kterou můžete na telefonu dělat.

Reklama

Minulý týden společnost Shazam oznámila, že službu využívá více než 50 milionů lidí po celém světě – oproti 35 milionům na začátku roku. Společnost také uvedla, že získala nezveřejněnou investici od známé společnosti KPCB, která se zabývá rizikovým kapitálem v Silicon Valley. Úspěch Shazamu se zdá být oprávněný – je to jediná aplikace, kterou můžete ukázat skeptikům iPhonu, aby přehodnotili svůj postoj (ačkoli Shazam je k dispozici také pro Android, BlackBerry, Windows Mobile a v podstatě jakýkoli jiný telefon). Přes všechnu chválu, kterou aplikace Shazam sklízí, je její vnitřní fungování docela záhadné. Jak vlastně identifikuje vaši skladbu? Jak společnost vydělává peníze? (Tady je jedna nápověda: uživatelé iPhonu by měli brzy očekávat placenou verzi.) A jaké jsou dlouhodobé vyhlídky firmy, jejímž jediným cílem je uspokojit akutní, velmi příležitostnou potřebu?

Nejprve krátké vysvětlení, jak Shazam funguje. Společnost má knihovnu s více než 8 miliony skladeb a vymyslela techniku, jak každou skladbu rozdělit na jednoduchý číselný podpis – kód, který je pro každou skladbu jedinečný. „Hlavní věcí je vytvoření ‚otisku‘ každého vystoupení,“ říká Andrew Fisher, generální ředitel společnosti Shazam. Když přiložíte telefon ke skladbě, kterou chcete identifikovat, Shazam stejnou metodou promění váš klip v podpis. Pak už je to jen otázka porovnávání vzorů – Shazam hledá ve své knihovně kód, který vytvořil z vašeho klipu; když tento kousek najde, ví, že našel vaši skladbu.

Reklama

Dobře, ale jak Shazam tyto otisky vytváří? Jak Avery Wang, hlavní vědecký pracovník společnosti Shazam a jeden z jejích spoluzakladatelů, vysvětlil v roce 2003 časopisu Scientific American, přístup společnosti byl dlouho považován za výpočetně nepraktický – mělo se za to, že v písni je příliš mnoho informací na to, aby bylo možné sestavit jednoduchý podpis. Když se však Wang s tímto problémem potýkal, dostal geniální nápad: Co kdyby ignoroval téměř vše v písni a místo toho se zaměřil jen na několik relativně „intenzivních“ momentů? Shazam tak vytvořil spektrogram pro každou skladbu ve své databázi – graf, který vykresluje tři dimenze hudby: frekvence vs. amplituda vs. čas. Algoritmus pak vybere právě ty body, které představují vrcholy grafu – noty, které obsahují „vyšší energetický obsah“ než všechny ostatní noty v okolí, jak vysvětlil Wang v akademické práci, kterou zveřejnil, aby popsal, jak Shazam funguje (PDF). Zdá se, že v praxi to vychází asi na tři datové body za sekundu na jednu skladbu.

Člověk by si myslel, že ignorování téměř všech informací v písni povede k nepřesným shodám, ale technika snímání otisků prstů Shazam je pozoruhodně odolná vůči rušivým vlivům – dokáže porovnávat písně v hlučném prostředí přes špatné mobilní připojení. Fisher říká, že společnost také nedávno našla způsob, jak porovnávat hudbu, která byla nepozorovaně zrychlena (jak to někdy dělají kluboví DJové, aby se přizpůsobili určitému tempu, nebo jak to dělají rozhlasoví DJové, aby skladbu zařadili před reklamní přestávku). A dokáže rozlišit různé verze téže skladby. Právě jsem vyzkoušel tři různé verze písně „Landslide“ – originál od Fleetwood Mac a coververze od Smashing Pumpkins a Dixie Chicks – a každou z nich zvládl.

Reklama

Fisher mi odmítl sdělit, jakou má Shazam celkovou úspěšnost. Řekl by jen, že služba je dost dobrá na to, aby se k ní lidé vraceli pro další – průměrný uživatel hledá písničky osmkrát za měsíc. Nejčastějším důvodem, proč Shazam neidentifikuje skladbu, je, že nemá dostatek dat. Systém potřebuje k nalezení shody alespoň pět vteřin hudby a někdy ho lidé zapínají právě ve chvíli, kdy píseň končí. Často také dochází k chybám, když lidé vyhledávají živá vystoupení – pokud přiložíte telefon k televizoru během hudební části pořadu Saturday Night Live, Shazam s největší pravděpodobností skladbu neidentifikuje. (Pokud získáte shodu ze SNL, pravděpodobně se díváte na epizodu s Ashlee Simpsonovou – Shazam je skvělý způsob, jak zachytit rtěnkáře při vystoupení). Fisher říká, že Shazam je technicky schopen pracovat s živými vystoupeními, ale z jeho slov „obchodních důvodů“ tuto schopnost vypnul. „Právě teď lidé důvěřují značce – kdyby se snažili porovnávat písně naživo, nedosáhli by příliš vysoké přesnosti,“ říká. (Pokud vám v hlavě uvízla nějaká melodie, zkuste použít Midomi, konkurenta Shazamu, který dokáže identifikovat skladby na základě vašeho broukání nebo zpěvu.)

Verze Shazam pro iPhone se stala hitem, ale stále představuje jen 20 % zákaznické základny služby, která zahrnuje více než 150 zemí a téměř všechny mobilní operátory na světě. Verze pro iPhone také znamenala pro společnost odklon – byla to první verze, kterou Shazam nabízel zdarma. Podle Fishera se to ukázalo jako dobrý nápad; přineslo to Shazamu okamžitou proslulost a společnost má nyní dostatečnou zákaznickou základnu, aby mohla vydělávat slušné peníze prostřednictvím reklam v aplikaci a získáváním podílu z každého nákupu skladby, který lidé prostřednictvím aplikace uskuteční. Ale zůstat navždy zcela zdarma není udržitelné, říká Fisher. Společnost nedávno představila verzi své aplikace pro Windows Mobile, která funguje na základě cenového modelu „freemium“ – uživatelé, kteří si stáhnou bezplatnou verzi, mohou vyhledávat pět skladeb měsíčně, zatímco prémiová verze za jednorázový poplatek 5 dolarů umožní neomezené vyhledávání skladeb. Fisher říká, že verze za 5 dolarů pro iPhone (a většinu dalších platforem) bude spuštěna do konce roku.

Reklama

Společnost také plánuje do svých aplikací přidat mnoho dalších služeb – doporučovací systém, způsob, jak umožnit sdílení hudebního vkusu s přáteli, a žebříčky, které ukazují, jaké písně lidé vyhledávají. Každé pondělí rozesílá Shazam své žebříčky nahrávacím společnostem a je známo, že vedoucí pracovníci na základě těchto údajů podepisují smlouvy s umělci. To vedlo k novému způsobu, jak mohou umělci proniknout do hlavního proudu: objevují se v televizních reklamách. V roce 2005 například Volkswagen spustil v Evropě reklamu na Golf GTI, která obsahovala remixovanou verzi písně „Singin‘ in the Rain“ od Mint Royale. Píseň inspirovala spoustu lidí k vyhledávání na Shazamu – a přiměla vydavatelství kapely k vydání skladby, která se pak dostala na vrchol evropských hitparád. „Pravděpodobně to vidíme alespoň jednou měsíčně po celém světě,“ říká Fisher. Jinými slovy, Shazam nejen pomáhá posluchačům najít hudbu. Někdy pomáhá hudbě najít publikum.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.