Shazamは、携帯電話が魔法に最も近い存在である。 たとえば、レストランで曲が流れてきたとき、その曲が何なのかよくわからないとします。 昔は、配偶者やウェイターにヒントを求めることもできたが、それでは自分の無知を露呈することになりかねない。 (Shazamは、2002年にイギリスでサービスを開始し、昨年iPhoneに搭載されたことでアメリカでも広く知られるようになりましたが、このジレンマを数回のクリックで解決してくれるのです。 携帯電話のボタンを押せば、数秒後にはアーティスト名と曲名が表示されます。 ゲーム以外で、携帯電話でできる最も便利なことです。
先週、Shazamは、世界中で5000万人以上がこのサービスを利用し、年初の3500万人から増加したと発表しました。 また、シリコンバレーの有名なベンチャーキャピタルであるKPCBから非公開の投資を受けたと発表しています。 Shazamの成功は、iPhoneに懐疑的な人々に見せれば、彼らの立場を再考させることができるアプリの一つであり、正当なものと思われる(Shazamは、Android、BlackBerry、Windows Mobile、その他ほとんどすべての携帯電話で利用可能である)。 しかし、Shazamの内部構造はかなりミステリアスです。 Shazamは、どのようにあなたの曲を認識するのでしょうか? 会社はどうやってお金を儲けているのか? (そして、ごくたまにしかない鋭いニーズを満たすことだけを目的とした会社の長期的な展望はどうなのだろうか?
まず、Shazamがどのように機能するかを簡単に説明します。 同社は800万曲以上のライブラリを持ち、各トラックを単純な数値のサイン、つまり各トラックに固有のコードに分解する技術を考案しました。 ShazamのCEOであるアンドリュー・フィッシャーは、「ここで重要なのは、それぞれの演奏の “フィンガープリント “を作ることです」と言う。 携帯電話を曲に合わせてかざすと、Shazamが同じ方法でクリップを署名に変えてくれる。 Shazamは、あなたの楽曲から作成したコードをライブラリで検索し、そのビットを見つけると、その楽曲を見つけたと判断するのです。
OK、でも Shazam はどうやってこのフィンガープリントを作るのでしょう? Shazamのチーフ・サイエンティストで共同設立者の1人であるAvery Wangが2003年にScientific Americanに説明したように、同社のアプローチは長い間、計算不可能と考えられていました。 しかし、この問題に取り組んでいるうちに、王は素晴らしいアイデアを思いついた。 曲の中のほとんどすべての情報を無視し、その代わりにいくつかの比較的「激しい」瞬間に焦点を当てたらどうだろう? Shazamは、楽曲のデータベースから、周波数、振幅、時間の3次元のグラフを作成し、スペクトログラムを作成する。 このグラフは、周波数、振幅、時間の3次元のグラフである。そして、アルゴリズムは、グラフのピークを表すポイントだけをピックアップする。このポイントは、周囲のすべての音よりも「高いエネルギーコンテンツ」を含んでいる。 実際には、1曲あたり1秒間に約3回のデータポイントが取得されているようです。
曲のほぼすべての情報を無視すると、不正確なマッチングにつながると思うかもしれませんが、Shazam のフィンガープリント技術は妨害に著しく強く、ノイズの多い環境でも、悪い携帯電話の接続でも曲をマッチングさせることができます。 クラブDJが特定のテンポに合わせるため、あるいはラジオDJが広告の前に曲を入れるために行うように、気づかないほどスピードアップした音楽にも対応できる方法を最近発見したとフィッシャー氏は言う。 さらに、同じ曲の異なるバージョン間の違いも識別することができます。 フリートウッド・マックの原曲、スマッシング・パンプキンズとディキシー・チックスのカバーという3種類の “Landslide “を試しましたが、どれも見事に再現してくれましたよ。
フィッシャーは、Shazamの全体的なヒットとミスの率について教えてくれることを拒否しました。 彼が言うのは、平均的なユーザーは月に8回曲を探すので、このサービスは人々がもっと戻ってくるのに十分だということだけです。 Shazamが曲を特定できない最も一般的な理由は、データが十分でないことだ。 マッチングには最低でも5秒間の音楽が必要だが、曲が終わった瞬間に起動することもある。 また、ライブ演奏を検索する際にもよくエラーが発生します。「サタデー・ナイト・ライブ」のミュージカル・コーナーで携帯電話をテレビにかざすと、Shazamはおそらくその曲を識別できません。 (SNLからマッチした場合、おそらくアシュリー・シンプソンのエピソードを見ているのだろう。Shazamは口パクを捕まえるのに最適な方法なのだ。) フィッシャーによると、Shazamは技術的にはライブパフォーマンスにも対応可能だが、彼が言うところの「ビジネス上の理由」でその機能をオフにしているとのこと。 「今のところ、人々はそのブランドを信頼しています。生の歌をマッチングさせようとしても、あまり高い精度は得られないでしょう」と彼は言う。 (頭に曲が残っている場合は、鼻歌や歌声から曲を特定できるShazamのライバル、Midomiを使ってみてください)。
ShazamのiPhone版は大ヒットしましたが、それでも150カ国以上、世界中のほぼすべての携帯電話会社にまたがるサービスの顧客ベースの20%にすぎません。 また、iPhone版は、Shazamが初めて無料で提供したバージョンであり、同社にとって新たな出発点となった。 Shazamは瞬く間に有名になり、今ではアプリ内広告やアプリで曲を購入した人の中から分け前をもらえるほど顧客層が厚くなったとフィッシャー氏は言う。 しかし、永久に完全無料であることは持続可能ではないとフィッシャー氏は言う。 無料版をダウンロードしたユーザーは、月に5曲検索することができますが、1回限り5ドルを支払うプレミアム版では、無制限に曲を検索することができます。 フィッシャー氏によると、iPhone(およびその他のほとんどのプラットフォーム)向けの5ドル版は、年内に発売される予定だという。
また、同社はアプリにさらに多くのサービスを追加することを計画しています。おすすめエンジン、自分の音楽の好みを友人と共有する方法、人々が探している曲を表示するチャートなどです。 毎週月曜日、Shazamはレコード会社にチャートを送信し、そのデータに基づいてレコード会社がアーティストと契約することが知られている。 その結果、アーティストがメインストリームに進出するための新しい方法として、テレビ広告で紹介されるようになった。 例えば2005年、フォルクスワーゲンはヨーロッパでゴルフGTIの広告を出し、ミント・ロワイヤルの「Singin’ in the Rain」のリミックスバージョンをフィーチャーしました。 この曲は、Shazamで検索され、バンドのレーベルからリリースされ、ヨーロッパのチャートで上位にランクインすることになりました。 この曲は、ヨーロッパのチャートで上位にランクインしました。「おそらく、世界中で月に1回はヒットしています」とフィッシャーは言います。 つまり、Shazamは聴衆が音楽を見つけるのを助けるだけではないのです。 時には、音楽が聴衆を見つける手助けをすることもあるのです。