Как Shazam может определить песню менее чем за 10 секунд?

В далеком прошлом, когда мы слушали песню по радио и наслаждались ею, нам приходилось надеяться, что вещатель скажет имя исполнителя или песню, чтобы найти винил и слушать, пока мы не заболеем. Сегодня, к счастью, просто укажите телефон на источник музыки, и менее чем за 10 секунд вы сможете получить имя, исполнителя, тексты песен и многие другие данные! Но как Shazam может сделать это признание так быстро?

Чтобы это произошло, приложение должно иметь действительно мощную базу данных, ежедневно обновляемую с музыкой из разных регионов планеты. Для каждой песни Shazam создает своего рода отпечаток на трехмерной графике. Это изображение называется спектограммой и является ключом к распознаванию музыки.

На оси X напечатан темп песни, в то время как на оси Y записана его частота, а на оси Z - интенсивность. Таким образом, вы можете превратить песню в сканируемую графику с помощью приложения. Ниже приведено простое представление с использованием только осей X и Y, но вы уже можете получить представление о том, как работает программа:

графический

Shazam

Музыкальная частота меняется даже в пределах одной и той же песни. Приложение, при записи исходной информации, ищет самую высокую точку этой частоты, чтобы создать совпадение для остальной части графика, который формируется во время песни.

Когда пользователь указывает приложение на песню, о которой он хочет узнать больше, программа создает тот же 3D-график из этой 10-секундной записи, сканирует базу данных на наличие песен, которые совпадают точно с теми же точками, и все! Магия завершена!

Если песня не включена в базу данных или источник записи слишком шумный, Shazam не идентифицирует ее и весьма раздражает тех, кто искал и не мог этого сделать. Тем не менее, это уменьшается все больше и больше.

Shazam

В начале все было иначе

И если вы думаете, что Shazam изначально симпатичен как приложение, вы в значительной степени ошибаетесь. Компания была основана в 1999 году, предлагая услуги идентификации музыки в 2002 году - вы можете себе представить, что в то время даже широкополосная связь не была так популярна, так что насчет смартфонов и тому подобного ...

В этот период только пользователи в Англии имели доступ к услуге, которая была сделана посредством телефонного звонка. Нужно было набрать 2580 и поставить мобильный телефон рядом с источником звука. Звонок был автоматическим: как только Shazam прослушал музыку, звонок был прерван, и через мгновение человек получил сообщение с указанием имени и исполнителя.