Как работи функцията Hum to Search на Google

Съдържание:

Как работи функцията Hum to Search на Google
Как работи функцията Hum to Search на Google
Anonim

Ключови изводи

  • Google пусна нов инструмент, който позволява на потребителите да търсят песни чрез тананикане, пеене или подсвиркване.
  • Новият инструмент използва машинно обучение, за да съпостави тананикаща песен с база данни от повече от половин милион песни, която непрекъснато се актуализира.
  • Потребителите на Google питат коя песен се възпроизвежда почти 100 пъти всеки месец.
Image
Image

Google стартира нова функция, наречена „Hum to Search“, за да разреши един разочароващ проблем: да имате песен, заседнала в главата ви и да не можете да разберете как се казва.

Идеята да си тананикаш, за да намериш песен, изглежда невероятно проста, така че защо Google пуска тази функция едва през 2020 г.? Е, оказва се, че идентифицирането на песни по този начин всъщност е доста сложно, отчасти защото нашите тананикани версии обикновено са доста различни от оригиналната песен. В скорошна публикация в своя блог за изкуствен интелект Google обяснява как е използвал машинно обучение, за да реши този проблем и в крайна сметка да помогне на хората да намерят песен чрез тананикане, подсвиркване или пеене на мелодията, дори когато тяхното изпълнение не е точно.

"Нашият фокус за Hum to Search е да помогнем на хората да идентифицират и намерят музика, която е заседнала в главите им", каза говорител на Google пред Lifewire в имейл.

Просто започнете да си тананикате

Потребителите на Google питат коя песен се възпроизвежда почти 100 милиона пъти всеки месец, каза Апарна Ченапрагада, вицепрезидент на Google и генерален мениджър за потребителско пазаруване, във видеоклип, представящ няколко нови функции за търсене. Сега има начин да разберете.

Функцията „Hum to Search“е вградена в мобилното приложение на Google, приспособлението Google Search и Google Assistant. За достъп до него чрез приложението докоснете иконата на микрофон и кажете „Каква е тази песен?“Избирането на бутона „Търсене на песен“също работи.

За да работи правилно, функцията изисква да си тананикате поне 10-15 секунди. Потребителите на Android могат да си тананикат, за да намерят песни на повече от 20 езика, докато на iPhone работят само песни на английски. Инструментът не винаги може да идентифицира песен веднага, но след като го направи, резултатите са доста добри.

Повече от половината от песните с широк набор от променливи (тон, височина, сила на звука и т.н.) се разпознават от нашите алгоритми, но разбира се, точността зависи от качеството на тананикането, вида на песента и много други“, каза говорителят на Google пред Lifewire в имейл. „Но след като бъде разпознат, приблизително четири от пет отговора са верни.“

Това обаче не е първият път, когато тананикането се използва в приложение за идентифициране на музика. SoundHound предлага подобна функция, както отбелязва CNN Business, и е достъпна и за Android и iOS. Според говорителя на Google, новата функция не поражда никакви опасения за поверителността, нито „променя начина, по който Google обработва аудио-базирани взаимодействия“, казаха те на Lifewire в имейл.

Машинно обучение

Въпреки простотата на концепцията, тананикането на мелодия, за да се намери студийният запис, е технически доста трудно. Има няколко причини за това, обяснява Крисчън Франк от Google Research в публикация в блог от 12 ноември. На първо място, тананиканата версия на песента може да се различава значително от действителния запис, което затруднява съпоставянето на двете. Така че, докато Shazam и множество други приложения вече съществуват за идентифициране на тази песен, която чувате в ресторант или на друго обществено място, използването на тананикаща мелодия като основа за това търсене може да бъде по-трудно.

"С текстове, фонови вокали и инструменти, звукът на мюзикъл или студиен запис може да бъде доста различен от тананикана мелодия", пише Франк.„По грешка или умисъл, когато някой тананика своята интерпретация на песен, често височината, тонът, темпото или ритъмът може да варират леко или дори значително.“

Image
Image

Тъй като тананиканите версии на песните могат да бъдат толкова различни от оригиналите, Франк отбелязва, че много минали методи са изисквали съпоставяне на тананикането на човек с версия на песента, която има само мелодия, или песен, която включва тананикане. Това направи случаите на употреба в реалния свят предизвикателни, тъй като базите данни с тези песни могат да бъдат ограничени и трябва да се актуализират ръчно.

Google обяснява, че за функцията Hum to Search използва модели за машинно обучение, за да превърне звука в „последователност, базирана на числа“, която представлява мелодията на песента – това, което казва, може да се смята за „пръстов отпечатък“."

По-удобен за потребителя

Използването на машинно обучение във функцията Hum to Search на Google в крайна сметка прави инструмента много по-лесен за използване в реалния свят. Тъй като Hum to Search съпоставя тананикащата мелодия на търсещия с действителната песен, инструментът може да работи с новите песни, когато бъдат пуснати, вместо база данни, която постоянно трябва да се актуализира с тананикани версии на всяка песен. Освен това не се нуждаете от перфектен тон, за да го използвате.

"Сегашната система достига високо ниво на точност на база данни с песни, която съдържа над половин милион песни, които ние непрекъснато актуализираме," каза Google в своето съобщение за Hum to Search. „Този сборник от песни все още има какво да расте, за да включва повече от многото мелодии в света.“

Препоръчано: