Ключови изводи
- Нарастващ брой програми могат да разберат вашата реч.
- Нова технология генерира персонализиран аудио шум във фонов режим, докато говорите, за да обърка софтуера, който може да слуша.
-
Новата техника постига производителност в реално време чрез прогнозиране на атака върху бъдещето на сигнала или думата.
Много програми могат да разберат речта ви по време на телефонни или видео разговори и експертите казват, че те могат да представляват заплаха за поверителността.
Нова технология, разработена от изследователи от Колумбийския университет, наречена Neural Voice Camouflage, може да предложи защита. Той генерира персонализиран аудио шум на заден план, докато говорите, обърквайки изкуствения интелект (AI), който слуша и транскрибира гласове.
"Наличието на AI транскрипция повдига въпроси за доверието, " Майкъл Хът, съосновател на Xayn, търсачка за защита на поверителността, и ръководител на катедрата по компютърни технологии в Imperial College London, който не е участвал в изследването, каза Lifewire в интервю по имейл. „Участниците в срещата може да са по-внимателни за това кои въпроси повдигат и как се транскрибира речта им. Това може да е нещо добро, тъй като може да подобри уважителното поведение, но може да е и лошо, тъй като разговорът може да е по-малко отворен поради резерви относно използваната технология."
Слушане и учене
Изследователите от Колумбия работиха за проектирането на алгоритъм, който може да разбие невронни мрежи в реално време. Новият подход използва "предсказуеми атаки" - сигнал, който може да наруши всяка дума, която моделите за автоматично разпознаване на реч са обучени да транскрибират. Освен това, когато звуците на атака се възпроизвеждат по ефира, те трябва да са достатъчно силни, за да прекъснат всеки фалшив микрофон за „подслушване“, който може да е далеч.
"Ключово техническо предизвикателство за постигането на това беше всичко да работи достатъчно бързо", каза Карл Вондрик, професор по компютърни науки в Колумбийския университет и един от авторите на проучване, описващо новия подход, в новини освобождаване. „Нашият алгоритъм, който успява да блокира фалшивия микрофон да чуе правилно думите ви през 80% от времето, е най-бързият и най-точният на нашия тестов стенд.“
Новата техника постига производителност в реално време чрез прогнозиране на атака върху бъдещето на сигнала или думата. Екипът оптимизира атаката, така че тя има сила на звука, подобна на нормалния фонов шум, което позволява на хората в стаята да разговарят естествено и без да бъдат успешно наблюдавани от система за автоматично разпознаване на реч.
Участниците в срещата може да са по-внимателни за това кои точки повдигат и как се транскрибира речта им.
Учените казаха, че тяхната техника работи дори когато не знаете нищо за измамния микрофон, като например местоположението му или дори компютърния софтуер, работещ на него. Той маскира гласа на човек в ефира, като го скрива от тези системи за слушане и без да създава неудобства за разговора между хората в стаята.
"Досега нашият метод работи за по-голямата част от речника на английския език и планираме да приложим алгоритъма на повече езици, както и в крайна сметка да направим шепота напълно незабележим", Миа Чикиер, водещ автор на изследването и докторант в лабораторията на Вондрик, се казва в съобщението за новините.
Запазване на личните ви разговори
Сякаш всичко това не е достатъчно, рекламите може да са насочени към вас и въз основа на аудио, събрано от вашия смартфон или умни домашни устройства.
"С устройства като [Amazon Echo] и техните двойници, тези устройства не само са винаги в дома ви, непрекъснато слушайки всичко, което казвате или правите, но те - чрез години на събиране на данни от своите потребители - имат усъвършенствана обработка на естествения език (превръщане на изговорена дума в текст/използваеми данни за устройства чрез комбинация от микрофони, софтуер и изкуствен интелект), каза в имейл Ерик Хейг, сътрудник в Harbour Research, фирма за стратегическо консултиране и рисково развитие.
Транскрипциите на AI на разговорна реч вече са стандартна част от стандартния търговски софтуер, каза Хът. Например Microsoft Teams има опция за запис на среща с вградени AI транскрипции, които могат да се видят от всички участници в реално време. Пълният стенограма може да служи като протокол от срещата. Обикновено такива преписи позволяват водене на минути (известни още като водене на бележки), където протоколите ще бъдат одобрени на следващото заседание.
"Хората може да се притесняват да не бъдат шпионирани, когато транскрипцията с изкуствен интелект е включена", добави Хът."Това изглежда много подобно на безпокойството от записан разговор без съгласие или тайно."
Но не всички са съгласни, че смарт устройствата са заплаха. Повечето хора не трябва да се тревожат за програмите, които слушат вашите разговори, каза Брад Хонг, ръководител на успеха на клиентите във фирмата за киберсигурност Horizon3, каза пред Lifewire по имейл. Той каза, че най-сериозното притеснение сега не е кой ви записва, а по-скоро как съхраняват данните.
„Всички истории, които човек чува за активиран микрофон на компютъра или мобилните му устройства, подслушване на Alexa или Google Home или дори правителствено наблюдение, вярно е, че всичко това кара стомаха на неспециалистите да се свива“, добави Хонг. „Но като цяло хората рядко са в ситуация, която всъщност изисква маскиране на гласовете им.“