Как свободното гласово разпознаване остава бързо, точно и лично

Съдържание:

Как свободното гласово разпознаване остава бързо, точно и лично
Как свободното гласово разпознаване остава бързо, точно и лично
Anonim

Ключови изводи

  • Fluent е зачитаща поверителността супер бърза система за разпознаване на глас, която не се нуждае от интернет връзка.
  • Може да се вгради в почти всяко устройство.
  • Работи на всеки език.
Image
Image

Fluent.ai е машина за виртуално гласово разпознаване, която не изпраща вашите команди до интернет, действа почти мигновено, може да работи на всеки език и е толкова малка, че може да бъде вградена дори в евтини, ниски -захранващи устройства като фитнес часовник, например.

За разлика от Siri и Alexa, Fluent е самостоятелен асистент, който ви разбира незабавно и се учи от вас, така че става по-добър колкото повече го използвате. Той няма дълбочината на обикновените виртуални асистенти, но не е предназначен. Вместо това той е по-бърз, по-точен и по-личен от усилията на Apple, Amazon и Google.

"Реч към текст използва обработка на естествен език и след това извлича намерение", каза изпълнителният директор на Fluent Пробал Лала пред Lifewire по време на интервю за Zoom. „Това изисква много данни и много мощност за обработка. Fluent преминава директно от говор към намерение, като взема гласа ви и го преобразува директно в действие.“

Долен ред

Fluent е софтуер за гласово управление. Той работи, като слуша вашата команда и премахва всички думи, от които не се нуждае, оставяйки само основните съществителни и глаголи. „Изгасете светлините,“става просто изгасване и светлини. Основните елементи са извадени от разхвърляно човешко изречение и са превърнати в стъпки. Това е почти като програмиране на компютър, превръщайки сложна идея в най-прост набор от инструкции.

За какво може да се използва?

Fluent може да се използва за всичко. Ключът е, че е обучен за конкретна ситуация. С интелигентен часовник, например, той може да бъде обучен в команди за фитнес или за домашна автоматизация, създаване на календар и таймер и т.н. Ограничаването на базата данни прави всичко по-фокусирано и го поддържа бързо.

"Истината е, че с носимите устройства не искате да водите разговор", каза Лала, "Искам може би любимата ми рутинна тренировка да започне и искам да го направя много бързо."

Целият смисъл са бързината и точността. Включването и изключването на светлините отнема милисекунди, вместо да се налага да чакате Siri да изпрати гласа ви в облака, изчакайте той да бъде обработен, след което секунди по-късно светлините изгасват.

Това тясно обучение също намалява размера на приложението. Миналата година Google предостави офлайн версия на своя асистент за изтегляне. Беше, казва Лала, 85 мегабайта, работеше само на английски и бяха необходими шест месеца, за да се обучи.

"Имаме един модел, който работи с 13 000 команди и работи в 500 килобайта", каза той.

Долен ред

Другото предимство на системата за офлайн гласово разпознаване е поверителността. В детския интелигентен часовник, например, „не искате гласът на детето да отива в облака“, казва Лала. Всъщност Fluent може да работи в устройства, които никога не се свързват с интернет. Това е добре не само за поверителността, но и за сигурността. Можете да използвате офлайн система за гласово разпознаване в изследователски лаборатории, военни съоръжения и други места, където са забранени мобилни телефони и камери.

Ограничения

Разбира се, има някои недостатъци на този модел. Едната е, че командите не могат да се добавят по-късно. След като първоначалното обучение приключи, това е всичко. Нито пък вашият базиран на Fluent асистент може да търси неща в интернет за вас – спортни резултати, актьора, който разпознавате в този филм, но просто не можете да го поставите, и т.н.

Image
Image

Вместо това системата е достатъчно интелигентна, за да разпознае, когато не може да помогне, и ще предаде заявката на нещо, което може. Ако попитате часовника си за прогнозата за времето, Fluent ще разбере, че не разбира. „След това ще се обади на услуга, която е предварително програмирана в часовника, независимо дали е Alexa на Amazon или Google, и след това ще направи повикване до облака“, предавайки вашата необработена гласова команда, за да получите отговора.

Този хибриден подход запазва скоростта на локален офлайн асистент със силата на Alexa или Google Assistant като резервно копие.

Можете ли да закупите някакви Fluent устройства?

Още не. Компанията лицензира своите технологии и провежда обучението за други компании. Благодарение на COVID две големи стартирания бяха отложени за следващата година. Но можете да очаквате да го видите в часовници и други фитнес устройства, високоговорители, центрове за домашна автоматизация и т.н.

Би било страхотно, ако това също беше включено директно в смартфони като iPhone, правейки ежедневните задачи по-бързи и прибягвайки до Siri само когато е необходимо. Това би било истинското убийствено приложение.

Актуализация: 22 октомври, 10:12 сутринта. Направени са промени за обозначаване на Fluent като машина за гласово разпознаване, а не като гласов асистент.

Препоръчано: