imagazin arrow2-left arrow2-right arrow2-top arrow-up arrow-down arrow-left arrow-right cart close dossiers education fb instagram menu notification oander rss rss-footer search service shuffle speech-bubble star store stores tests twitter youtube

Еве како работи функцијата „Hey Siri“


На Machine Learning Journal создаден од Apple е објавен нов текст кој ја открива магијата зад функцијата Hey Siri. Неверојатно е на колку детали инженерите на Apple внимавале при создавање на оваа функција. 

Фактот дека Apple почна да споделува информации за своето истражување на вештачката интелигенција е нешто најдобро што можеа да направат, бидејќи на тој начин технологијата им ја приближија на сите што ги интересира. Сите знаат што развива Apple, а многумина ги користат нивните производи секој ден, па овие артикли – иако напишани во облик на академски трудови – и натаму се разбирливи за секој читател. Па, така во последниот артикал се открива технолошката позадина на функцијата Hey Siri. Да погледнеме за што се работи.

Како таа функционира?

Мал уред за препознавање гласови е постојано вклучен и внимателно слуша кога ќе ги слушне овие два збора. Кога ќе слушне „Hey Siri“, остатокот од програмата го идентификува продолжението на говорот како наредба или прашање. Детекторот на „Hey Siri“ користи Deep Neural Network (DDN, длабока невронска мрежа) за претворање на акустичниот примерок на вашиот глас во секој момент во дистрибуција на веројатноста во однос на говорните гласови. Потоа го користи темпоралниот процес на интеграција за да го пресмета резултатот од доверба дека фразата што сте ја изговориле навистина е „Hey Siri“. Ако резултатот е задоволителен, Siri се активира.

Зачувување на енергија

За да се избегне целокупната работа на процесорот само поради слушање на клучната фраза, Always On процесорот на iPhone (AOP, мал, дополнителен процесор со ниска потрошувачка на енергија, дел од копроцесорот на движење) има пристап до сигналот на микрофонот (на 6s и во новите модели). Користиме мал дел од ограничената процесорска сила на AOP за работа на детекторот со мала верзија на акустичниот модел (DNN). Кога резултатот ќе ја премине долната граница, копроцесорот на движење го активира основниот процесор, кој потоа го анализира сигналот користејќи поголем DNN.

Постапка на поставување

Ги споредуваме сите можни нови „Hey Siri“ изговори со снимените примери, и тоа на следниот начин. Детекторот создава временска информација која се користи за претворање на акустичниот примерок во вектор со фиксна должина, и тоа така што го споредува просекот со примероците поврзани со секој случај. Вториот, посебно увежбан DNN, го претвора овој вектор во „простор на говорникот” во кој примероците на истиот говорник обично се поблиски еден до друг, додека примероците на различните говорници обично се поразделени. Овие оддалечености ги споредуваме со референтните примероци создадени во текот на пријавувањето со еден друг праг, за да утврдиме дали звукот што го активирал прекинувачот всушност е „Hey Siri“ и дали го изговорил пријавениот корисник.

Уште една интересна работа се поставките на автоматска чувствителност. Постои примарен, односно нормален праг, како и понизок праг што обично не ја активира Siri. Ако резултатот го преминува долниот праг, но не и горниот, системот не неколку секунди влегува во состојба на засилена осетливост, па ако корисникот ја повтори фразата – дури и без било каква промена во гласноста – Siri ќе се активира.

Овој механизам од втора шанса многу ја подобрува употребливоста на системот, а притоа да не ја зголемува стапката на лажна тревога, бидејќи во оваа осетлува состојба се наоѓа само неколку секунди.

Сличните текстови и интересни објави можете да ги прочитате во Machine Learning Journal. Ги препорачуваме на сите, бидејќи се исплати да ги прочитате.

Извори: MacrumorsiMore и Apple

 

 

Apple Inc. (AAPL)

Дали го прочита ова?

Воодушевен што сум повторно во Франција за да се сретнам со талентираниот тим во Марсеј.

Воодушевен што сум повторно во Франција за да се сретнам со талентираниот тим во Марсеј. - Кликнете овде!