Projekt Google Euphonia: co to jest i jak może pomóc osobom z nietypową mową - RecenzjeExpert.net

Spisie treści:

Anonim

Większość ludzi kojarzy ustawę Americans with Disabilities Act z fizycznymi, infrastrukturalnymi zmianami, które należy wprowadzić w budynkach lub innych miejscach, ale wraz z poszerzaniem się definicji niepełnosprawności ludzie zdają sobie sprawę, że „dostępność” odnosi się również do takich rzeczy, jak strony internetowe i rozpoznawanie głosu.

W tym przypadku gigant technologiczny Google stara się ulepszyć swoje oprogramowanie do rozpoznawania głosu w ramach projektu Euphonia. Projekt Euphonia to inicjatywa nagrywania próbek głosu od wolontariuszy i ich analizy, aby osoby z ALS, zaburzeniami neurologicznymi i innymi trudnościami w mowie mogły korzystać ze swoich inteligentnych urządzeń z łatwością „typowej” osoby.

Dlaczego zgłosiłem się na ochotnika

Sparaliżowany lewy struna głosowa i asymetryczny język z powodu guza mózgu spowodowały u mnie chorobę mowy Dyzartrię. Moja niewyraźna mowa i słaby głos utrudniają przyjaciołom i rodzinie zrozumienie lub usłyszenie mnie, zwłaszcza w zatłoczonej przestrzeni. To uczyniło mnie głównym kandydatem do Projektu Eufonia, więc zgłosiłem się na ochotnika, gdy tylko o tym przeczytałem. Nagrywając próbki na podstawowej stronie internetowej, powtórzyłem 4500 fraz od „Jak dostać się do Mountain View w Kalifornii?” do „Odtwarzaj utwory Cardi B”.

Poza spełnieniem kryteriów Projektu Euphonia zgłosiłem się na ochotnika, ponieważ po raz pierwszy zapoznałem się z czołowym programem rozpoznawania głosu Dragon Naturally Speaking w 1997 roku – i zakończył się to spektakularną porażką. Przez lata wypróbowałem analogiczne programy w Laboratorium Technologii Wspomagających w Szpitalu Dziecięcym w Bostonie, a także zaktualizowane wersje smok, i chociaż to oprogramowanie poczyniło wielkie postępy, nadal ma trudności z określeniem mojego głosu.

Jest to problematyczne z dwóch powodów: jestem pisarzem z brakiem umiejętności motorycznych, więc piszę jedną ręką lub powoli dwiema, jeśli jestem zmęczony. Mając trzy wydane przez siebie tomiki wierszy, pamiętnik i zbiór nieopublikowanych, połączonych opowiadań do mojego nazwiska, wzdrygam się na myśl, o ile więcej mógłbym wyprodukować, gdyby pisanie nie było tak uciążliwym fizycznie zadaniem.

Innym powodem, dla którego gorsze rozpoznawanie głosu stanowi dla mnie barierę, jest rozpowszechnienie produktów obsługujących głos w domach i telefonach. Korzystając z mojej historii, gdybym mógł uzyskać dostęp do komputerów i inteligentnych urządzeń w sposób, w jaki miały być używane, dałoby mi to więcej wolnego czasu, pozwoliłoby mi w pełni wykonać zadania i potencjalnie zmienić sposób, w jaki żyję.

Projekt Euphonia: Jak to działa?

Jak więc działa Euphonia? Po pobraniu na telefon prototypowej aplikacji ze spersonalizowanym modelem rozpoznawania mowy położyłem telefon obok laptopa i podyktowałem mu; kiedy to robiłem, obserwowałem, jak wszystko, co powiedziałem, pojawia się w moim dokumencie Google na moim laptopie. Robiłem to przez kilka miesięcy, nagrywając frazy z powieści, którą pisałem, i poprawiałem wszelkie nieścisłości dla Google za pomocą aplikacji.

Po kilku kolejnych miesiącach bez nagrywania fraz, skończyłem pierwszy szkic powieści - 20 000 słów - używając aplikacji. Nie oznacza to, że jest bezbłędny; za każdą godzinę, którą piszę, muszę wracać i poświęcać godzinę na drobne poprawki. Ale nie przeszkadza mi to, ponieważ Euphonia jest w fazie beta i zamiast leniwie wybijać 100 słów dziennie, generuję 500 słów dziennie.

Do tego dochodzi fakt, że Euphonia nie została zaprojektowana do przetwarzania tekstów – jest bardziej do poleceń deklaratywnych – a mój styl pisania jest tym, co nazywają „spodniami” (leć obok spodni), więc mam dużo przerw bo nie wiem, jak skończy się zdanie - wiesz, jak Michael Scott. Kiedy jednak wiem, co chcę powiedzieć, na przykład w SMS-ach, e-mailach lub udzielaniu instrukcji mojemu asystentowi, jest to zdecydowanie najdokładniejsze rozpoznawanie mowy, z jakiego kiedykolwiek korzystałem.

Kiedy instytucje takie jak Google dają głos niepełnosprawnym w projektowaniu architektury przyszłości, pozwalając im pozostać sobą, zamiast próbować przekształcić je w coś „normalnego”, daje mi nadzieję, że w dobie AI zwycięży humanizm.

Jeśli chcesz odwiedzić stronę Project Euphonia lub masz zaburzenia mowy i chcesz przekazać próbkę głosu, możesz przejść do tego linku: https://sites.research.google/euphonia/about/