Gjennombrudd for norsk taleteknologi

Jeg har brukt engelsk talegjenkjenning tidligere. Det er likevel en helt ny opplevelse å styre PCen med norske kommandoer!

Skrevet av: Morten Tollefsen - 17.04.2009

Veridict, IBM og MediaLT samarbeider om utviklingen av talegjenkjenning, og nå begynner vi å se resultater!

Mennesker har ulike forutsetninger for å bruke teknologi. Noen bruker sykt mye mus, andre har musesyke! Noen kan all verdens tastekombinasjoner, og enda flere skriver vha "Let Finn Trykk" (LFT-metoden). Noen leser med syntetisk tale, men det å bruke stemmen for å styre PCen er science fiction for de fleste!

Talegjenkjenning finnes for flere av de store verdensspråkene. For norsk er Max Manus sitt produkt for helsesektoren foreløpig den eneste dikteringsapplikasjonen.

I SMUDI-prosjektet forskes det på bruk av ulike metoder for input og output (multimodalitet). Stemmestyring er svært sentralt i SMUDI, og målet er å utvikle innovative produkter og tjenester.

Kommandostyring av PC

Standardutstyret for å styre en PC er mus og tastatur. Hvis du ikke kan bruke dette standardutstyret trenger du alternativer! For mange vil det mest hensiktsmessige være å bruke stemmen! Dette har imidlertid ikke vært mulig på norsk.

En aktivitet i SMUDI-prosjektet er nettopp å utvikle en pilot for norsk kommandostyring. Med stemmen skal du kunne åpne programmer, gjøre menyvalg, kunne gi hurtigkommandoer av typen "gå til favoritt", bokstavere osv. I første omgang vil ikke diktering av løpende tekst være en del av løsningen, men målet er at PCen skal kunne brukes bare vha stemmen!

Pilottesting i Stockholm

De aller første testene med kommandostyringen er nå gjennomførte i Stockholm. Resultatet er ikke mindre enn overraskende bra! Selv om vi foreløpig ikke har gjort vitenskapelige tester med feilrater etc kan vi si at systemet fungerer over all forventning.

Helt uten å trene systemet kunne jeg sette meg ned å styre PCen. Selv bokstavering virket fint, og bokstavering er en utfordring for talegjenkjenneren siden flere lyder er nokså like.

Videre arbeid

Kommandostyringen er ikke klar for lansering! Det gjenstår detaljarbeid med kommandoer og funksjoner. Videre ønsker vi å lage et svært robust produkt. Dette arbeidet er tidkrevende og kostbart. Veridict, IBM og MediaLT jobber for å få finansiert deler av den utviklingen som må til.

Etter hvert vil vi også teste løsningen: primært mot brukere som ikke kan bruke mus og tastatur. Ambisjonen er at vi skal få til dette i 2009. En invitasjon vil bli lagt ut på nettsidene våre, men det er ikke noe i veien for å melde sin interesse alt nå.

Nyhetsarkiv