Plattform for talegjenkjenning

MediaLT skal i samarbeid med IBM bygge en testplattform for talegjenkjenning. Vi tror at dette blir et viktig skritt i retning av gjenkjenning for norsk! Først vil vi imidlertid måtte benytte en engelsk talemotor.

Skrevet av: Morten Tollefsen - 11.02.2008

Kurs i Praha

Are, Miriam, Trond og Morten reiste til Praha for å delta på kurs 6. og 7. februar.

Mye av IBMs satsing på talegjenkjenning skjer i Tsjekkia. En viktig samarbeidspartner er "The Research and Development Centre" (RDC) som ble stiftet i 2001. Senteret er i utgangspunktet et samarbeid mellom Vodafone (then Oskar), Ericsson and the Czech Technical University in Prague.

På universitetet har de satt opp systemer for talegjenkjenning. RDC/IBM ga oss en innføring i installasjon, oppsett og drift av disse systemene. Dette vil være svært nyttig for oss når vi i MediaLT skal sette opp en liknende plattform. Muligens vil vi også få en gjesteforsker fra Tsjekkia som kan hjelpe oss i gang. For selv om vi føler at vi fikk mye igjen for kurset er dette rimelig komplekse greier.

Flere deltakere

MediaLT var ikke aleine på Praha-kurset. Det var også deltakere fra NTNU, Universitetet i Oslo, Norsk språkråd og Aksis.

Betyr dette at vi snart får flere testplattformer for taleteknologi? Det kan godt hende, faktisk! Imidlertid tror vi muligens at planene ikke er helt ferdige hos de andre institusjonene. Det er også litt ulikt fokus på det arbeidet vi gjør. MediaLT er f.eks. mest interessert i applikasjonsutvikling og NTNU mer fokusert på språkforskning. Uansett vil vi ha veldig nytte av hverandre, og vi samarbeider alt i SMUDI-prosjektet.

Norsk språk rett rundt hjørnet?

MediaLT får veldig mange henvendelser om talegjenkjenning på norsk. Flere initiativ gjør at dette kan bli en realitet om ikke så lenge:

  • Norsk språkbank
  • Talegjenkjenning for TV-teksting
  • SMUDI-prosjektet

Det er likevel ikke gitt at god talegjenkjenning kommer med det aller første. I SMUDI-prosjektet er det f.eks. ikke egentlig et krav om utvikling av dikteringsløsninger. Det er fremdeles en viss usikkerhet khnyttet til bruk av data fra Norsk språkbank, og det samme må sies å være tilfelle for TV-teksting.

Det vi vet er at mange vil ha norsk talegjenkjenning, og at MediaLT skal gjøre vårt for å sette fart i dette arbeidet!

Nyhetsarkiv