|
Prosjektet FONEMA (gresk: lyd av tale) har som mål å frambringe en naturtro norsktalende datamaskinstemme ved å tilpasse tredje generasjons talesyntese-teknologi til norsk. ”Tredje-generasjons” talesyntese benytter såkalt datadrevet bølgeformsyntese (engelsk: ”unit selection synthesis”). Metoden går ut på å syntetisere tale ved å sette sammen brokker av innlest og digitalisert tale. For at talesyntese av en vilkårlig tekst skal lyde naturlig må man ha tilgang til store mengder innlest tale slik at systemet kan finne lydsekvenser som passer til det som skal sies til enhver tid. Metoden krever derfor innsamling og systematisering av store mengder taledata. En interessant egenskap ved denne teknikken er at talestilen i databasen vil påvirke talestilen og den opplevde ”personligheten” i den syntetiserte talen. Metoder for rask utvikling av nye taledatabaser som grunnlag for nye stemmer og nye ”personligheter” er derfor et viktig forskningstema innen datadrevet bølgeformsyntese. En viktig hensikt med prosjektet er å utvikle et sett av generiske verktøy, spesielt tilpasset norsk talespråk, som kan automatisere prosessen med å lage nye stemmer/personligheter for denne lydgenereringsmetoden.
FONEMA er en del av programmet KUNSTI – Kunnskapsutvikling for norsk språkteknologi. KUNSTI er opprettet av Norges Forskningsråd (NFR) for perioden 01.07.02 – 31.12.06. FONEMA er et samarbeidsprosjekt mellom to institutt ved NTNU (teleteknikk, språk og kommunikasjonsstudier) og Telenor FoU.
|