The lectures this week focus on meaning representation of linguistic utterances
and lexical semantics. We start discussing the requirements to meaning
representation languages and look at how meaning is conveyed in language.
Later, we move to lexical semantics and give definitions for a word sense
and relations that may hold among word senses.
De fonemen van een te synthetiseren woord moeten nog voorzien worden van
toonhoogte en duur zodat ze met MBROLA difoonsynthese kunnen worden
gegenereerd. Er zal worden uitgelegd hoe MBROLA werkt, hoe toonhoogte-
en duurmanipulaties daarin worden uitgevoerd, en welke de waarden zijn
die opgegeven moeten worden.
De uitvoer van de grafeem-foneem omzetter wordt deze week de
invoer voor een transducer die de instructies aanmaakt voor
MBROLA difoonsynthese. De syntax van een MBROLA commando file
(*.pho) wordt uitgelegd op Gerrits
MBROLA pagina.
Je kunt MBROLA in een gezipt bestand downloaden en in een eigen directory uitpakken. Daarin kun je Mbrola testen met
./mbrola nl2/nl2 nl2/TEST/maar.pho uit.wav2
nl2/nl2 is de stem
maar.pho is de foneeminvoer (met toonhoogte en duurinformatie)
out.wav2 is de geluidsfile
In plaats van foneeminvoer kun je ook grafeeminvoer geven die eerst door je grafeem-phoneem transducer wordt omgezet. Een modulaire aanpak:
- Maak een foneem-mbrola transducer, voorbeeld.
- Voeg aan je grafeem-foneem en foneem-mbrola transducers de volgende regels toe:
:- multifile macro/2.
:- multifile rx/2.
- Maak een nieuwe macro file, grafeem-mbrola, die beide transducers include en de hoofdautomaten daarvan in compositie plaats, voorbeeld. De compositie (prc) die wordt gebruikt in g2m.pl is een speciale variant om spurieuze paden te voorkomen, download daarom ook ops.pl naar je werkdirectory.
Het script
speak gebruikt je grafeem-mbrola macro om in 1x een string naar een wav file om te zetten en deze af te spelen. Geef als input een string mee of een bestand, het script zet de input zelf om in een bestand met elk woord op een aparte regel. I.p.v. de compositie in een macro bestand te doen kan je de 2 transducers ook op de command line aan elkaar koppelen, gebruik dan
speak2.
Deze opdracht is beperkt tot een kennismaking om tijd te maken voor de opdrachten van Sophia.
We finish the week by introducing distributional and WordNet similarity measures.