Slides
Lezen
Individual homework, deadline June 18, 23.59
Practicum: MBROLA

The lectures this week focus on meaning representation of linguistic utterances and lexical semantics. We start discussing the requirements to meaning representation languages and look at how meaning is conveyed in language. Later, we move to lexical semantics and give definitions for a word sense and relations that may hold among word senses.


De fonemen van een te synthetiseren woord moeten nog voorzien worden van toonhoogte en duur zodat ze met MBROLA difoonsynthese kunnen worden gegenereerd. Er zal worden uitgelegd hoe MBROLA werkt, hoe toonhoogte- en duurmanipulaties daarin worden uitgevoerd, en welke de waarden zijn die opgegeven moeten worden.
De uitvoer van de grafeem-foneem omzetter wordt deze week de invoer voor een transducer die de instructies aanmaakt voor MBROLA difoonsynthese. De syntax van een MBROLA commando file (*.pho) wordt uitgelegd op Gerrits MBROLA pagina.

Je kunt MBROLA in een gezipt bestand downloaden en in een eigen directory uitpakken. Daarin kun je Mbrola testen met

./mbrola nl2/nl2 nl2/TEST/maar.pho uit.wav2

nl2/nl2 is de stem
maar.pho is de foneeminvoer (met toonhoogte en duurinformatie)
out.wav2 is de geluidsfile

In plaats van foneeminvoer kun je ook grafeeminvoer geven die eerst door je grafeem-phoneem transducer wordt omgezet. Een modulaire aanpak:

Het script speak gebruikt je grafeem-mbrola macro om in 1x een string naar een wav file om te zetten en deze af te spelen. Geef als input een string mee of een bestand, het script zet de input zelf om in een bestand met elk woord op een aparte regel. I.p.v. de compositie in een macro bestand te doen kan je de 2 transducers ook op de command line aan elkaar koppelen, gebruik dan speak2.

Deze opdracht is beperkt tot een kennismaking om tijd te maken voor de opdrachten van Sophia.


We finish the week by introducing distributional and WordNet similarity measures.