Konvention beim Word Alignment (Machine Translation)

Moderator: Algorithms of Language Technology

Romeo
Erstie
Erstie
Beiträge: 12
Registriert: 16. Nov 2011 10:03

Konvention beim Word Alignment (Machine Translation)

Beitrag von Romeo »

Hallo,

Mir ist in der Machine Translation-Vorlesung auf Folie 33 aufgefallen, dass ein Alignment wie folgt aussieht:

(the green witch, a la bruja verde).

Allerdings gibt es zum Wort "a" kein entsprechendes Wort im Englischen Satz und daher ist die Spalte leer. Das Alignment könnte meiner Meinung nach genauso gut heißen:

(the green witch, la bruja verde).

Ist es eine Konvention/wesentlich für den Algorithmus, angrenzende, nicht ausgerichtete Wörter mit aufzunehmen? Und falls ja, warum wird das dann bei der anderen grünen Phrase nicht ebenfalls so gehandhabt?

Viele Grüße,
Roland

riedl
Moderator
Moderator
Beiträge: 26
Registriert: 3. Apr 2013 12:25

Re: Konvention beim Word Alignment (Machine Translation)

Beitrag von riedl »

Hallo Roland,

zu deiner Frage stelle ich einfach mal ein paar Gegenfragen :)
Woher sollen wir wissen das in dem Satz "a" das Wort ist welches nicht aligniert wird und nicht bruja? Und wer soll das alles aendern? Fuer Woerter die nicht gemappt werden koennen gibt es deswegen doch das NULL Wort.
Der Vorteil vom IBM Model ist gerade, dass wir eigentlich kein Vorwissen vom Mapping brauchen und damit auch kein Sprachwissen und wenn es Woerter gibt fuer die es kein Mapping gibt, dann wird dies auch erkannt.

Viele Gruesse
M

Antworten

Zurück zu „Algorithms of Language Technology“