LR Wrapper Frage zu den delimiters

Moderator: Web Mining

SmilingJ
Sonntagsinformatiker
Sonntagsinformatiker
Beiträge: 292
Registriert: 5. Okt 2004 21:37
Kontaktdaten:

LR Wrapper Frage zu den delimiters

Beitrag von SmilingJ »

Moin, muss es auf Folie 19 (betreffend LR Wrapper) im 1. Unterpunkt zum r_i nicht postfix anstelle prefix heißen oder mache ich da einen Denkfehler?
Drei Menschen können ein Geheimnis bewahren, wenn zwei von ihnen tot sind. - Benjamin Franklin

mherrmann
Mausschubser
Mausschubser
Beiträge: 49
Registriert: 12. Nov 2005 10:10

Re: LR Wrapper Frage zu den delimiters

Beitrag von mherrmann »

Ich bin mir jetzt nicht sicher ob ich verstanden habe was du meinst, aber wenn du folgenden Text meinst:

must be a proper suffix of the text before each instance of the target

Dann siehst du schon, dass da bei mir suffix steht. Vielleicht hast du ja ältere Folien. Das ist mir auch schon passiert...

Aber eigentlich hätte ich das ganze so verstanden:
l_i : muss ein gültiger (proper) POSTfix des Textes sein, der VOR jedem zu extrahierenden Datum steht
r_i : muss ein gültiger (proper) PREfix des Textes sein, der NACH jedem zu extrahierenden Datum steht

Grüße

SmilingJ
Sonntagsinformatiker
Sonntagsinformatiker
Beiträge: 292
Registriert: 5. Okt 2004 21:37
Kontaktdaten:

Re: LR Wrapper Frage zu den delimiters

Beitrag von SmilingJ »

ah.. ok. das ist irgendwie verwirrend formuliert.. ein bsp hätte da gut getan...


foobar text <datum> foobar extract </datum> foobar text


dabei ist <datum> der postfix des nicht zu extrahierenden textes und </datum> der prefix des nicht zu extrahierenden textes....
Drei Menschen können ein Geheimnis bewahren, wenn zwei von ihnen tot sind. - Benjamin Franklin

Antworten

Zurück zu „Web Mining“