Wrapper Aufgaben

Moderator: Web Mining

levitin
Kernelcompilierer
Kernelcompilierer
Beiträge: 435
Registriert: 7. Okt 2007 15:36
Wohnort: Darmstadt

Wrapper Aufgaben

Beitrag von levitin » 17. Jul 2010 09:53

Klausur 2004, Aufgabe 2-b
ich habe eine Menge von Lernveranstaltungsseiten. Meine Aufgabe ist die Titel dieser Veranstaltungen zu identifizieren.

Ganz naiv würde ich sagen, es geht mit einem HTLR(LR)-Wrapper, aber wenn alle Seiten eine völlig unterschiedliche HTML-Struktur haben, es müssen genau so viele unterschiedliche Wrapper geschrieben werden, was die menschliche Arbeit kaum automatisiert. Hat jemand einen Vorschlag?

Klausur 2006, Aufgabe 2-b : gleiches Problem
Wir haben lokale Kopien von mehreren Nachrichtenquellen (die natürlich auch im Sinne der HTML-Struktur ganz anders aussehen). Unsere Aufgabe ist wiederum den Titel jeder Nachricht und und deren Text zu erkennen.

Welche Technik wird in diesen beiden Aufgaben eingesetzt?

Zurück zu „Web Mining“