Klausur 2008, Aufgabe 3 a

Moderator: Web Mining

sabse
Windoof-User
Windoof-User
Beiträge: 26
Registriert: 29. Sep 2009 22:19

Klausur 2008, Aufgabe 3 a

Beitrag von sabse »

Hallo,

ich weiß, dass es schon Beiträge zu dieser Aufgabe gab, aber viele hatten unterschiedliche Ergebnisse. Kann mit bitte jemand GENAU und an diesem konkreten Beispiel zeigen wie der HITS Algorithmus berechnet wird? Ich wäre sehr dankbar.

Viele Grüße

Baboo
Neuling
Neuling
Beiträge: 7
Registriert: 15. Okt 2010 12:54

Re: Klausur 2008, Aufgabe 3 a

Beitrag von Baboo »

ich wäre an einer Erklärung auch sehr interessiert (um den Threaderöffner mal zu unterstützen!).

Gerne natürlich auch bei nem Treffen in der Uni (morgen oder am Montag). Ich werde sowieso dort sein :)

Greets

SaschaWinf
Erstie
Erstie
Beiträge: 22
Registriert: 10. Sep 2010 15:37

Re: Klausur 2008, Aufgabe 3 a

Beitrag von SaschaWinf »

Ihr habt sehr gut erkannt, dass die aufgabe schon öfter erklärt wurde. Ich gehe daher jetzt nicht mehr auf die genaue Aufgabenstellung ein.

Von einer Suchanfrage kriegt man Dokumente zurück die das Rootset bilden. Wir nehmen daraufhin alle dokumente mit einer Kante ins Rootset (in oder outlink) und fügen sie unserem Set hinzu. nun haben wir das Baseset. Dieses kann man sich in der Klausur auch ruhig mal aufmalen, falls es nicht gegeben ist.

Anschließend initialisiert man die h0 und a0 Vektoren mit 1 Einträgen und beginnt die Iterationen.
Die Iterationen beruhen immer auf den Vektoren der Vorrunde (denke ich). D.h. um h1 zu berechnen nimmt man a0 und um a1 zu berechnen h0. (Hier habe ich abweichende Meinungen gehört, dass zuerst h1 berechnet wird und anhand des neuen h1 dann a1 oder andersherum. Das sollte aber zu den selben Ergebnissen und lediglich leicht anderen Iterationen führen).
Am Ende jeder Iteration wird normalisiert mit der Summennorm (=> Die Einträge des Vektors addiert ergeben 1).

Antworten

Zurück zu „Web Mining“