HITS-Algorithm (LA-Version)

Moderator: Web Mining

levitin
Kernelcompilierer
Kernelcompilierer
Beiträge: 435
Registriert: 7. Okt 2007 15:36
Wohnort: Darmstadt

HITS-Algorithm (LA-Version)

Beitrag von levitin »

Structure Mining - Seite 13

1) Was bedeutet im Algorithmus h0 bzw. a0? (die beiden sind niergendwo definiert)
2) muss man wirklich in jeder Iteration die Vektoren normalisieren, oder man kann mit normalen Vektoren rechnen und die Normalisierung erst an das Endergebnis anwenden? (denn sonst, wenn man per Hand rechnet, kommen ganz unbequeeme Brüche)

Benutzeravatar
Patr0rc
Sonntagsinformatiker
Sonntagsinformatiker
Beiträge: 260
Registriert: 8. Feb 2008 11:43

Re: HITS-Algorithm (LA-Version)

Beitrag von Patr0rc »

levitin hat geschrieben:Structure Mining - Seite 13
1) Was bedeutet im Algorithmus h0 bzw. a0? (die beiden sind niergendwo definiert)
Kann es sein, dass h0 und a0 die "alten" Vektoren angeben sollen, also z.B. soll h0 der Vektor h vor seiner Neuberechnung sein (schließlich wird h ja vorher schon neu berechnet, bevor a dann mithilfe des (alten) Vektors berechnet wird). Einleuchtend/Sinnvoll?
levitin hat geschrieben:2) muss man wirklich in jeder Iteration die Vektoren normalisieren, oder man kann mit normalen Vektoren rechnen und die Normalisierung erst an das Endergebnis anwenden? (denn sonst, wenn man per Hand rechnet, kommen ganz unbequeeme Brüche)
Das Problem ist, wenn du sie nicht normierst, wirst du einfach in die Unendlichkeit laufen, sofern Hub- und Authority-Score einfach hochgezählt werden (und das werden sie normalerweise in der nicht-normierten Version). Da ist halt das mit der Konvergenz ein bisschen tricky ;-)

levitin
Kernelcompilierer
Kernelcompilierer
Beiträge: 435
Registriert: 7. Okt 2007 15:36
Wohnort: Darmstadt

Re: HITS-Algorithm (LA-Version)

Beitrag von levitin »

Prof. Fürnkranz hat in der Vorlesung gesagt, dass HITS-Algorithmus seine Verwendung kaum findet.
Ask.com scheint aber nämlich diesen Algorithmus zu benutzen http://matalon.org/search-algorithms/

levitin
Kernelcompilierer
Kernelcompilierer
Beiträge: 435
Registriert: 7. Okt 2007 15:36
Wohnort: Darmstadt

Re: HITS-Algorithm (LA-Version)

Beitrag von levitin »

in den Folien stand, dass Vector h gegen den Eigenvektor EE^T konvergiert, bzw Vector a gegen den Eigenvektor E^TE konvergiert.
Wieso kann man gleich diese Eigenvektoren nicht berechnen?

Angi
Neuling
Neuling
Beiträge: 9
Registriert: 3. Okt 2007 18:42

Re: HITS-Algorithm (LA-Version)

Beitrag von Angi »

Hallo,
ich habe eine Frage zur Aufgabe 3a von der Klausur aus SS 2008:
Wie wird der HITS-Algorithmus für eine bestimmte Query angewandt? Ich stehe gerade ziemlich auf dem Schlauch.
Vielen Dank schon mal!

eneldo
Sonntagsinformatiker
Sonntagsinformatiker
Beiträge: 220
Registriert: 19. Mai 2006 13:06
Kontaktdaten:

Re: HITS-Algorithm (LA-Version)

Beitrag von eneldo »

Kommt eine Query an, wird im Index der Suchmaschine nachgeschaut, welche Dokumente auf die Anfrage zutreffen. Dies ist der Root-Set. Dieser Graph wird erweitert durch weitere ein- und ausgehende Seiten, z.B. durch nur die direkten Nachbarn. Auf den erweiterten Graphen wird dann der HITS-Algorithm wie in der Vorlesung und Übung besprochen angewandt.

Gruß
Eneldo

Antworten

Zurück zu „Web Mining“