HITS (iterativ)

Moderator: Web Mining

Heinz
Mausschubser
Mausschubser
Beiträge: 91
Registriert: 10. Nov 2005 20:25

HITS (iterativ)

Beitrag von Heinz »

Wie wird denn beim iterativen HITS Algorithmus a(x) und h(x) normalisiert?

banshee
Nerd
Nerd
Beiträge: 684
Registriert: 22. Okt 2006 18:46

Re: HITS (iterativ)

Beitrag von banshee »

Soweit ich weiß ganz normal indem man die Hub- bzw. Authority-Scores einer page einfach durch die Summe aller Hub- bzw. Authority-Scores teilt. Man zählt da ja immer ganze Zahlen hoch, d.h. die Werte werden irgendwann ziemlich groß, was wohl verhindert werden soll.

Heinz
Mausschubser
Mausschubser
Beiträge: 91
Registriert: 10. Nov 2005 20:25

Re: HITS (iterativ)

Beitrag von Heinz »

einfach durch die Summe aller Hub- bzw. Authority-Scores teilt
Was ist hier genau "aller"? Aller Hub- bzw. Authority-Scores die die jeweilige Seite betrachtet oder "aller" die es überhaupt im Set gibt?

Danke

EDIT: Nach kurzem Nachdenken ist klar geworden, dass es die Summe ALLER sein muss. Danke

banshee
Nerd
Nerd
Beiträge: 684
Registriert: 22. Okt 2006 18:46

Re: HITS (iterativ)

Beitrag von banshee »

ja, sehe ich auch so. Das Ziel der Normalisierung ist es ja nach wie vor Authority/Hub-Scores untereinander vergleichen zu können, wobei man nun relative Prozentsätze anstatt absoluten Zahlen bekommt. Eine Authority-Score von 0,32 ist ja z.B. sehr viel aussagekräftiger als irgendwie 57234.
Bei deinem ersten Ansatz müsste übrigens für jede page 1 rauskommen, weil jede page immer die gesamte Score aus ihrem "pool" zieht.

Antworten

Zurück zu „Web Mining“