Seite 1 von 1

HITS (iterativ)

Verfasst: 18. Jul 2011 22:34
von Heinz
Wie wird denn beim iterativen HITS Algorithmus a(x) und h(x) normalisiert?

Re: HITS (iterativ)

Verfasst: 19. Jul 2011 11:31
von banshee
Soweit ich weiß ganz normal indem man die Hub- bzw. Authority-Scores einer page einfach durch die Summe aller Hub- bzw. Authority-Scores teilt. Man zählt da ja immer ganze Zahlen hoch, d.h. die Werte werden irgendwann ziemlich groß, was wohl verhindert werden soll.

Re: HITS (iterativ)

Verfasst: 19. Jul 2011 11:38
von Heinz
einfach durch die Summe aller Hub- bzw. Authority-Scores teilt
Was ist hier genau "aller"? Aller Hub- bzw. Authority-Scores die die jeweilige Seite betrachtet oder "aller" die es überhaupt im Set gibt?

Danke

EDIT: Nach kurzem Nachdenken ist klar geworden, dass es die Summe ALLER sein muss. Danke

Re: HITS (iterativ)

Verfasst: 19. Jul 2011 14:52
von banshee
ja, sehe ich auch so. Das Ziel der Normalisierung ist es ja nach wie vor Authority/Hub-Scores untereinander vergleichen zu können, wobei man nun relative Prozentsätze anstatt absoluten Zahlen bekommt. Eine Authority-Score von 0,32 ist ja z.B. sehr viel aussagekräftiger als irgendwie 57234.
Bei deinem ersten Ansatz müsste übrigens für jede page 1 rauskommen, weil jede page immer die gesamte Score aus ihrem "pool" zieht.