Seite 1 von 1

Übung 2: Histogramm in Aufgabe 2.1

Verfasst: 22. Mai 2014 14:23
von mrzb6
Hallo,
ich bin mir unsicher, wie der Plot aussehen soll, der in Aufgabe 2.1 gefordert ist.
Er­stellen Sie ein His­togramm über die An­zahl der URLs pro Seite (wie beim er­sten Übungs­blatt mit den Worthäufigkeit­en, auch log­a­rith­misch).
Welche Werte sollen hier auf welchen Achsen gezeigt werden? Meine Idee war, eine Zahl von URLs auf der x-Achse und die Anzahl der Seiten, die diese Zahl an URLs aufweisen, auf der y-Achse zu zeigen. Die logarithmierte Version dieses Plots ist aber nur eine unstrukturierte Ansammlung von Datenpunkten, an denen man nichts ablesen kann. Dieser Ansatz kommt mir daher falsch vor. Wie ist es gedacht?

inb4 Tutorium: Ich kann das Tutorium leider nicht besuchen, da ich zu diesem Zeitslot bereits zwei andere Veranstaltungen habe, von denen ich in Ermangelung eines Zeitumkehrers immer nur eine besuchen kann. :(

Re: Übung 2: Histogramm in Aufgabe 2.1

Verfasst: 24. Mai 2014 18:55
von davidda
Ja, da scheint mir auch etwas unklar formuliert.

Es gibt folgende Alternative zu deiner Interpretation, die ein "schöneres" Ergebnis liefert:
x-Achse = 1 bis Anzahl gecrawlter Seiten
y-Achse = Anzahl an URLs auf der Seite, (absteigend) sortiert

Re: Übung 2: Histogramm in Aufgabe 2.1

Verfasst: 24. Mai 2014 20:47
von mrzb6
Vielen Dank für die Antwort. Mit dieser Vorgehensweise ist auch der logarithmische Plot einigermaßen informativ. :)