Übung 2: Histogramm in Aufgabe 2.1

Moderator: Web Mining

mrzb6
Mausschubser
Mausschubser
Beiträge: 54
Registriert: 4. Okt 2010 21:50
Wohnort: Darmstadt

Übung 2: Histogramm in Aufgabe 2.1

Beitrag von mrzb6 »

Hallo,
ich bin mir unsicher, wie der Plot aussehen soll, der in Aufgabe 2.1 gefordert ist.
Er­stellen Sie ein His­togramm über die An­zahl der URLs pro Seite (wie beim er­sten Übungs­blatt mit den Worthäufigkeit­en, auch log­a­rith­misch).
Welche Werte sollen hier auf welchen Achsen gezeigt werden? Meine Idee war, eine Zahl von URLs auf der x-Achse und die Anzahl der Seiten, die diese Zahl an URLs aufweisen, auf der y-Achse zu zeigen. Die logarithmierte Version dieses Plots ist aber nur eine unstrukturierte Ansammlung von Datenpunkten, an denen man nichts ablesen kann. Dieser Ansatz kommt mir daher falsch vor. Wie ist es gedacht?

inb4 Tutorium: Ich kann das Tutorium leider nicht besuchen, da ich zu diesem Zeitslot bereits zwei andere Veranstaltungen habe, von denen ich in Ermangelung eines Zeitumkehrers immer nur eine besuchen kann. :(

davidda
Windoof-User
Windoof-User
Beiträge: 31
Registriert: 19. Okt 2009 17:27

Re: Übung 2: Histogramm in Aufgabe 2.1

Beitrag von davidda »

Ja, da scheint mir auch etwas unklar formuliert.

Es gibt folgende Alternative zu deiner Interpretation, die ein "schöneres" Ergebnis liefert:
x-Achse = 1 bis Anzahl gecrawlter Seiten
y-Achse = Anzahl an URLs auf der Seite, (absteigend) sortiert

mrzb6
Mausschubser
Mausschubser
Beiträge: 54
Registriert: 4. Okt 2010 21:50
Wohnort: Darmstadt

Re: Übung 2: Histogramm in Aufgabe 2.1

Beitrag von mrzb6 »

Vielen Dank für die Antwort. Mit dieser Vorgehensweise ist auch der logarithmische Plot einigermaßen informativ. :)

Antworten

Zurück zu „Web Mining“