Übung 2 Aufgabe 2

Moderator: Web Mining

Nazgul3001
Neuling
Neuling
Beiträge: 3
Registriert: 26. Apr 2011 12:52

Übung 2 Aufgabe 2

Beitrag von Nazgul3001 »

Hallo zusammen,

bei dieser Aufgabe steht, dass mindestens 1000 Seiten gefunden werden sollen. Uns ist die Definition von neuer Seite nicht ganz klar.

Sind das hier 2 Seiten oder nur eine, da beide von medicaltaping.de ausgehen.

http://medicaltaping.de/Impressum/
http://medicaltaping.de/Kontakt/

Danke für eine schnelle Antwort.

Grüße

eneldo
Sonntagsinformatiker
Sonntagsinformatiker
Beiträge: 220
Registriert: 19. Mai 2006 13:06
Kontaktdaten:

Re: Übung 2 Aufgabe 2

Beitrag von eneldo »

Eine Seite entspricht einer HTML-Seite, einer URL sozusagen. Die angegebenen Links sind somit zwei unterschiedliche Seiten, da sie von der URL unterschiedlich sind und auch noch vom Inhalt.

Gruß
Eneldo Loza

Benutzeravatar
Le_Coeur
BASIC-Programmierer
BASIC-Programmierer
Beiträge: 135
Registriert: 18. Apr 2009 12:39
Kontaktdaten:

Re: Übung 2 Aufgabe 2

Beitrag von Le_Coeur »

Und was ist unter Host-Name gemeint? DNS + port ? Oder soll ich die IP-Adresse vergleichen?

Benutzeravatar
m0ep
Endlosschleifenbastler
Endlosschleifenbastler
Beiträge: 189
Registriert: 5. Okt 2006 22:52
Wohnort: Bensheim
Kontaktdaten:

Re: Übung 2 Aufgabe 2

Beitrag von m0ep »

Le_Coeur hat geschrieben:Und was ist unter Host-Name gemeint? DNS + port ? Oder soll ich die IP-Adresse vergleichen?
Ich würde sagen es ist Host im Sinne einer URL gemeint -> http://de.wikipedia.org/wiki/Uniform_Resource_Locator
Also im obigen Beispiel:
http://medicaltaping.de/Impressum/ -> medicaltaping.de
bzw.
http://medicaltaping.de:80/Impressum/ -> medicaltaping.de
Lasst mich Arzt, ich bin durch!

Benutzeravatar
olg
Sonntagsinformatiker
Sonntagsinformatiker
Beiträge: 297
Registriert: 1. Okt 2008 19:24

Re: Übung 2 Aufgabe 2

Beitrag von olg »

Wir haben das ähnlich wie m0ep gesehen, und dabei immer nur den Anteil der toplevel-domain aufsummiert.

Code: Alles auswählen

google.com/bar -> google.com
de.wikipedia.org/foo -> wikipedia.org
foo.bar.com:8080/foo -> bar.com
"To Perl, or not to Perl, that is the kvetching." ~Larry Wall

Antworten

Zurück zu „Web Mining“