Hallo zusammen,
bei dieser Aufgabe steht, dass mindestens 1000 Seiten gefunden werden sollen. Uns ist die Definition von neuer Seite nicht ganz klar.
Sind das hier 2 Seiten oder nur eine, da beide von medicaltaping.de ausgehen.
http://medicaltaping.de/Impressum/
http://medicaltaping.de/Kontakt/
Danke für eine schnelle Antwort.
Grüße
Übung 2 Aufgabe 2
Moderator: Web Mining
Re: Übung 2 Aufgabe 2
Eine Seite entspricht einer HTML-Seite, einer URL sozusagen. Die angegebenen Links sind somit zwei unterschiedliche Seiten, da sie von der URL unterschiedlich sind und auch noch vom Inhalt.
Gruß
Eneldo Loza
Gruß
Eneldo Loza
Re: Übung 2 Aufgabe 2
Und was ist unter Host-Name gemeint? DNS + port ? Oder soll ich die IP-Adresse vergleichen?
- m0ep
- Endlosschleifenbastler
- Beiträge: 189
- Registriert: 5. Okt 2006 22:52
- Wohnort: Bensheim
- Kontaktdaten:
Re: Übung 2 Aufgabe 2
Ich würde sagen es ist Host im Sinne einer URL gemeint -> http://de.wikipedia.org/wiki/Uniform_Resource_LocatorLe_Coeur hat geschrieben:Und was ist unter Host-Name gemeint? DNS + port ? Oder soll ich die IP-Adresse vergleichen?
Also im obigen Beispiel:
http://medicaltaping.de/Impressum/ -> medicaltaping.de
bzw.
http://medicaltaping.de:80/Impressum/ -> medicaltaping.de
Lasst mich Arzt, ich bin durch!
Re: Übung 2 Aufgabe 2
Wir haben das ähnlich wie m0ep gesehen, und dabei immer nur den Anteil der toplevel-domain aufsummiert.
Code: Alles auswählen
google.com/bar -> google.com
de.wikipedia.org/foo -> wikipedia.org
foo.bar.com:8080/foo -> bar.com
"To Perl, or not to Perl, that is the kvetching." ~Larry Wall