3. Übung
Moderator: Probabilistische Graphische Modelle
Re: 3. Übung
Nein. Vorgegeben sind nur die Daten aus dieser Uebung. Die Daten von der letzten Uebung muesstet ihr ja extrahieren, was man natuerlich machen koennte. Aber dann fehlt euch ja immer noch die "Ground Truth", d.h. die Pixelzuordnungen zu Hinter- und Vordergrund, damit ihr dann am Ende auch die Ergebnisse vergleichen koennt.
Ich wurde auch noch mal wegen den Daten gefragt: in X sind Bilder der Kategorie Apfel und Auto (wie auf dem Uebungsbild abgebildet) zeilenweise in einer Bag of Feature Repraesentation abgespeichert. Bei dieser Repraesentation werden lokale "interest points" (Punkte mit hohen Gradienten, wie Ecken, Kanten usw.) detektiert. Hier mit einem Hesse Detektor. Danach werden sogenannte "visual words" anhand dieser Gradienten gelernt mittels Clustering und dann werden die Gradienten fuer jedes Bild diesen Clustern zugeordnet. Hier in diesem Fall wurden 10000 Cluster (visual words) gelernt und danach wird dann gezaehlt wie oft jedes "Wort" in diesen Bildern vorkommt.
Um das grob zu veranschaulichen: Der Stossdaempfer koennte zum Beispiel ein solches "visual word" sein und dann kommt dieses Wort sehr viel haeufiger in der Autokategorie vor als der Apfelkategorie.
Ich wurde auch noch mal wegen den Daten gefragt: in X sind Bilder der Kategorie Apfel und Auto (wie auf dem Uebungsbild abgebildet) zeilenweise in einer Bag of Feature Repraesentation abgespeichert. Bei dieser Repraesentation werden lokale "interest points" (Punkte mit hohen Gradienten, wie Ecken, Kanten usw.) detektiert. Hier mit einem Hesse Detektor. Danach werden sogenannte "visual words" anhand dieser Gradienten gelernt mittels Clustering und dann werden die Gradienten fuer jedes Bild diesen Clustern zugeordnet. Hier in diesem Fall wurden 10000 Cluster (visual words) gelernt und danach wird dann gezaehlt wie oft jedes "Wort" in diesen Bildern vorkommt.
Um das grob zu veranschaulichen: Der Stossdaempfer koennte zum Beispiel ein solches "visual word" sein und dann kommt dieses Wort sehr viel haeufiger in der Autokategorie vor als der Apfelkategorie.
Re: 3. Übung
bei k = 250 ist es nur die 640. featurezeile, die mit keinem anderen mutually verbunden ist.
k=50: [1 52 110 129 177 228 290 312 341 344 347 440 476 488 579 587 594 597 599 640 653 720 727 728]
k=50: [1 52 110 129 177 228 290 312 341 344 347 440 476 488 579 587 594 597 599 640 653 720 727 728]
Nichts ist wie es scheint!
_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _
Zuletzt geändert von xAx am 14. Mär 2009 16:17, insgesamt 99-mal geändert.
_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _
Zuletzt geändert von xAx am 14. Mär 2009 16:17, insgesamt 99-mal geändert.
Re: 3. Übung
Das ist das dazu gehoerige Problembild:

Ich vermute mal, dass die Gradienten fuer dieses Auto und aus diesem Blickwinkel einfach zu speziell sind. Alle anderen Autotypen (es gibt ca. 10 verschiedene) haben aus genau diesem Blickwinkel ein viel kleineres Rueckfenster. Und alle anderen Blickwinkel von genau diesem Auto sind zu unterschiedlich, um als naechste Nachbarn in Frage zu kommen. Das ist ja sehr interessant!
Bei den anderen Fotos fuer k=50 ist es sehr aehnlich: Das erste Bild ist zum Beispiel ein Apfel von oben fotografiert (senkrecht), was generell sehr schwierig zu lernen ist, weil die Gradienten sich stark von den 'seitlichen' Gradienten unterscheiden.

Ich vermute mal, dass die Gradienten fuer dieses Auto und aus diesem Blickwinkel einfach zu speziell sind. Alle anderen Autotypen (es gibt ca. 10 verschiedene) haben aus genau diesem Blickwinkel ein viel kleineres Rueckfenster. Und alle anderen Blickwinkel von genau diesem Auto sind zu unterschiedlich, um als naechste Nachbarn in Frage zu kommen. Das ist ja sehr interessant!
Bei den anderen Fotos fuer k=50 ist es sehr aehnlich: Das erste Bild ist zum Beispiel ein Apfel von oben fotografiert (senkrecht), was generell sehr schwierig zu lernen ist, weil die Gradienten sich stark von den 'seitlichen' Gradienten unterscheiden.
- JanEisklar
- Mausschubser
- Beiträge: 48
- Registriert: 18. Okt 2007 13:29
- Kontaktdaten:
Re: 3. Übung
Könnten wir diese Bilder vllt noch bekommen?
Wenn es zu groß für die Homepage ist, könnte man es gegebenfalls auch auf einen free-hoster wie http://drop.io/ oder rapidshare hochladen, das würde ja vollkommen ausreichen.
Vielen Dank schonmal.
Wenn es zu groß für die Homepage ist, könnte man es gegebenfalls auch auf einen free-hoster wie http://drop.io/ oder rapidshare hochladen, das würde ja vollkommen ausreichen.
Vielen Dank schonmal.
-
- Neuling
- Beiträge: 2
- Registriert: 8. Nov 2009 15:01
Re: 3. Übung
Hallo everybody,
I did my homework, and I tested with some simples data, now I want to try with the given data but i don't know where is it exactely ??:( , the given one is a matrix X with 1000 , 820 as a size (I don't know if it's the one which corresponds to the apfel and auto) !! if it's true , can you show me how can we extract the images from this data ??
another question : the given image (the black auto) is an [m,n,d] matrix, but the program supposed to be rub with an [n,d] matrix !! so how can we deal with that
think you for your help.
Youssef
I did my homework, and I tested with some simples data, now I want to try with the given data but i don't know where is it exactely ??:( , the given one is a matrix X with 1000 , 820 as a size (I don't know if it's the one which corresponds to the apfel and auto) !! if it's true , can you show me how can we extract the images from this data ??
another question : the given image (the black auto) is an [m,n,d] matrix, but the program supposed to be rub with an [n,d] matrix !! so how can we deal with that
think you for your help.
Youssef
- JanEisklar
- Mausschubser
- Beiträge: 48
- Registriert: 18. Okt 2007 13:29
- Kontaktdaten:
Re: 3. Übung
We didn't get the images, but instead a set of features that were extracted beforehand from the actual images. So the matrix X contains the extracted features(d=820) for every image(n=1000).Youssef.Oualil hat geschrieben:Hallo everybody,
I did my homework, and I tested with some simples data, now I want to try with the given data but i don't know where is it exactely ??:( , the given one is a matrix X with 1000 , 820 as a size (I don't know if it's the one which corresponds to the apfel and auto) !! if it's true , can you show me how can we extract the images from this data ??
Youssef
In other words: you can't look at the actual images but only test if you classified it correctly by checking against the vector y.
I think this should also answer your second question.
FYI: Even if you had the images you'd still have to know which features were chosen and how exactly they were extracted from the actual image. So the image of the black car won't get you anywhere.
-
- Neuling
- Beiträge: 2
- Registriert: 8. Nov 2009 15:01
Re: 3. Übung
think you JanEisklar for your answer. I will try that.
Re: 3. Übung
The other way around: 820 images and 1.000 features. And Y contains the labels of the images and is also of size 820.