Lerninhalte |
Wenn es um Bildverarbeitung oder Rechnersehen geht, hat kaum einer noch nichts von Deep Learning gehört. Diese Methode des maschinellen Lernens ermöglicht es Systeme zur Objekterkennung zu erstellen, die nicht auf handgemachte Merkmale angewiesen sind. Stattdessen, wird die Bildinformation selbst dem System präsentiert. Das System wandelt dann das Bild in eine passende Repräsentation um und anhand dieser Repräsentation werden Schlüsse auf die Objektkategorie gezogen.
Aktuelle Systeme versuchen nicht nur eine bestmögliche Repräsentation zu finden. Einige Systeme bestimmen welche Bereiche des Bildes für die Erkennungsaufgabe am relevantesten sind (Attention Networks). Andere systeme lernen eine geeignete Kombination der sogenannten Zwischen-Repräsentation.
Im Rahmen des Seminars werden solche Systeme betrachtet. Dazu stehen unter anderem folgende Themen zur Auswahl:
- Increasingly Specialized Ensemble of CNNs For Fine-Grained Recognition
- Weighted Generalized Mean Pooling for Deep Image Retrieval
- General Recurrent Attention Model for Jointly Multiple Object Recognition and Weakly Supervised
- Multi-exposure Fusion with CNN Features
- Progressive Attention Guided Recurrent Network for Salient Object Detection
- Learning a Discriminative Filter Bank Within a CNN for Fine-Grained Recognition
- Learning Multi-attention CNN for Fine-Grained Image Recognition
Das Seminar soll ein Überblick über verschiedene aktuelle Systeme geben und deren Grundidee vermitteln. Eine gewisse Vorbildung im Bereich der digitalen Bildverarbeitung ist wünschenswert, aber nicht zwingend erforderlich. Von jedem Seminarteilnehmer wird ein 30-minütiger Vortrag, eine 7 bis 10 Seiten lange Ausarbeitung, Anwesenheit, sowie eine aktive Mitarbeit erwartet. Vorbesprechung, Einführung, und Terminfindung finden in der zweiten Semesterwoche am Dienstag, den 16.04.2019 um 16 Uhr im EAP 2, R 1222A (Studenten-Labor) statt. Bei Bedarf kann dieser Termin auch verlegt werden. |