Lerninhalte |
Lernziele: Studierende sollen durch diese Veranstaltung folgende Kompetenzen erwerben: - Sie können Retrieval-Probleme in realen Suchdomänen identifizieren. - Sie sind mit den Grundkonzepten und Methoden des Information Retrieval vertraut und können das Zusammenspiel der wichtigsten Komponenten von Suchmaschinen erläutern. - Sie besitzen einen systematischen Überblick über die wichtigen Schritte bei der Vorverarbeitung von Textdokumenten und können praktisch relevante Entscheidungen für oder gegen den Einsatz einzelner Vorverarbeitungsschritte wohlinformiert treffen. - Sie können den Aufbau und die Struktur eines Suchmaschinenindexes erklären und die Vor- und Nachteile der Integration verschiedener Bestandteile gegeneinander abwägen. - Sie kennen wichtige grundlegende Retrieval-Modelle und können wohlinformierte Entscheidungen über deren Einsatz treffen. - Sie können praktische Gesichtspunkte für die Verbesserung von Suchsystemen analysieren und einschätzen. - Sie sind in der Lage, eine einfache Suchmaschine zu einer gegebenen Suchdomäne zu entwickeln und die Effektivität systematisch zu evaluieren. Inhalte: - In der Vorlesung werden Konzepte, Methoden und der mathematische Hintergrund des Information Retrieval zum Aufbau von (Web-)Suchmaschinen für unstrukturierte Textdaten vermittelt. - Architektur von Suchmaschinen - Crawling, Parsing, Informationsextraktion - Invertierte Indexe und Index-Kompression - Anfrageverarbeitung - Retrieval-Modelle - Experimentelle Evaluierung |