Die Datenflut mit intelligenten Algorithmen bändigen

Kommentare Abstract

Tags:

Erschliessung

Informatik

Was ist künstliche Intelligenz und wie kann sie uns helfen? Welche Auswirkungen hat sie auf die Bilder, die wir uns über die Welt machen?

Unsere Sicht auf die Welt ist stark geprägt von Daten und deren Auswertung. Mit Daten gefütterte Algorithmen treffen Entscheidungen, die unser Leben bis auf eine gesellschaftliche Ebene hinauf beeinflussen. Sei es in Form von Profilen über unsere Verhaltensweisen und Psyche oder in Form von Infektionsraten. Sie bestimmen mit, welche Informationen wir in Suchmaschinen zu sehen bekommen, welche Produkte wir kaufen oder wie gross unser Bewegungsradius ist.

Neue Möglichkeiten

Methoden aus dem Bereich der Künstlichen Intelligenz wie Maschinelles Lernen (ML) bieten neue Möglichkeiten bei der Auswertung von Daten. Sie lernen aus grossen Datenmengen, erkennen Muster, statistische Zusammenhänge, auf Grund derer sie Schlüsse ziehen. Sie erkennen Gegenstände auf Bildern, hören uns zu, übersetzen, schreiben Texte und spielen Brettspiele wie beispielsweise Go besser als die besten Menschen. All das durch eine geschickte Kombination von lernfähigen Algorithmen und Beispieldaten.

Intelligentes Verhalten durch Künstliche Intelligenz

Alle Algorithmen die intelligentes Verhalten aufweisen, werden künstliche Intelligenzen (KI) genannt. Ein Beispiel für intelligentes Verhalten ist das Erkennen von Tierarten auf Bildern. Wir können Computer dieses intelligente Verhalten geben, indem wir Regeln finden, aufgrund derer sie entscheiden können, welche Tierart auf einem uns unbekannten Bild abgebildet ist. Da die Regeln für möglichst viele Bilder gelten müssen, und bereits eine Tierart sehr vielfältig ist, wären das enorm viele. Zusätzlich müssten wir, um andere Arten zu erkennen, neue Regeln finden. Lernende Algorithmen fällen solche Entscheidungen, wie Beispielsweise ob eine Maus oder eine Katze auf einem Bild abgebildet ist, durch Berechnungen (siehe Abbildung 1). Sie lernen, indem sie eine Berechnung finden, die aus beliebigen Eingabedaten (Bilder von Katzen und Mäusen) die entsprechende Ausgabe (Katze oder Maus) als Resultat hat.

Abbildung 1. Entscheiden durch Berechnung

Lernmaschinen wandeln eine Eingabe in eine Ausgabe um. Sie tun das, indem sie eine Berechnung (f), auf eine Eingabe (x) anwenden. In der Abbildung 1 ist die Eingabe ein Bild. Die Ausgabe, also das Resultat der Berechnung, sind Wahrscheinlichkeiten für Maus oder Katze. Lernprozess: Anhand von Beispielbilder von denen wir bereits wissen, ob eine Maus oder eine Katze abgebildet ist, eine Berechnung finden, die die richtigen Ergebnisse auch für unbekannte Bilder liefert. Damit wir etwas berechnen können, wandeln wir die Eingabe (Bild) in Zahlen (Farbwerte) um, bevor wir sie der Lernmaschine übergeben.

Der Vorteil von lernenden Algorithmen ist, dass sie Regeln selber anhand einer Sammlung von Beispielen entdecken. Von jedem Beispiel ist bereits bekannt was die richtige Entscheidung wäre. Die lernende Maschine findet dann die Regeln, die es ihr erlauben für ihr unbekannte Daten, die richtige Entscheidung zu treffen. Um sie darauf zu trainieren andere Entscheidungen zu treffen, müssen wir ihr nur andere Beispiele geben.
Zur KI gehören neben den lernenden Algorithmen auch solche wie die für Suche und Planung. Der kürzeste Weg kann nämlich mit schlauem Durchprobieren gefunden werden.

Nächste Stufe der Digitalisierung

Im Archiv der Zukunft können wir nicht nur in Texten fündig werden, sondern auch in Handschriften, Bildern und Tonaufnahmen. Diese Medien sind ohne ML nur mit menschlicher Hilfe dem Computer zugänglich. Sie können zwar digital aufgezeichnet und wiedergegeben werden, Informationen über die Inhalte bleiben aber verschlossen. Für einen Computer sind sie nur eine Abfolge von Zahlen ohne Bedeutung. Mit ML ändert sich das. Ton wird automatisch transkribiert und Gegenstände auf Bildern erkannt. Eine für den Computer vorher bedeutungslose Ansammlung von Pixeln wird zu einer vielsagenden Beschreibung einer Szene. Das macht grosse, verschlossen geglaubte Datenberge plötzlich zugänglich.

Künstliches Textverständnis

Vielleicht können wir schon bald einfach und zeitsparend herausfinden, ob wir ein Buch oder Kapitel lesen wollen, indem wir es automatisch zusammenfassen lassen. Obwohl wir Texte bereits gut durchsuchen können, bergen neuere ML Verfahren auch in diesem Bereich grosse Potenziale. Durch ML verbessert sich vor allem das “Sprachverständnis” der Algorithmen. So besteht ein Wort nicht mehr nur aus seinen Buchstaben, sondern lernende Algorithmen finden durch die Analyse von Texten deren tiefere Bedeutungen. Worte und ganze Texte werden zu mathematischen Objekten, Vektoren, mit denen man rechnen kann. Zum Beispiel kann das Wort König durch Addition und Subtraktion anderer Worte gebildet werden,König= Mann - Frau + Königin(siehe Abbildung 2). Aktuelle Forschungsprototypen können bereits Texte zusammenfassen, Fragen beantworten oder logische Schlüsse ziehen. Haben wir in der Zukunft eine Frage zu einem Text, müssen wir ihn vielleicht nicht mal mehr lesen, sondern lassen sie automatisch beantworten.

Worte sind als Punkte in einem Raum eingebettet. Die Richtungen im Raum haben unterschiedliche Bedeutungen. Das Wort König kann als Bedeutung von Königin plus die Differenz zwischen der Bedeutung von Mann und Frau angesehen werden, also König= Mann - Frau + Königin. Eine Lernmaschine erstellt den Raum und platziert Worte durch Analyse von Textdaten (Abbildung 2).

Sicht auf die Welt durch Maschinelles Lernen

Die Datenflut führt zwingendermassen nicht an ML vorbei, wir brauchen automatisierte Auswertungsmöglichkeiten, um eine Sicht auf unsere und vergangene Welten zu erhaschen. Wie wird diese Sicht durch die Algorithmen verändert?

Machine Learning Modelle können, wie wir auch, an einer verzerrten Wahrnehmung leiden. Die Sicht auf die Realität, die sie uns geben, hängt von den Daten ab, mit denen sie gefüttert werden. Dies wurde einer breiten Öffentlichkeit durch den Chatbot Tay bekannt. Tay konnte an sein Gegenüber angepasste Konversationen auf Twitter führen und wurde dadurch rassistisch. Die Antworten, die Künstliche Intelligenzen liefern, sollten also genau darauf untersucht werden, ob sie dem Gewünschten entsprechen. Es ist wichtig, die Eigenheiten einer KI zu kennen.

Für Archive und Bibliotheken bedeutet das, dass es nicht unbedingt genügt ML Modelle mit Daten von heute zu trainieren. Mit solchen Modellen schaut man durch die Brille von heute auf die Vergangenheit und würde vieles nicht sehen. Historische Autos könnten zum Beispiel nicht so gut erkannt werden wie die heutigen. Für solche Anwendungen müssen spezielle Datensätze angefertigt werden, die den zeitlichen Veränderungen gerecht werden.

Wie wir leben und welche Entscheidungen wir treffen, hängt immer stärker von solchen Methoden ab. Wollen wir unser Leben dokumentieren, müssen wir also auch diese künstlichen Intelligenzen festhalten. Wollen wir in Zukunft mehr über unsere Zeit erfahren, kommen wir nicht daran herum, die künstlichen Intelligenzen nachzuvollziehen, die wir heute erschaffen und die uns geprägt haben.

Andreas Schneider

Andreas Schneider ist Consultant bei ipt.ch. Er berät Unternehmen in Fragen zu Machine Learning und künstlicher Intelligenz. Vorher hat er an Computer Vision und Machine Learning Modellen zur automatischen künstlichen Alterung von Gesichtern auf Photographien an der Universität Basel geforscht und dissertiert.

Abstract

Deutsch

Deutsch

Tags:

Die Datenflut mit intelligenten Algorithmen bändigen

Tags:

Neue Möglichkeiten

Intelligentes Verhalten durch Künstliche Intelligenz

Nächste Stufe der Digitalisierung

Künstliches Textverständnis

Sicht auf die Welt durch Maschinelles Lernen

Andreas Schneider

Abstract

Wie und weshalb wir Twitter-Timelines archivieren

Au service de tou.te.s, par principe