← Ratgeber & Wissen

Der Quick, Draw!-Datensatz: wie aus einem Spiel KI-Trainingsdaten wurden

Damit eine KI Kritzeleien erkennen kann, braucht sie unzählige Beispiele. Einer der größten offenen Skizzen-Datensätze entstand auf charmante Weise: durch ein Browserspiel, das Millionen Menschen freiwillig spielten.

Ein Spiel sammelt Daten

2016 veröffentlichte Google im Rahmen seiner „A.I. Experiments“ das Spiel „Quick, Draw!“. Die Aufgabe: Man bekommt einen Begriff und hat 20 Sekunden, ihn zu zeichnen, während eine KI rät. Was als unterhaltsames Experiment begann, wurde nebenbei zur gigantischen Datensammlung – denn jede Zeichnung wurde (anonymisiert) gespeichert.

So kamen über 50 Millionen Zeichnungen in 345 Kategorien zusammen – von „Apfel“ über „Leuchtturm“ bis „Zickzack“. Google stellte diesen Datensatz anschließend öffentlich zur Verfügung, damit Forschende und Entwickler damit arbeiten können.

Was in den Daten steckt

Spannend ist das Format: Gespeichert wurde nicht nur ein fertiges Bild, sondern die Zeichnung als Folge von Strichen – also welche Linien in welcher Reihenfolge und Richtung entstanden sind. Dadurch lässt sich eine Skizze sowohl als Bild auswerten (jeder Strich wird auf eine Fläche gezeichnet) als auch als zeitliche Sequenz (Punkt für Punkt).

Genau diese Doppelnatur macht den Datensatz für die Forschung so wertvoll: Er eignet sich für klassische Bilderkennung ebenso wie für Modelle, die mit Sequenzen umgehen.

Wofür er genutzt wird

Der Quick, Draw!-Datensatz ist zu einem Standard-Spielplatz für maschinelles Lernen geworden. Bekannt wurde unter anderem Sketch-RNN, ein Modell, das Skizzen nicht nur erkennt, sondern selbst neue zeichnen kann. Darüber hinaus dient er als Übungsdatensatz in Kursen, für Vergleichstests von Modellen und für kreative Projekte rund um maschinelle Wahrnehmung.

Auch DrawClash steht in dieser Tradition: Das Erkennungsmodell unterscheidet dieselben 345 Kategorien. Die vollständige Liste – in neun Sprachen – findest du unter Alle Begriffe.

Warum „viele Menschen“ besser sind als „perfekte“ Zeichnungen

Der eigentliche Schatz des Datensatzes ist seine Vielfalt: Weil unzählige verschiedene Menschen gezeichnet haben, enthält er krakelige, schiefe, minimalistische und detailverliebte Versionen desselben Begriffs. Ein Modell, das damit trainiert, lernt die gemeinsame Essenz eines Motivs statt einer einzigen „richtigen“ Darstellung – und wird dadurch robust gegen die Eigenheiten jedes Spielers.

Quellen & weiterlesen

„Quick, Draw!“ und der zugehörige Datensatz sind Werke von Google Creative Lab. DrawClash ist ein unabhängiges Projekt und steht in keiner Verbindung zu Google.

Selbst eine Skizze beisteuern? Zumindest ausprobieren!

Zeichne in DrawClash und sieh, wie die KI deine Striche deutet.

Let’s Play