Im Frühjahr erschien bei uns “Generatives Deep Learning: Maschinen das Malen, Schreiben und Komponieren beibringen”. Ein Buch für die schönen Künste – und ja, das Programmieren ist hier ausdrücklich mitgemeint.
Zugegeben: eine Organistin wird aus mir nicht mehr – so wie einst Bach werde ich das eindrucksvolle Instrument niemals beherrschen. (Genauso wenig übrigens, wie ich irgendein anderes Instrument beherrsche.) Aber Komponieren, das könnte etwas werden. Vorausgesetzt, ich nutze Deep Learning-Modelle, die dann Präludien im Stil des großen Musikers erschaffen. Oder Picasso-like Leinwände gestalten. Oder: Sogar Texte für das oreillyblog schreiben?
Wenn Maschinen schreiben, malen und komponieren
David Foster, Data Scientist, Mathematiker und Autor unseres hier neu vorgestellten Buchs, hat sich diesen Herausforderungen gestellt – und sie auf sehr anschauliche und zugängliche Art und Weise beantwortet. In “Generatives Deep Learning” vermittelt er zunächst die Grundtechniken des Deep Learning mit Keras und zeigt die eindrucksvollsten generativen Deep-Learning-Modelle wie z.B. Generative Adversarial Networks (GANs), Variational Autoencoder (VAEs), Encoder-Decoder- sowie World-Modelle. Danach erklärt Foster anhand zahlreicher Bilder (natürlich ist das Buch farbig!), wie sich diese für kreative Aufgaben wie Malen, Schreiben und Komponieren von Musik nutzen lassen.
Das Buch lebt dabei ganz besonders durch seine spannenden Beispiele: Ihr wollt wissen, wie sich euer Gesichtsausdruck auf Fotos im Nachhinein ändern lässt? Oder auf welcher Basis die zahllosen Apps arbeiten, mit denen sich graue Strähnchen und Falten in makellose Jugend verwandeln lassen? Wie ihr zwei Gesichter ineinander verschmelzen lassen könnt? Wie ihr ein Foto in ein Gemälde des Post-Impressionismus verwandeln könnt – selbstredend ohne Smartphone-App? Dann folgt David Foster durch sein überaus inspirierendes Buch, taucht ab in alle bereits existierenden Möglichkeiten und lasst euch auf Gedankenspiele ein, was noch kommen mag. (Und: was technisch “hinter dem Schein” steckt.)
Für wen eignet sich das Buch?
Dieses Buch ist ideal für Data Scientists und Programmierer*innen, die Erfahrung mit Machine Learning haben. Wichtig ist, dass ihr auch schon ein wenig mit Python gearbeitet habt (wovon wir, wenn ihr schon mit Machine Learning vertraut seid, ausgehen). In einigen Fällen sind zudem grundlegende Kenntnisse in linearer Algebra und Wahrscheinlichkeitstheorie sinnvoll.
“Anhand von einfachen Beispielen, die detailliert bis auf die mathematische Formelebene beschrieben sind, zeigt der Autor, welchen entscheidenden Beitrag die Wahrscheinlichkeitsrechnung bei der Erzeugung von Bildern liefert.”
ekz Informationsdienst, Mai 2020
Und ich? Lege nun den Gedanken ans Orgelspielen wieder ad acta und träume stattdessen von einem Band 2. Darin steht dann, wie sich mit Deep Learning ein neues Bowie-Album erzeugen lässt. Oder, noch besser: Wie sich Konzerterlebnisse täuschend echt virtuell gestalten lassen – für Event-freie Jahre wie dieses 2020. Nun gut, vielleicht fange ich an zu malen. Ach, und Texte schreiben ist ja auch ganz schön!
Über das Buch
Generatives Deep Learning
Von David Foster
Übersetzung von Marcus Fraaß und Konstantin Mack
310 Seiten, in Farbe, 1. Auflage 2020
Print: 39,90 € (D), E-Book: 31,99 €
Inhaltsverzeichnis, Leseprobe und Bestellmöglichkeit unter oreilly.de.
Erhältlich bzw. bestellbar in allen On- und Offline-Buchhandlungen.