Statistik für Data Scientists

Ein Buch für Data Scientists, die ihr Wissen über Statistik auf ein neues Level bringen wollen: Praktische Statistik für Data Scientists, kürzlich bei uns erschienen.

Was reden wir doch seit vergangenem Frühjahr über Daten: Über Anstiege und Rückgänge, über Zielwerte und Höchstwerte, über Wahrscheinlichkeiten und über, ihr ahnt es, den besonderen Charakter des exponentiellen Anstiegs. Statistikwissen war und ist gefragt – unter Politikerinnen, Wissenschaftlern, Ärzten, Informatikerinnen. Tatsächlich unter uns allen.

Entsprechend mussten wir alle uns “Wissen draufschaffen”. Nach außen sichtbar wird diese Kompetenz im Falle von Medien: Zeitschriften und Zeitungen, Nachrichtenmagazine und Newsportale, Podcasts und Blogs berichten nicht nur durch Textbeiträge, sondern eben auch durch Grafiken und Tabellen, häufig interaktiv.

Nicht gerade trivial: Daten analysieren, darstellen, deuten

Data Scientists, die bislang eine Informatik-Laufbahn absolviert haben oder deren beruflicher Hintergrund in der Programmierung liegt, benötigen die entsprechende Statistik- und Mathematik-Kompetenz ebenfalls. Übrigens nicht erst seit einigen Monaten, faktisch diskutieren Fachleute schon seit Jahren, über welche Fertigkeiten und Fähigkeiten Data Scientists verfügen sollten. Allerdings gehört eine formale statistische Ausbildung nicht zwingend zu den Skills, die Data Scientists mitbringen. Und deshalb empfehlen wir ihnen den Blick in “Praktische Statistik für Data Scientists”.

Statistik für Data Scientists Buch
Ausreichend Statistikkompetenz, um saubere Datensätze zu liefern, verzerrungsfreie Abfragen zu erstellen oder solide Prognosen zu erstellen

Das Buch erläutert:

  • warum die explorative Datenanalyse ein wichtiger vorbereitender Arbeitsschritt in der Datenwissenschaft ist
  • wie Zufallsstichproben Verzerrungen reduzieren und einen qualitativ hochwertigeren Datensatz liefern
  • wie ihr mit den Prinzipien des experimentellen Designs eindeutige Antworten auf Forschungsfragen erhaltet
  • wie ihr mithilfe einer Regression Prognosen trefft oder Anomalien erkennt
  • wie sich mit statistischen Methoden aus dem Bereich des Machine Learning aus Daten lernen lässt
  • wie ihr Erkenntnisse aus ungelabelten Daten gewinnt

Die Autoren vereinen als Team die Disziplinen Statistik, Mathematik, Datenanalyse und Programmierung: Peter Bruce ist Gründer des Institutes for Statistics Education bei Statistics.com und bringt wegen seiner Lehrtätigkeit insbesondere didaktische Erfahrung mit. Auch Andrew Bruce hat bereits gelehrt, als Professor für Statistik. Außerdem erlangte er nach seinem Statistikstudium in Princeton und Washington mehr als 25 Jahre exzellente Praxiserfahrung, aktuell als Principal Research Scientist bei Amazon. Peter Gedeck studierte hierzulande: An der Fernuni Hagen sowie an der altehrwürdigen Friedrich-Alexander-Universität Erlangen-Nürnberg in den Fächern Mathematik und Chemie. Er gehört zu den führenden Data Scientists in der Pharma-Forschung und entwickelt Machine-Learning-Algorithmen für die Vorhersage von Eigenschaften von Arzneimittelkandidaten.

Statistik für Data Scientists Probeseiten

Ohne Umschweife auf den Punkt

Obwohl sie nun zu dritt die Expertise für vermutlich 2.000+ Buchseiten mitbringen, gelingt es den Autoren, ihr Wissen auf die wichtigsten und praxistauglichsten Aspekte zu kondensieren. Sie liefern tiefgründiges und gleichzeitig gut verständliches Statistikwissen sowie den Code zu allen im Buch aufgeführten Beispielen, sowohl in R als auch in Python.

Schlüsselbegriffe wie Histogramm, Mittelwert, Perzentil, Verzerrung (und viele andere) erklären die Autoren nachvollziehbar und solide, sollte es Synonyme in den jeweiligen Fächern Statistik, Informatik oder Informationstechnologie geben, werden diese ergänzt. So erhaltet ihr eine leicht zugängliche Referenz der Begriffe und Methoden. Außerdem ordnen sie für euch ein, welche Konzepte aus datenwissenschaftlicher Sicht wichtig und nützlich sind. (Und warum.)

Data Scientists, Softwareentwickler:innen, Datenanalysten und Studierende der Informatik lotst das Buch so zielsicher durch die Welt der Statistik. Ein Probekapitel und weitere Informationen findet ihr wie immer direkt auf oreilly.de.


Fügen Sie einen Kommentar hinzu