Log In
Or create an account ->
Imperial Library
Home
About
News
Upload
Forum
Help
Login/SignUp
Index
Titel
Impressum
Inhalt
Vorwort
Kapitel 1: Einführung
Der Aufstieg der Daten
Was ist Data Science?
Ein motivierendes Szenario: DataSciencester
Kapitel 2: Ein Crashkurs in Python
Grundlagen
Über die Grundlagen hinaus
Weiterführendes Material
Kapitel 3: Daten visualisieren
matplotlib
Balkendiagramme
Liniendiagramme
Scatterplots
Weiterführendes Material
Kapitel 4: Lineare Algebra
Vektoren
Matrizen
Weiterführendes Material
Kapitel 5: Statistik
Einen einzelnen Datensatz beschreiben
Korrelation
Das Simpson-Paradoxon
Weitere Fallstricke von Korrelationen
Korrelation und Kausalität
Weiterführendes Material
Kapitel 6: Wahrscheinlichkeit
Abhängigkeit und Unabhängigkeit
Bedingte Wahrscheinlichkeit
Der Satz von Bayes
Zufallsvariablen
Kontinuierliche Wahrscheinlichkeitsverteilungen
Die Normalverteilung
Der zentrale Grenzwertsatz
Weiterführendes Material
Kapitel 7: Hypothesen und Schlussfolgerungen
Testen statistischer Hypothesen
Beispiel: Münzwürfe
p-Werte
Konfidenzintervalle
P-Hacking
Beispiel: Durchführen eines A/B-Tests
Bayessche Inferenz
Weiterführendes Material
Kapitel 8: Die Gradientenmethode
Die Idee hinter der Gradientenmethode
Abschätzen des Gradienten
Den Gradienten verwenden
Auswahl der richtigen Schrittweite
Anwendungsbeispiel
Stochastische Gradientenmethode
Weiterführendes Material
Kapitel 9: Daten sammeln
stdin und stdout
Einlesen von Dateien
Auslesen von Webseiten
Verwenden von APIs
Beispiel: Verwenden der Twitter-APIs
Weiterführendes Material
Kapitel 10: Arbeiten mit Daten
Erkunden Ihrer Daten
Bereinigen und Umformen
Manipulieren von Daten
Umskalieren
Hauptkomponentenanalyse
Weiterführendes Material
Kapitel 11: Maschinelles Lernen
Modellieren
Was ist maschinelles Lernen?
Overfitting und Underfitting
Genauigkeit
Der Kompromiss zwischen Bias und Varianz
Extraktion und Auswahl von Eigenschaften
Weiterführendes Material
Kapitel 12: k-Nächste-Nachbarn
Das Modell
Beispiel: bevorzugte Programmiersprachen
Der Fluch der Dimensionalität
Weiterführendes Material
Kapitel 13: Naive Bayes-Klassifikatoren
Ein wirklich primitiver Spam-Filter
Ein anspruchsvollerer Spam-Filter
Implementierung
Testen des Modells
Weiterführendes Material
Kapitel 14: Einfache lineare Regression
Das Modell
Anwenden des Gradientenverfahrens
Maximum-Likelihood-Methode
Weiterführendes Material
Kapitel 15: Multiple Regression
Das Modell
Weitere Annahmen bei der Methode der kleinsten Quadrate
Anpassen des Modells
Interpretation des Modells
Anpassungsgüte
Exkurs: Bootstrapping
Standardfehler von Regressionskoeffizienten
Regularisierung
Weiterführendes Material
Kapitel 16: Logistische Regression
Die Aufgabe
Die logistische Funktion
Anwendung des Modells
Anpassungsgüte
Support Vector Machines
Weiterführendes Material
Kapitel 17: Entscheidungsbäume
Was ist ein Entscheidungsbaum?
Entropie
Die Entropie einer Partition
Einen Entscheidungsbaum erzeugen
Verallgemeinerung des Verfahrens
Random Forests
Weiterführendes Material
Kapitel 18: Neuronale Netzwerke
Perzeptrons
Feed-forward-Netze
Backpropagation
Beispiel: Bezwingen eines CAPTCHA
Weiterführendes Material
Kapitel 19: Clustering
Die Idee
Das Modell
Beispiel: Meetups
Die Auswahl von k
Beispiel: Clustern von Farben
Agglomeratives hierarchisches Clustering
Weiterführendes Material
Kapitel 20: Linguistische Datenverarbeitung
Wortwolken
N-Gramm-Modelle
Grammatiken
Exkurs: Gibbs-Sampling
Themenmodellierung
Weiterführendes Material
Kapitel 21: Graphenanalyse
Betweenness-Zentralität
Eigenvektor-Zentralität
Gerichtete Graphen und PageRank
Weiterführendes Material
Kapitel 22: Empfehlungssysteme
Manuelle Pflege
Empfehlen, was beliebt ist
Nutzerbasiertes kollaboratives Filtern
Gegenstandsbasiertes kollaboratives Filtern
Weiterführendes Material
Kapitel 23: Datenbanken und SQL
CREATE TABLE und INSERT
UPDATE
DELETE
SELECT
GROUP BY
ORDER BY
JOIN
Subqueries
Indexstrukturen
Optimierung von Anfragen
NoSQL
Weiterführendes Material
Kapitel 24: MapReduce
Beispiel: Wörter zählen
Warum MapReduce?
MapReduce verallgemeinert
Beispiel: Statusmeldungen analysieren
Beispiel: Matrizenmultiplikation
Eine Randbemerkung: Combiners
Weiterführendes Material
Kapitel 25: Gehet hin und praktizieret Data Science
IPython
Mathematik
Nicht bei null starten
Finden Sie Daten
Data Science in der Praxis
Index
Über den Autor
Über den Übersetzer
Kolophon
← Prev
Back
Next →
← Prev
Back
Next →