Notebooks für das Buch Machine Learning - kurz & gut

Notebooks für das Buch Machine Learning - kurz & gut: https://dpunkt.de/produkt/machine-learning-kurz-gut-2/

Du kannst dieses Repository entweder clonen und die Notebooks bei dir lokal ausführen oder diese mit den Colab Links direkt auf Google Colab (https://colab.research.google.com/) ausführen:

Abhängigkeiten für lokale Nutzung installieren

virtuelles Environment erzeugen: python3 -m venv .venv
Environment aktivieren source .venv/bin/activate
Abhängigkeiten installieren pip install -r requirements.txt
- Enthält nicht die Abhängigkeiten für Kapitel 9, dies läuft ohne weiteres nur auf Colab

Direkte Links auf Colab-Notebooks (aktualisiert auf neuste Versionen und lauffähig auf Colab November 2023)

Kapitel 2 (Quick-Start): https://colab.research.google.com/github/djcordhose/buch-machine-learning-notebooks/blob/master/kap2.ipynb
Kapitel 3 (Datenimport und -vorbereitung): https://colab.research.google.com/github/djcordhose/buch-machine-learning-notebooks/blob/master/kap3.ipynb
Kapitel 4 (Supervised Learning): https://colab.research.google.com/github/djcordhose/buch-machine-learning-notebooks/blob/master/kap4.ipynb
Kapitel 5 (Feature-Auswahl): https://colab.research.google.com/github/djcordhose/buch-machine-learning-notebooks/blob/master/kap5.ipynb
Kapitel 6 (Modellvalidierung): https://colab.research.google.com/github/djcordhose/buch-machine-learning-notebooks/blob/master/kap6.ipynb
Kapitel 7 (Neuronale Netze und Deep Learning):
- https://colab.research.google.com/github/djcordhose/buch-machine-learning-notebooks/blob/master/kap7-iris.ipynb
- https://colab.research.google.com/github/djcordhose/buch-machine-learning-notebooks/blob/master/kap7-cnn.ipynb
Kapitel 8 (Unsupervised Learning mit Autoencodern): https://colab.research.google.com/github/djcordhose/buch-machine-learning-notebooks/blob/master/kap8.ipynb
Kapitel 9 (Deep Reinforcement Learning): https://colab.research.google.com/github/djcordhose/buch-machine-learning-notebooks/blob/master/kap9.ipynb (funktioniert ohne weiteres nur auf Colab)
Kapitel 10 (Moderne Sprachmodelle):
Kapitel 11 (MLOps - Machine Learning im Betrieb):
- https://colab.research.google.com/github/djcordhose/buch-machine-learning-notebooks/blob/master/kap11-train.ipynb
- https://colab.research.google.com/github/djcordhose/buch-machine-learning-notebooks/blob/master/kap11-drift.ipynb

Änderungen zur Auflage 1

Kapitel 4: Abbruchsbedingungen für SGDRegressor sind in aktuellen Sklearn-Versionen verändert, der Code ist daraufhin angepasst
Kapitel 7: migriert auf die aktuellste TensorFlow- und Keras-Version
Kapitel 8: neu in Auflage 2
Kapitel 9: neu in Auflage 2

Errata Auflage 2 (bereits korrigiert im ersten Nachdruck)

Kapitel 6
- 118: Sensitivity müsste tp / (tp+fn) sein (Dank an Stefan Ollinger)
- 119 in den Gleichungen: "Mean Squared Error" sollte "Mean Absolute Error" und "Mean Absolute Error" sollte "Median Absolute Error" sein (Dank an Stefan Ollinger)
Kapitel 7
- 138 im Listing unten: Model Parameter "inputs" und "outputs" (Dank an Stefan Ollinger)

Errata Auflage 2 (bereits korrigiert im zweiten Nachdruck)

Kapitel 4
- 77 oben: die Ebenen 4 und 5 werden nicht in der Abbildung 4-29 und 4-30, sondern in 4-30 und 4-31 gezeigt
- 79 oben: die maximale Anzahl der Ebenen ist hier nicht 5, sondern 2, wie auch richtig im Plot 4-32 dargestellt

Zusätzliche Erklärungen zu Auflage 2

Erklärung zu Abbildung 6-1 und 6-2 (bereits hinzugefügt im ersten Nachdruck)

Precision-Recall- und ROC-Kurven sind gute Indikatoren fuer das Potential deines Modells. Wie du sicherlich schon erkannt hast muss man immer einen Kompromiss zwischen verschiedenen Metriken machen, die man optimieren will. In unserem Beispiel erkauft man sich eine sehr hohe True-Positive-Rate (tpr) auch mit einer relativ hohen False-Positiv-Rate (fpr).

Um die entsprechenden Metriken für deine jeweilige Anwendung zu optimieren, solltest du zunaechst den Arbeitspunkt (z.B. welchen gewünschten tpr-fpr-Punkt aus der ROC-Kurve) anhand der Performance-Kurven (6-1 und 6-2) definieren. Dementsprechend kannst du dann den Schwellenwert für den Ausgabe-Score (y_score) deines Modells anpassen.

Sehr praktische Tools dafuer gibt es in z. B. auch in Sklearn:

fpr, tpr, thresholds = sklearn.metrics.roc_curve(y_true, y_scores)
precision, recall, thresholds = sklearn.metrics.precision_recall_curve(y_true, y_scores)

Änderungen zur Auflage 2

Kapitel 10: neu in Auflage 3
Kapitel 11: neu in Auflage 3

Errata Auflage 3 (vielen Dank an https://github.com/chandlerNick)

Kapitel 4
- 75: "C ist umgekehrt proportional zu \lambda: C ~ 1/\lambda" soll "C ist umgekehrt proportional zu \lambda: C \propto 1/\lambda" sein.
Kapitel 6
- 123: In der Tabelle soll "tc Anzahl der Beispiele mit dem Label versicolor und die vom Modell richtig als versicolor vorausgesagt wurden." sein.
Kapitel 7
- 143: "w_0 + w_1 \cdot x_1 + w_2 \cdot x_2" ist keine mathematische Gleichung sondern ein mathematischer Ausdruck. "w_0 + w_1 \cdot x_1 + w_2 \cdot x_2 = 0" ist eine mathematische Gleichung.
- 162: Es soll: "Abbildung 7-14: Verlauf der Accuracy der Trainingsdaten" sein. Jetzt sagt es, "Verlauf der Accuracy der Testdaten".
- 166: Man soll nicht die Accuracy der Testdaten während Training kalkulieren. Daher ist "Zuerst schauen wir uns die Kurve für die Accuracy der Trainingsdaten in Abbildung 7-16." gemeint. Außerdem soll die Bildunterschrift wahrscheinlich: "Verlauf der Accuracy der Trainingsdaten bei dem kompletten Datensatz" sein.

Name		Name	Last commit message	Last commit date
Latest commit History 71 Commits
data		data
LICENSE		LICENSE
README.md		README.md
classifier-binary.keras		classifier-binary.keras
iris_cleaned.csv		iris_cleaned.csv
iris_dirty.csv		iris_dirty.csv
kap10-bert-fine-tuning.ipynb		kap10-bert-fine-tuning.ipynb
kap10-bert-tasks.ipynb		kap10-bert-tasks.ipynb
kap10-embeddings.ipynb		kap10-embeddings.ipynb
kap10-function-calling.ipynb		kap10-function-calling.ipynb
kap10-openai-api.ipynb		kap10-openai-api.ipynb
kap11-drift.ipynb		kap11-drift.ipynb
kap11-train.ipynb		kap11-train.ipynb
kap2.ipynb		kap2.ipynb
kap3.ipynb		kap3.ipynb
kap4.ipynb		kap4.ipynb
kap5.ipynb		kap5.ipynb
kap6.ipynb		kap6.ipynb
kap7-cnn.ipynb		kap7-cnn.ipynb
kap7-iris.ipynb		kap7-iris.ipynb
kap8.ipynb		kap8.ipynb
kap9.ipynb		kap9.ipynb
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Notebooks für das Buch Machine Learning - kurz & gut

Abhängigkeiten für lokale Nutzung installieren

Direkte Links auf Colab-Notebooks (aktualisiert auf neuste Versionen und lauffähig auf Colab November 2023)

Änderungen zur Auflage 1

Errata Auflage 2 (bereits korrigiert im ersten Nachdruck)

Errata Auflage 2 (bereits korrigiert im zweiten Nachdruck)

Zusätzliche Erklärungen zu Auflage 2

Erklärung zu Abbildung 6-1 und 6-2 (bereits hinzugefügt im ersten Nachdruck)

Änderungen zur Auflage 2

Errata Auflage 3 (vielen Dank an https://github.com/chandlerNick)

About

Uh oh!

Releases

Packages

Contributors 3

Uh oh!

Languages

License

DJCordhose/buch-machine-learning-notebooks

Folders and files

Latest commit

History

Repository files navigation

Notebooks für das Buch Machine Learning - kurz & gut

Abhängigkeiten für lokale Nutzung installieren

Direkte Links auf Colab-Notebooks (aktualisiert auf neuste Versionen und lauffähig auf Colab November 2023)

Änderungen zur Auflage 1

Errata Auflage 2 (bereits korrigiert im ersten Nachdruck)

Errata Auflage 2 (bereits korrigiert im zweiten Nachdruck)

Zusätzliche Erklärungen zu Auflage 2

Erklärung zu Abbildung 6-1 und 6-2 (bereits hinzugefügt im ersten Nachdruck)

Änderungen zur Auflage 2

Errata Auflage 3 (vielen Dank an https://github.com/chandlerNick)

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Contributors 3

Uh oh!

Languages

Packages