Demo kode som viser klassiske metoder for regresjon og klassifisering, med oppgaver for kurset i maskinlæring. Kurset går over to dager og denne versjonen var holdt høst 2024 og igjen høst 2025.
Dag 1 (2,5 timer):
Vi skal demonstrere med data alle hovedstegene for å gjennomføre maskinlæring på en enkelt måte: deling av data i trenings- og testsetter, bygging av en modell fra treningsdata, testing ytelsen på testdata, og predikering. Vi skal bruke eksempler av både kategoriske or numeriske prediksjonsvariabler. Vi skal også nevne tolkning av resultatene. Til slutt skal vi vise gjennom de oppgavene hvordan valget av parameterne påvirker algoritmer og hvordan kryssvalidering kan gjøres i Sklearn for å velge det beste valget av parametere.
Dag 2 (3 timer):
Vi skal begynne med å gjennomgå begrepene fra forrige uke med et par oppgaver. Deretter skal vi bygge videre med å vise flere nyttige steger for å gjennomføre maskinlæring. Vi skal først vise funksjoner i Sklearn for å lagre variabler, for eksempel hvordan vi kan lage kategoriske variabler eller imputerer manglende verdier. Så skal vi vise Pipelines funksjonalitet som gjør det enkelt og gjennomsiktig å kjøre flere maskinlæringssteg riktig. Til slutt skal vi gi deltakerne en generisk malfil med ulike funksjoner innbygd som kan brukes for å lage egen arbeidsflyter selv med minimal innsats. Deltakerne skal bruke mesteparten av øvelsen for å kjøre eksempler og jobbe på oppgaver selv, som siste gangen.