Hopp til innhald

DAT803 Data engineering: fra teori til praksis

Emneplan for studieåret 2025/2026

Innhold og oppbygning

Kurset krever forkunnskaper i programmering i Python, DAT800 eller tilsvarende.

Kurset "Dataingeniørkunst: Fra Teori til praksis " adresserer et økende behov blant ingeniører på tvers av ulike disipliner for å kunne håndtere og utnytte data i tekniske løsninger. Med den raske utviklingen innen digitalisering og økt datainnsamling i bransjer som energi, og Logistikk, er det et klart behov for kompetanse i datarensing, visualisering, analyse og forberedelse av data for maskinlæring. Deltakerne vil lære å bruke Python for praktiske oppgaver som feature engineering, tidsserieanalyse og håndtering av ubalanserte datasett, samt hvordan man optimaliserer datakvaliteten for å bygge pålitelige modeller. Kurset er utformet for å møte behovet hos ingeniører som ønsker å anvende data for å skape bedre tekniske løsninger og informerte beslutninger i sine respektive fagområder.

Programmeringsspråket som blir brukt i kurset er Python.

Læringsutbytte

Etter å ha gjennomført dette emnet har studenten følgende læringsutbytte, definert som kunnskap, ferdigheter og generell kompetanse:

Kunnskap

Etter fullført kurs skal deltakerne kunne:

  • Forstå og forklare grunnleggende dataingeniørkonsepter og deres rolle i datavarehusets livssyklus
  • Forklare betydningen av datakvalitet og ulike dataprosesseringsmetoder
  • Identifisere og løse virkelige dataproblemer innen bransjer som energi, finans og helse, ved å anvende dataingeniørkunst til reelle caser.

Ferdigheter

Etter kurset vil deltakerne ha følgende ferdigheter:

Tekniske ferdigheter:

  • Anvende teknikker for datainnsamling, visualisering og statistisk analyse, inkludert tid-serieanalyse og datarensing.
  • Bruke feature engineering-teknikker som filtrering og signalbehandling for å forbedre datakvalitet

Analytiske ferdigheter:

  • Analysere og tolke komplekse datasett, håndtere utfordringer som ubalansert data og dataskalering.
  • Forberede datasett for maskinlæring ved å dele, skalere og renske data.

•Bygge enkle prediktive modeller og evaluere ytelsen deres

Praktiske ferdigheter:

  • Implementere løsninger på virkelige dataproblemer innen bransjer som energi, finans og helse.
  • Bruke verktøy som Python eller R for å utføre dataanalyse og feature engineering.

Generell kompetanse

Etter fullført kurs skal deltakerne kunne:

  • Løse virkelige dataproblemer i bransjer som energi, finans og helsevedlikehold
  • Ta informerte beslutninger om dataprosessering og forberedelsesstrategier
  • Vurdere og velge passende verktøy og teknikker for spesifikke datautfordringer
  • Arbeide systematisk med datakvalitet og forberedelse for maskinlæringsprosjekter

Krav til forkunnskaper

Grunnleggende programmering med Python, DAT800 eller tilsvarende.

Undervisnings- og læringsformer

Læringsformen er en kombinasjon av forelesninger og øvinger.

Emnet er nett- og samlingsbasert, med tre fysiske samlinger.

Mellom samlingene er det lagt opp til selvstudium / asynkron undervisning, hvor du får tilgang til alle læringsressurser digitalt, inklusive videoforelesninger.

Veiledning mellom samlingene, i forbindelse med øvingsoppgaver og obligatoriske innleveringer tilbys via nett, til faste oppsatte tider hver uke.

Obligatorisk læringsaktivitet

To obligatoriske innleveringer. Gjennom innleveringsoppgavene vil studenten utvikle data engineeringsferdigheter og oppnå en forståelse for predictive modeling.

Innleveringene må være godkjent for å kunne avlegge eksamen i emnet.

Godkjente innleveringer gir også adgang til eventuell utsatt eksamen påfølgende semester. Ved utsatt og ny eksamen neste gang emnet undervises, må nye øvelser leveres.

Vurderingsform

Prosjektoppgave som utføres og leveres i gruppe eller individuelt (teller 100%).

Karakterskala: bestått/ikke bestått

Hjelpemidler ved eksamen

Alle hjelpemidler er tillatt. For informasjon om bruk av kunstig intelligens, se Innlevering av heimeeksamen og oppgåver - Høgskulen på Vestlandet

Mer om hjelpemidler