DAT803 Data engineering: fra teori til praksis
Emneplan for studieåret 2025/2026
Innhold og oppbygning
Kurset krever forkunnskaper i programmering i Python, DAT800 eller tilsvarende.
Kurset "Dataingeniørkunst: Fra Teori til praksis " adresserer et økende behov blant ingeniører på tvers av ulike disipliner for å kunne håndtere og utnytte data i tekniske løsninger. Med den raske utviklingen innen digitalisering og økt datainnsamling i bransjer som energi, og Logistikk, er det et klart behov for kompetanse i datarensing, visualisering, analyse og forberedelse av data for maskinlæring. Deltakerne vil lære å bruke Python for praktiske oppgaver som feature engineering, tidsserieanalyse og håndtering av ubalanserte datasett, samt hvordan man optimaliserer datakvaliteten for å bygge pålitelige modeller. Kurset er utformet for å møte behovet hos ingeniører som ønsker å anvende data for å skape bedre tekniske løsninger og informerte beslutninger i sine respektive fagområder.
Programmeringsspråket som blir brukt i kurset er Python.
Læringsutbytte
Etter å ha gjennomført dette emnet har studenten følgende læringsutbytte, definert som kunnskap, ferdigheter og generell kompetanse:
Kunnskap
Etter fullført kurs skal deltakerne kunne:
- Forstå og forklare grunnleggende dataingeniørkonsepter og deres rolle i datavarehusets livssyklus
- Forklare betydningen av datakvalitet og ulike dataprosesseringsmetoder
- Identifisere og løse virkelige dataproblemer innen bransjer som energi, finans og helse, ved å anvende dataingeniørkunst til reelle caser.
Ferdigheter
Etter kurset vil deltakerne ha følgende ferdigheter:
Tekniske ferdigheter:
- Anvende teknikker for datainnsamling, visualisering og statistisk analyse, inkludert tid-serieanalyse og datarensing.
- Bruke feature engineering-teknikker som filtrering og signalbehandling for å forbedre datakvalitet
Analytiske ferdigheter:
- Analysere og tolke komplekse datasett, håndtere utfordringer som ubalansert data og dataskalering.
- Forberede datasett for maskinlæring ved å dele, skalere og renske data.
•Bygge enkle prediktive modeller og evaluere ytelsen deres
Praktiske ferdigheter:
- Implementere løsninger på virkelige dataproblemer innen bransjer som energi, finans og helse.
- Bruke verktøy som Python eller R for å utføre dataanalyse og feature engineering.
Generell kompetanse
Etter fullført kurs skal deltakerne kunne:
- Løse virkelige dataproblemer i bransjer som energi, finans og helsevedlikehold
- Ta informerte beslutninger om dataprosessering og forberedelsesstrategier
- Vurdere og velge passende verktøy og teknikker for spesifikke datautfordringer
- Arbeide systematisk med datakvalitet og forberedelse for maskinlæringsprosjekter
Krav til forkunnskaper
Grunnleggende programmering med Python, DAT800 eller tilsvarende.
Undervisnings- og læringsformer
Læringsformen er en kombinasjon av forelesninger og øvinger.
Emnet er nett- og samlingsbasert, med tre fysiske samlinger.
Mellom samlingene er det lagt opp til selvstudium / asynkron undervisning, hvor du får tilgang til alle læringsressurser digitalt, inklusive videoforelesninger.
Veiledning mellom samlingene, i forbindelse med øvingsoppgaver og obligatoriske innleveringer tilbys via nett, til faste oppsatte tider hver uke.
Obligatorisk læringsaktivitet
To obligatoriske innleveringer. Gjennom innleveringsoppgavene vil studenten utvikle data engineeringsferdigheter og oppnå en forståelse for predictive modeling.
Innleveringene må være godkjent for å kunne avlegge eksamen i emnet.
Godkjente innleveringer gir også adgang til eventuell utsatt eksamen påfølgende semester. Ved utsatt og ny eksamen neste gang emnet undervises, må nye øvelser leveres.
Vurderingsform
Prosjektoppgave som utføres og leveres i gruppe eller individuelt (teller 100%).
Karakterskala: bestått/ikke bestått
Hjelpemidler ved eksamen
Alle hjelpemidler er tillatt. For informasjon om bruk av kunstig intelligens, se Innlevering av heimeeksamen og oppgåver - Høgskulen på Vestlandet
Mer om hjelpemidler