Automatisk kontroll av marine data

Ngoc Thanh Nguyen disputerer 20. oktober for ph.d.-graden ved Høgskulen på Vestlandet med avhandlingen «Engineering of Software for Automatic Marine Data Quality Control».

Avhandlinga i Nasjonalt vitenarkiv

Havet er avgjørende for menneskeheten – det regulerer klimaet, opprettholder liv og gir mat og økonomiske ressurser. Å beskytte havet står sentralt i FNs bærekraftsmål 14: «Bevare og bruke hav og marine ressurser på en bærekraftig måte». 

Data av høy kvalitet er kritisk for gode beslutningsprosesser, men marinedata er ofte utsatt for feil som følge av sensorer som svikter, begroing, miljøforstyrrelser, kommunikasjonsproblemer og menneskelige feil. Slike utfordringer undergraver datakvaliteten og dermed beslutningene som bygger på dem. 

Hvorfor automatisk datakontroll  

I dag utføres kvalitetskontroll av marinedata hovedsakelig av erfarne fagfolk. Prosessen er tidkrevende, kostbar og ofte subjektiv. Diskusjoner i SFI Smart Ocean-prosjektet har fremhevet automatisk datakontroll som en kritisk funksjon i Smart Ocean-systemet – et stasjonært, trådløst observatorium utviklet for å legge til rette for bærekraftig og lønnsom bruk av havet. 

Dette doktorgradsprosjektet utvikler KI-baserte programvareløsninger for å automatisere kvalitetskontrollen av tidsseriedata fra havet. Løsningene er ikke bare sentrale i Smart Ocean-systemet, men også relevante for industrielle partnere og samarbeidspartnere som ønsker effektiv og pålitelig datakontroll. 

Industrielle anvendelser 

Forskningen har fulgt Design Science-paradigmet, med vekt på å utvikle løsninger med høy praktisk verdi. Innsikten bygger på intervjuer med 17 praktikere og forskere i Smart Ocean-prosjektet, samt 28 IT-profesjonelle med interesse for bærekraft. 

To systemer er utviklet: 

  • AdapAD – oppdager avvik i envariabel tidsseriedata. Systemet er allerede integrert i Smart Ocean-plattformen og vurderes nå for kommersiell bruk i en datalogger utviklet av Aanderaa Data Instruments AS. 
  • MuMSAD – et AutoML-rammeverk som oppdager multivariable avvik og identifiserer årsakene til dem. MuMSAD er introdusert hos Reach Subsea som et mulig verktøy for automatisk kvalitetskontroll av undervannssensorer. 

Prosjektet har også bidratt med retningslinjer for effektiv kravinnhenting til data og en veikart for å forbedre gjenbruk av marinedata – en verdifull ressurs som er kostbar å samle inn. Andre samarbeidspartnere har vist interesse for å bruke løsningene i bredere sammenhenger, inkludert overvåking av kyber-fysiske systemer og samfunnssikkerhet. 

Personalia

Ngoc Thanh Nguyen (f. 1993) har en bachelorgrad i matematikk og informatikk og en mastergrad i informatikk fra Vietnam National University i Ho Chi Minh-byen, Vietnam. Før doktorgradsstipendet arbeidet han seks år i bil- og fintech-industrien. Under doktorgraden har han bidratt i SFI Smart Ocean-prosjektet og hatt forskningsopphold ved Gran Sasso Science Institute, Italia, og Université Paris Cité, Frankrike. Etter disputasen starter han i stilling som Software Engineer II hos Microsoft i Vietnam. 

Prøveforelesning

Tid: mandag 20. oktober, klokka 10.15.
Sted: HVL, campus Bergen, K2, rom M005
Tema: Data Quality for Cleaning and Validating Large Datasets: Methods and Limitations.

Disputas

Tid: mandag 20. oktober, klokka 13.15.
Sted: HVL, campus Bergen, K2, rom M005

Disputasleder

Dekan Jens Kristian Fosse.

Lenke til strømming (Zoom).

Veiledere

  • Professor Rogardt Heldal, HVL (hovedveileder)
  • Professor Patrizio Pelliccione, Gran Sasso Science Institute, Italia (biveileder)
  • Professor Lars Michael Kristensen, HVL (biveileder)

Bedømmelseskomité

  • Førsteamanuensis Mojtaba Yousefi, HVL (komitéleder)
  • Sjefsforsker Dusica Marijan, SIMULA, Norge (førsteopponent)
  • Førsteamanuensis Fabio Palomba, Universitetet i Salerno, Italia (andreopponent)