Aurora Grefsrud disputerer

Aurora Grefsrud disputerer for doktorgraden ved Høgskulen på Vestlandet 8. juni med avhandlingen "Probablistic machine learning classification for high energy physics".

Maskinlæring og kunstig intelligens spiller en stadig større rolle i moderne forskning – også innen fysikk.

I sin doktorgradsavhandling undersøker Aurora Grefsrud hvordan dyplæring kan brukes for å forbedre analysen av høyenergifysikk-data fra partikkelakseleratoren Large Hadron Collider (LHC) ved CERN.

I høyenergifysikk forsker man på noen av de største mysteriene i universet ved å gjøre ekstremt presise eksperimenter der man måler egenskapene til de aller minste partiklene vi vet om. Maskinlæringsmetoder er ikke alltid de mest presise analyseverktøyene, og det er akkurat spørsmålet om hvordan man kan bruke dem på en trygg måte innen høyenergifysikk som er hovedfokuset i Grefsrud sin avhandling.

Dyplæring møter fysikk

I dyplæring bruker man såkalte kunstige nevrale nettverk til å finne mønstre i store og komplekse datasett. Metodene har gitt lovende resultater innen mange fagfelt, men for fysikere kan det være vanskelig å forene maskinlæringsmetoder med tradisjonell forskningsmetodikk.

Mange avanserte maskinlæringsmodeller brukes som «svarte bokser», der forskerne ikke fullt ut forstår hvordan modellene kommer frem til resultatene sine. Det passer dårlig med fysikkfagets krav til forståelse og teoretisk forankring. I avhandlingen presenteres to studier der Grefsrud undersøker hvordan man kan bruke metoder fra datateknologi, statistikk og fysikk til å bedre forstå og utvikle dyplæringsmodeller for vitenskapelig bruk.

I den første studien demonstreres det hvordan moderne dyplæringsmetoder kan brukes til å skille mellom ulike hypotetiske nye fysikkprosesser i kollisjonsdata fra ATLAS-eksperimentet ved LHC. Ved å bygge inn fysikkbasert forhåndskunnskap i modellene, forbedres klassifiseringsresultatene betydelig sammenlignet med eksisterende metoder. Studien viser også hvordan fysikere kan bruke de trente modellene direkte i analyser for å teste og utelukke vitenskapelige hypoteser.

Hvor sikker er egentlig modellen?

I den andre studien undersøkes og sammenlignes ulike metoder for å estimere usikkerhet i maskinlæringsmodeller. Pålitelig usikkerhetsestimering er avgjørende i vitenskapelig forskning. Ved å kombinere bayesiansk statistikk med probabilistisk maskinlæring demonstrerer Grefsrud hvordan man kan utvikle verktøy for å evaluere hvor pålitelige modellene faktisk er.

Resultatene avdekker flere viktige svakheter ved noen av de populære metodene som brukes innen fagmiljøet og viser at robust usikkerhetsestimering fortsatt er et uløst problem innen dyplæring.

Samlet sett bidrar arbeidet Grefsrud har gjort i løpet av sitt doktorgradsprosjekt til å styrke både det eksperimentelle og teoretiske grunnlaget som er nødvendig for å bruke dyplæring i fysikk. Gjennom forskning som tør å rette et kritisk blikk mot etablert metodikk, legger hun til rette for en mer forsvarlig bruk av maskinlæring for søk etter nye fysikkfenomener i fremtidens eksperimenter ved LHC.

Arbeidet er også nyttig i en bredere kontekst. I en tid der dyplæring blir en viktigere og større del av de aller fleste forskningsfelt, bidrar Grefsrud til å fjerne noe av mystikken rundt disse populære maskinlæringsmetodene og gir forskere verktøy til å utfordre både modellenes prediksjoner og sine egne antagelser.

Bilde av Aurora Grefsrud.

Personalia

Aurora Grefsrud er utdannet sivilingeniør med spesialisering i teknisk fysikk fra Norges teknisk-naturvitenskapelige Universitet (NTNU) hvor hun skrev mastergrad om analysering av kosmologiske datasimuleringer. Hun har gjennomført sitt doktorgradsarbeid ved HVL sitt doktorgradsprogram “Datateknologi: programvareutvikling, sensornettverk og beregningsorientert ingeniørvitenskap”.

I stipendiatperioden har hun undervist i matematikk ved Sjøkrigsskolen. Arbeidet hennes har vært tett knyttet til ATLAS-eksperimentet ved CERN. Hun jobber nå ved CERN for ATLAS-eksperimentet som eksperimentell fysiker med fokus på implementering av maskinlæringsalgoritmer i triggersystemet til detektoren. Grefsrud er spesielt interessert i å bidra til mer tverrfaglig forskning innen datateknologi, fysikk og statistikk.

Prøveforelesning

Tid: Mandag 8.juni kl. 10.15
Sted: HVL, campus Bergen, K2, rom M004
Tema for prøveforelesning: Interval estimation in the age of Machine Learning: From classical statistics to deep learning.

Disputas

Tid: Mandag 8. juni kl. 13.15
Sted: HVL, campus Bergen, K2, rom M004

Disputasleder

Assisterende instituttleder Pål Ellingsen

Bedømmelseskomité

Komitéleder: Professor Carina Bringedal, HVL
Førsteopponent: First Researcher Tommaso Dorigo, Italian Institute for Nuclear Physics.
Andreopponent: Senior Researcher Thea Klæbo Aarrestad, ETH Zürich

Veiledere

Førsteamanuensis Therese Sjursen (HVL)
Førsteamanuensis Trygve Buanes (HVL)
Professor Anna Lipniacka (UiB)

Endra 27.05.26