Hva om en AI kunne forstå hva de som ringer inn til kundeservice snakker om, og automatisk hente frem relevant informasjon på skjermen slik at kunden får raskere hjelp?
Det er nettopp det Tet Digital, IT-selskapet som er spunnet ut av Ruter, håper de skal få til snart. Mye takket være innsatsen fra fire sommerstudenter som har blitt håndplukket fra en bunke på rundt 170 søkere.
I forbindelse med Tets årlige "AI Summer Lab" har de fire studentene fått jobbe med utviklingen av AI-modeller spesielt laget for å takle tale – på norsk. Når modellen er ferdig, er planen å lansere den som åpen kildekode slik at også andre enn Ruter kan få glede av den.
Umair Mehmood Imam er leder for Tet Digitals Data, Insights and AI-avdeling. Han forteller til kode24 at mens "alle" de siste par årene har snakket om store språkmodeller, så var det i starten mest fokus på tekst – og senere bilder.
– Vi har brukt mye tekst og bilde AI og ønsker nå å jobbe med lydbasert AI, sier han.
Tet-Whisper
Imam forteller at de i fjor høst lanserte RuterGPT, som var en språkmodell trent på norske reise- og transportdata. AI-modellen de nå trener opp på lyd er en fortsettelse av dette, og har fått arbeidsnavnet Tet-Whisper.
Ruters kundeservice mottar i dag henvendelser fra kunder på mange ulike måter.
Henvendelsene de får skriftlig kan de bruke til å få bedre kundeinnsikt blant annet ved hjelp av AI. Men når noen ringer inn – og kanskje er sinte eller irriterte og snakker fort – rekker ikke kundeservice å skrive ned alt som blir sagt. I stedet må de nøye seg med å oppsummere kort.
Det betyr at mye informasjon som kunne blitt brukt til å gjøre AI-en bedre til å forstå, og gi bedre innsikt, går tapt.
– Vi vil ha en AI-modell som automatisk kan transkribere det folk snakker om, og gjøre det om til tekst, forklarer Umair.
Personen som håndterer den aktuelle saken på kundeservice kan så godkjenne teksten, som deretter kan brukes til å trene en AI.
Tet Digital har allerede en slik løsning for tekst, det som er nytt er at de ønsker å gjøre det samme med tale.
Umair understreker at de foreløpig venter på tilbakemelding fra sitt juridiske team på hvorvidt de kan bruke tale fra kundeservice til å trene AI. Før de får det bruker de åpne datasett.
Tet-Whisper er en modell videretrent på OpenAIs Whisper-modeller, og bygger videre på NB-Whisper fra Nasjonalbiblioteket.
– Nå beriker vi Whisper med mer lyddata.
Høyt ambisjonsnivå
Umair Imam sier at AI summer-laben til Tet Digital er en slags innovasjonslab som de kjører hver sommer, og at målet er å finne prosjekter med reell nytteverdi og la studentene jobbe med prosjekter deres AI-utviklingsteam ikke har tid til ellers.
Alexander Amiri er tech lead for AI-laben og sier at de pleier å sette lista ganske høyt for hva studentene skal løse, og at de gir studentene stor frihet. Samtidig har studentene mulighet til å få hjelp fra Tet Digitals AI-utviklingsteam ved behov.
– Vi har et større ML-miljø som også har bidratt, sier Amiri.
«Det gjør det veldig gøy at man klarer å finne ut av ting som virker veldig vanskelig.»
Julie Nomeland er av av studentene som har jobbet med prosjektet. Hun har nettopp blitt ferdig med en bachelor i robotikk ved UiO, og forteller at hun først ble litt satt ut av det høye ambisjonsnivået og vanskelighetsgraden i det de skulle løse.
– Jeg tenkte, jeg vet ikke om jeg klarer dette! Men så setter man igang, man er mange hjerner som jobber sammen og hjelper hverandre. Det er veldig gøy at man klarer å finne ut av ting som i starten virker veldig vanskelig, sier Nomeland.
Medstudente Benedict Leander Skålevik Parton og Mads Saua Balto kan også fortelle om et svært lærerikt og spennende – men vanskelig prosjekt.
Det å sammen som et team kunne klare å finne ut av ting som virker vanskelig og kanskje uoverkommelig – og som man ikke kan fra før – har vært nyttig, slår de fast.
– Det er betryggende å se at man ikke trenger å kunne alt fra før når man går inn i en ny jobb, sier Skålevik Parton.
Han sier han har fått mye kunnskap om ting de ikke nødvendigvis lærer på universitetet – som det å jobbe med å utvikle et større prosjekt over tid.
Python og AWS
Tech lead Alexander Amiri forteller at det for studentene går mye i Python-programmering.
Studentene koder lokalt med VS Code og bruker Gitlab til versjonskontroll. I tillegg brukes i stor grad AWS som skytjeneste – med servere i Europa.
– Vi har satt opp Amazon Sagemaker Studio hvor vi har en notebook kjørende med noen kraftige instanser der studentene kan teste modellene, sier Amiri.
Balto synes det har vært veldig interessant å få jobbe med skytjenester.
– Og så føles det godt å jobbe med et produkt som er til hele Oslo. Det er motiverende, sier Balto.
– Norge kan konkurrere med resten av vedrden
Umair Mehmood Imam sier det Tet Digital – og sommerstudentene – jobber med er "cutting edge"-teknologi.
– Vi jobber med maskinlæring, generativ AI, lanserte vår egen LLM, audio-AI, image-AI, kvantedatamaskiner, sanntids dataprosessering og mye mer. Det er ikke så mange selskaper i Skandinavia som får muligheten til å jobbe med så mange nye teknologier, sier Imam.
Han sier de har ekte bruksområder for teknologien de utvikler – og bruker det til noe nyttig. Samtidig oppfordrer han også andre i Norge til å satse på ambisiøse AI-prosjekter.
«Norge er i en veldig god posisjon til å spille en viktig rolle når det kommer til AI og til å kunne konkurrere med resten av verden.»
– Mange sier at Norge er så lite, og at vi ikke har kapasitet. Men de tenker ikke på at det finnes massevis av talent i Norge.
Ifølge Imam har Norge verken et ressursproblem eller et problem med at det finnes for få talenter.
– Det er mange mennesker som vil jobbe med spennende prosjekter. Vi har bare et problem med å komme ut med disse prosjektene.
– Norge er i en veldig god posisjon til å spille en viktig rolle når det kommer til AI og til å kunne konkurrere med resten av verden, avslutter Imam.