ANNONSØRINNHOLD

📸 Tommi Larsen fra Tietoevry Industry er lei av dårlig datakvalitet.
📸 Tommi Larsen fra Tietoevry Industry er lei av dårlig datakvalitet. Vis mer

Garbage in, garbage out – slik finner du kvalitetsdata

Uansett hvor mye tid du bruker på å finpusse koden din, er det umulig å lage gode AI-tjenester uten et solid datagrunnlag. Kan en søkbar datakatalog basert på metadata være løsningen?

Har du noen gang brukt flere timer på å forstå hva en datafil faktisk inneholder, bare fordi variabelnavnene er ulike på tvers av kilder? Eller prøvd å skaffe nok treningsdata til en AI-modell, bare for å møte veggen fordi ingen vet om det er lov å bruke dataene? Da er du ikke alene.

– Dårlig datakvalitet skaper mange utfordringer. Det gir ikke bare svakere AI-løsninger, men øker også risikoen for bias, fordi modellene kun trenes på interne data. Garbage in, garbage out.

Det sier Tommi Larsen, ansvarlig for utviklingen av Datakatalogen og Markedsplassen hos Tietoevry Industry – to løsninger som gjør det enkelt å finne, forstå, bruke og kjøpe kvalitetsdata på tvers av virksomheter.

– Risikoen for misforståelser er stor

“Celsius”, “Fahrenheit” og “Kelvin” er alle måter å måle temperatur på. Ulik navngivning og begrepsbruk gjør det krevende å søke opp og få oversikt over eksisterende data. Mye tid går derfor med til datarengjøring før du i det hele tatt kan begynne å kode.

Uten standardiserte navn og definisjoner må du manuelt tolke hva som menes – og risikoen for misforståelser er stor.

Datakatalogen til Tietoevry er bygget på en metadata-modell som betyr at du får tydelige beskrivelser som forteller hvordan datasettene er navngitt. Deretter kan du kjøpe datasettene på Markedsplassen og eksportere dem i den standarden du foretrekker.

– Dette gjør det enkelt å unngå misforståelser og lage AI-modeller som lever opp til forventningene, poengterer Larsen.

Men selv når dataene er ryddige, gjenstår ett stort hinder: Kan de brukes?

Juridisk usikkerhet stopper innovasjon

Det er sjelden ambisjonsnivået som stopper AI-prosjekter – ofte er det også usikkerhet knyttet til om dataene faktisk kan brukes uten å bryte med GDPR-lovgivningen.

– Mange ledere er skeptiske til å investere i AI fordi de ikke er sikre på om dataene som skal benyttes, er lovlige å bruke. Ingen vil risikere bøter eller dårlig presse, og uten tydelige retningslinjer blir det vanskelig å få godkjenning til å bygge løsningene du vet kan gjøre en forskjell, sier Larsen.

📸 Det klassiske spørsmålet mange utviklere møter er «Har vi egentlig lov å bruke disse dataene til dette formålet?».
📸 Det klassiske spørsmålet mange utviklere møter er «Har vi egentlig lov å bruke disse dataene til dette formålet?». Vis mer

Når ledere ikke er trygge på dataenes opprinnelse, avstamming og kvalitet, blir det vanskelig å overbevise dem om å satse. For deg betyr det ofte flere runder med undersøkelser og dokumentasjon – før du i det hele tatt kan begynne å kode.

– Jeg mener Datakatalogen er løsningen også på dette problemet. Da er det tydelig hvor dataene kommer fra, hvordan de er lagret og behandlet, forklarer Larsen.

40 år med erfaring innen dataforvaltning

Tietoevry har håndtert offentlige data i Norge siden 80-tallet. I tillegg jobber vi med flere store private kunder som stoler på oss og våre løsninger.

De siste årene har utviklingen av AI gjort tilgang på data mer verdifullt enn noen gang. Det som før var et anonymt marked, har blitt en av de mest ettertraktede ressursene i teknologibransjen.

– Etter hvert som flere innser verdien i data, bruker vi erfaringen vår til å gjøre det enklere å finne, forstå, utvikle og selge data, sier Larsen.

Dette har ført til utviklingen av Datakatalogen og Markedsplassen.

I Datakatalogen kan du dele og finne trygge og strukturerte data. På Markedsplassen kan du kjøpe og selge data, API-er og ferdige dataprodukter. Der kan du også utvikle nye produkter basert på data i trygge innovasjonsrom der du trygt kan dele data med eksterne aktører.

– Det viktigste er at du slipper å bekymre deg for om dataene holder mål – du vet at de er kvalitetssikret og trygge å dele, sier Larsen.

Nysgjerrig? Møt oss på kode24-dagen

Sliter du med å finne gode data? Eller er du lei av å forklare GDPR-greiene til ledelsen?

Kom og snakk med oss på standen vår på kode24-dagen 27. mars. Vi hjelper deg å få AI-prosjektene dine opp og stå.

Les mer om Datakatalogen og Markedsplassen.