GitHub Copilot kan av og til foreslå kode som inneholder API-nøkler og andre hemmeligheter, avslører kinesiske forskere. 📸: Ole Petter Baugerød Stokke

Copilot-forslag inneholdt andres API-nøkler

Det er dumt å pushe hemmeligheter til git. Enda verre er det når de blir brukt som AI-treningsdata.

Kurt Lekanger journalist, kode24

Publisert 20.09.2023 - 09:37

Ledige stillinger

Se alle

Boitano

Med deg på laget kan vi levere endra flere innovative og bærekraftige løsninger for våre kunder.

Folio AS

Liker du best å jobbe under panseret?

Invo AS

Vil du være med å skape teknologi som gir arbeidsglede? Bli back-end utvikler hos INVO!

Labrador

Onboarding/import-utvikler til Norges ledende medieplatform

Repass

Repass is looking for senior developers to help shape the future of impactful supply chain transparency. Ready to make a real difference?

Møller Digital AS

Vil være med å forme vår digitale fremtid? Møller Digital søker en senior plattformutvikler!

Sopra Steria AS

Bygg kode som bygger Norge

SuperOffice AS

Work on everything from idea to launch. Shape the product, influence the roadmap, and build mobile experiences that matter. Ready to make an impact?

Bypost AS

Vil du være med og videreutvikle en moderne plattform i et selskap i sterk vekst?

Optio Incentives AS

Are you our next Tech Team Lead?

twoday

Vil du bli med å bygge fremtidens samfunn gjennom teknologi?

Capgemini Norge AS

Klar for å ta utviklerkarrieren til neste nivå? Bli med å bygge det råeste teknologihuset i landet!

Møller Digital AS

Vil du jobbe med moderne teknologi og komplekse systemer i et sterkt fagmiljø?

Labrador

Hvilepuls på 1000 requests/sek? Backend/infrastruktur-utvikler hos landets ledende medieplatform

Invo AS

Vil du være med å skape teknologi som gir arbeidsglede? Bli front-end utvikler hos INVO!

Capgemini Norge AS

Er du klar for å ta skyen til nye høyder? Vi leter etter Senior Cloud Platform Engineers!

Capgemini Norge AS

Sub Practice Lead- Cloud & Custom Application (C&CA)

Labrador

Vil du være med å forme fremtidens mediebransje? Labrador CMS søker frontendutvikler

Kodeassistenter basert på store språkmodeller, som GitHub Copilot og Amazon Code Whisperer, kan i noen tilfeller foreslå kode som inneholder API-nøkler og andre hemmeligheter som er fanget opp under trening av språkmodellen, skriver The Register.

En gruppe forskere ved The Chinese University i Hong Kong og Sun Yat-sen University i Kina har laget en forskningsrapport der de har undersøkt hvorvidt verktøy for kodefullføring kan avsløre hemmeligheter fra treningsdataene.

Og det kan de.

Uforsiktige utviklere kan komme til å hardkode slike kredentialer i koden.

Annonsørinnhold

Vil du ha mer egentid til innovasjon?

Bygget verktøy

Hvis en utvikler ved en feil pusher kode som inneholder hemmeligheter til Github eller andre git-baserte tjenester, bør man i utgangspunktet regne disse hemmelighetene som "tapt". Du vet aldri om noen har fått tak i dem, og en API-nøkkel eller annen hemmelighet som er på avveie bør derfor tilbakekalles/ugyldiggjøres.

Uansett viser forskningsrapporten at man bør være ekstra forsiktig nå som vi har fått AI-baserte kodeassistenter:

Ikke bare kode, men også andre data du har liggende i åpne repoer kan dukke opp som kodeforslag hos andre utviklere som bruker for eksempel Copilot.

For å finne ut om dette var et problem laget forskerne et verktøy de kalte "Hardcoded Credential Revealer" (HCR).

Verktøyet kan lete etter blant annet API-nøkler, access-tokens og OAuth ID-er. Altså informasjon som bør ligge i en .env-fil eller lignende som utelukkes fra git via .gitignore.

Annonsørinnhold

More Than Just Tech: A Culture of Innovation, Inclusion, and knowledge sharing

Uforsiktige utviklere

– Uforsiktige utviklere kan komme til å hardkode slike kredentialer i koden og til og med committe dem til tjenester som GitHub, forklarer forfatterne av forskningsrapporten.

Ifølge en annen rapport som The Register viser til, committes tusenvis av nye hemmeligheter til GitHub hver dag. Rundt 100.000 repoer inneholder allerede kode der hemmeligheter er hardkodet.

Ved hjelp av verktøyet de hadde laget, fikk de kinesiske forskerne 8127 kodeforslag med hemmeligheter – hvorav 2702 inneholdt gyldige hemmeligheter.

På grunn av etiske vurderinger valgte forskerne å ikke sjekke om hemmeligheter som kunne være en personvernrisiko faktisk fungerte – som API-nøkler til betalingstjenester. Men de sjekket enkelte "harmløse" hemmeligheter, som API-nøkler til test-API-er.