Forskere hos Microsoft har laget en eksperimentell løsning kalt SpreadsheetLLM, designet spesielt for å gjøre det mulig for AI-modeller å jobbe med regneark som Excel og Google Sheets. Det skriver blant andre SiliconAngle og VentureBeat.
Løsningen beskrives i en forskningsartikkel som er publisert på Arxiv.org.
– Regneark kjennetegnes av sine omfattende todimensjonale rutenett, fleksible layout og muligheter for variert formatering, noe som utgjør betydelige utfordringer for store språkmodeller (LLM-er), skriver forskerne.
Med SpreadsheetLLM skal det ifølge forskerne være mulig å bruke en LLM til å bedre forstå regneark.
Konverterer til noe språkmodeller forstår bedre
Dagens LLM-er har problemer med å skjønne konsepter som celleadresser og formater. Forskerne fant derfor ut at de måtte utvikle en ny løsning for å enkode regnearkene til et format LLM-ene enklere kan jobbe med.
Den nye enkodings-mekanismen kalles SheetCompressor, og skal ifølge SiliconAngle beholde strukturen og relasjoner mellom data, samtidig som dataene gjøres tilgjengelig for LLM-en.
Dataene komprimeres også med opptil 96 prosent, slik at LLM-ene kan håndtere store datasett innenfor token-begrensningene disse LLM-ene har.
SpreadsheetLLM ble brukt sammen med kjente LLM-er som GPT-3.5, GPT-4 og Llama 2, og testene viste en signifikant forbedring i disse modellenes evne til å forstå innholdet i regneark.
AI-assistert dataanalyse
Ifølge forskerne vil det å gi en AI bedre forståelse for regneark åpne for en masse muligheter.
For eksempel vil du kunne stille spørsmål om dataene i regneark, slik vi i dag bruker for eksempel ChatGPT til å spørre om alt mulig hentet fra tekst. Det vil også bli mulig å få en LLM til å skape helt nye regneark basert på prompts skrevet med naturlig språk, eller man kan bruke det til AI-assistert dataanalyse.
SpreadsheetLLM er fortsatt på eksperimentstadiet, og inntil videre bare et forskningsprosjekt. Microsoft har ikke sagt noe om eventuelle planer om å gjøre det til et faktisk produkt.