Data Cleansing: AI forutsetter rene data
Rydde opp? Stelle? Gjøre rent? Det er ikke de mest populære beskjeftigelsene i bedrifter heller. Derfor blir ofte innsamlede data værende i sin opprinnelige «skitne» stand. Uten å vite om det, taper bedrifter dermed inntekter i milliardstørrelsen hvert år. I lys av den aktuelle utviklingen blir datarenslighet mer enn noensinne en kritisk faktor for å lykkes.
Uten data kan man ikke bruke AI
Kunstig intelligens (AI) er vår tids fremtidsteknologi. Både store og små bedrifter bruker algoritmiske, maskinlæringsstøttede verktøy til en lang rekke ulike formål, fra analyse av cybersikkerhet til kundeservice – og langt utover det.
Med bakgrunn i dette er det elementært å fokusere på det viktigste: dataene, hjertet og sjelen i AI. For uten de riktige dataene er selv den beste algoritmen ubrukelig. Bedrifter og organisasjoner har enorme mengder til rådighet. Kunde- og finansdata, sensor- og maskindata, historiske foretaksdata og data fra utallige andre kilder. Den nødvendige kunnskapen for å ta bedre beslutninger er tilgjengelig – men den blir ofte ikke brukt.
Det at disse dataene ofte ikke er lette å bruke, skyldes to vesentlige faktorer. Nummer 1: Ulike dataformater gir svært heterogene datasett. Det kan synes som en stor utfordring, men løsningen er relativt enkel. For dataene kan samles i en datasjø, konsolideres og gis et enhetlig format for videre behandling.
Data er ofte ikke tilstrekkelig rene for AI
Faktor nummer 2 er enda viktigere: den såkalte forurensningen av data. Det omfatter eksempelvis manglende informasjon, inkonsistente data eller kort og godt feil. Hvis dataene ikke renses før de brukes av en AI, kan det få alvorlige konsekvenser.
Analyser fra Accenture viser at hele 79 prosent av selskapene tar kritiske avgjørelser på bakgrunn av data uten å investere i å verifisere dem, og dermed risikerer de store tap. Dette resulterer i tap på 15 milliarder dollar årlig på verdensbasis, noe også Gartner bekrefter.
Grunnen er like enkel som alvorlig: Rensing av dataene, også kalt Data Cleansing, koster tid, krefter og penger. Men sammenliknet med det truende resultatet på grunnlag av urene data er det imidlertid langt rimeligere.
Hva er egentlig Data Cleansing?
Data Cleansing betegner prosessen med å endre data i en bestemt lagringsressurs for å sikre at de er presise og korrekte. Det betyr ikke nødvendigvis å slette data som ikke passer. I stedet brukes prosessen til å maksimere dataenes nøyaktighet og dermed deres tilhørende kvalitet.
Data Cleansing innebærer heller ikke at man oppnår en slags dataperfeksjon. Data er tross alt bare et middel for å nå et mål. Man bør snarere etterstrebe et kvalitetsnivå der data kan brukes og behandles, slik at man oppnår effektive prosesser og optimale resultater. Data Cleansing bør derfor utføres av de ekspertene som også kjenner prosessene – av Data Scientists. Det utgjør faktisk størsteparten av arbeidet deres.
Industriell AI er på vei inn og trenger Data Cleansing
Markedet og oppgavene for AI og maskinlæring fortsetter å vokse uforholdsmessig.
Den siste utgaven av Gartner «CIO Survey» bekrefter at det internasjonalt er en enorm internasjonal etterspørsel etter kunstig intelligens. Antall foretak som bruker det har økt med 270 prosent de siste fire årene. Bare det siste året er andelen blitt tredoblet. Ifølge analytikerne er årsaken den enorme videreutviklingen av tilsvarende teknologier og nødvendig dataytelse. For øyeblikket blir AI-løsninger fortsatt opplært til spesielle formål, men de har for lengst påvirket databaserte beslutninger.
AI-industrialiseringsfasen begynner nå med neste utviklingstrinn, den tredje AI-bølgen og dens tilhørende AI-kontekstuelle evner. Da vil prosessene være så komplekse og resultatavgjørende at AI og nøyaktige data er en avgjørende forutsetning for å lykkes.