Den Svimlende Effekten Av Skitne Data
Ed Downs
Ed Downs er ansvarlig for markedsføring av kundeløsninger hos MarkLogic. Han trekker på sin betydelige erfaring, etter å ha levert store big data-prosjekter og operasjonelle og analytiske løsninger for offentlige og private organisasjoner, for å drive bevissthet og akselerere adopsjon Av MarkLogic-plattformen.
noen ganger sniker kostnadene seg på oss. Det som kan synes å være en daglig irritasjon, har hatt svimlende kostnadsimplikasjoner i årevis.
Skitne data-data som er unøyaktige, ufullstendige eller inkonsekvente – er en av disse overraskelsene. Experian rapporterer at selskaper over hele verden i gjennomsnitt føler at 26% av dataene deres er skitne. Dette bidrar til enorme tap. Faktisk koster den gjennomsnittlige virksomheten 15% til 25% av omsetningen, OG DEN AMERIKANSKE økonomien over $3 billioner årlig. Alle som har måttet håndtere skitne data vet hvor frustrerende det kan være, men når tallene er lagt opp, kan det være vanskelig å vikle hodet rundt virkningen.
siden skitne data koster så mye – en nyskapende underdrivelse – er det viktig å forstå hvor det kommer fra, hvordan det påvirker virksomheten og hvordan det kan håndteres.
Hvor Kommer Skitne Data Fra?
ifølge Experian påvirker menneskelige feil over 60% av skitne data, og dårlig interdepartmental kommunikasjon er involvert i omtrent 35% av unøyaktige dataposter. Intuitivt ser det ut til at en solid datastrategi bør redusere disse problemene, men utilstrekkelig datastrategi påvirker også 28% av unøyaktige data.
når ulike avdelinger legger inn relaterte data i separate datasiloer, vil ikke en god datastrategi forhindre begroing nedstrøms datalager, marter og innsjøer. Poster kan dupliseres med ikke-kanoniske data som ulike feilstavinger av navn og adresser. Datasiloer med dårlige begrensninger kan føre til at datoer, kontonumre eller personopplysninger vises i forskjellige formater, noe som gjør dem vanskelige eller umulige å automatisk avstemme.
Skitne data kan forbli skjult i årevis, noe som gjør det enda vanskeligere å oppdage og håndtere når det faktisk er funnet. Dessverre finner 57% av bedriftene ut om skitne data når det rapporteres av kunder eller prospekter—en spesielt dårlig måte å spore og løse viktige dataproblemer på.
Mange organisasjoner søker etter inkonsekvente og unøyaktige data ved hjelp av manuelle prosesser fordi dataene deres er for desentraliserte og for ikke-standardiserte. Disse planene har en tendens til å falle i samme felle som dataene-i stedet for konsolidert planlegging er hver avdeling ansvarlig for sine egne data unøyaktigheter. Selv om dette kan fange noen tilfeller, bidrar det også til interne uoverensstemmelser mellom avdelingssiloer. Reparasjonen skjer på ett sted, men ikke i et annet, noe som bare fører til flere dataproblemer.
Virkningen Av Skitne Data
Skitne data resulterer i bortkastede ressurser, tapt produktivitet, mislykket kommunikasjon-både internt og eksternt-og bortkastede markedsføringsutgifter. I USA er det anslått at 27% av omsetningen er bortkastet på unøyaktige eller ufullstendige kunde-og prospektdata.
Produktiviteten påvirkes på flere viktige områder. Dataforskere bruker rundt 60% av tiden sin på å rense, normalisere og organisere data. I mellomtiden bruker kunnskapsarbeidere opptil 50% av tiden med skjulte og unøyaktige data.
Skitne data mangler troverdighet, og det betyr at sluttbrukere som stoler på dataene, bruker ekstra tid på å bekrefte nøyaktigheten, noe som reduserer hastigheten og produktiviteten ytterligere. Innføring av en annen manuell prosess fører til flere unøyaktigheter og montering inkonsekvenser gjennom økende antall skitne poster.
i tillegg til inntektstapet påvirker skitne data bedrifter mer lumsk. Bare 16% av bedriftsledere er sikre på nøyaktigheten som ligger til grunn for deres forretningsbeslutninger. Garbage in, garbage out – når du ikke kan stole på dine egne data, må noe gjøres for å øke data nøyaktighet og pålitelighet.
Skitne Data I Bank
Over Hele Verden, unøyaktigheter i data koster mellom 15% og 25% av inntektene for et selskap. Med globale inntekter på over 2,2 billioner dollar betyr dette at skitne data koster den globale bankindustrien over 400 milliarder dollar. Skitne data fører også til en rekke risikoer som er unike for banksektoren.
Inkonsekvent informasjon på tvers av datasiloer i en organisasjon fører til transaksjonsrisiko som unøyaktige eller til og med falske transaksjoner. Falske og falske kontoer bør fanges tidlig av prosesser som renser eller oppdager skitne data. Når de ikke gjør det, blir banken satt i fare, og omdømmet er skadet.
Med så mye skitne data og så få ledere som stoler på dataene de bruker, er det bundet til å resultere i dårlige strategiske beslutninger. Du kan ikke velge riktig vei hvis du ikke vet hvor du er. Skitne data kan føre til enorme operasjonelle risikoer.
det stadig utviklende regulatoriske landskapet skaper også en tung byrde for datahåndtering. Compliance team er under betydelig press for å gi mer informasjon om data, men når de ikke har rene data å jobbe med, de er ute av lykken. 2018-utrullingen Av mifid II-forskriftene har vært et smertefullt eksempel på dette, med sviktende overholdelse og stadig strengere regulatorer som forårsaker smerte for Mange Europeiske finansfirmaer.
Å Håndtere Skitne Data
det mest utfordrende problemet med å rydde opp skitne data er rengjøring av ugyldige oppføringer og dupliserte data. Forsiktig feilkorrigering er nødvendig for ikke bare å sikre at ingen data går tapt mens du forbedrer konsistensen av eksisterende gyldige data, men at alle metadataene som svarer til datakorrigering, opprettholdes sammen med de integrerte dataene selv.
når dataene er renset, må de vedlikeholdes. Etter den første prosessen med å rense skitne data, bør bare nye eller endrede data kontrolleres for gyldighet og konsistens. I alle tilfeller, fra gamle til nylig inntastede data, må datalinjen registreres. Dette sikrer dens gyldighet og pålitelighet.
Beste praksis for rengjøring av skitne data og for datastyring inkluderer følgende praksis:
- Harmonisere ved å korrelere dataene på tvers av ulike silo kilder og utnytte metadata for data proveniens og avstamning.
- Utnytt kjerne smart mastering evner å matche og slå sammen enheter i en enkelt multi-modell plattform.
- Bruk semantikk for å fange relasjoner mellom data og for å sikre konsistens.
- Opprett en 360-graders visning ved å integrere alle datakildene dine.
- Finn skitne data ved hjelp av naturlig språksøk, datamodellering og maskinlæring for å identifisere mønstre og anomalier.
Det er mye,men det er verdt det. En organisasjon som bruker sterk datastyring i tillegg til data-rensing praksis kan generere opptil 70% mer inntekter.
Slutt Å La Skitne Data Sinke Deg
forretningsvirkningen av skitne data er svimlende, men en enkelt organisasjon kan unngå hengemyr. Moderne teknikker og teknologi kan minimere virkningen av skitne data. Rene, pålitelige data gjør virksomheten mer smidig og responsiv samtidig kutte ned på bortkastet innsats av data forskere og kunnskapsarbeidere.
bedriften din planlegger kanskje allerede å takle problemene med skitne data. Faktisk planlegger 84% av bedriftene å implementere datakvalitetsløsninger snart, men mange av disse løsningene er segmentert på tvers av avdelinger i bedriften. Videre vil mange datakvalitetsinitiativer ikke adressere kjerneendringer som trengs i databasen for å påvirke positiv endring der det trengs mest. Dette vil bare føre til fremtidige problemer med inkonsekvente data, forverre den nåværende tilstanden som data sprer seg. Innsatsen må være global på tvers av virksomheten og på en måte som adresserer mangler ved kilden—inne i databasen. Et driftsdatahub, for eksempel et som er bygget på Toppen Av MarkLogic®, kan hjelpe bedriften din med å få den rette starten på å rense sine skitne data.
Finn ut hvordan Marklogics Rammeverk For Operasjonell Data Hub kan hjelpe deg med å forbedre datastyring og øke kvaliteten på dataressursene dine.
Leave a Reply