Introduktion til Datakvalitetstjenester
- artikel
- 08/17/2020
- 7 minutter at læse
-
- s
- M
- r
- c
- d
gælder for: alle understøttede versioner)
den datakvalitetsløsning, der leveres af Datakvalitetstjenester, gør det muligt for en dataforvalter eller IT-professionel at opretholde kvaliteten af deres data og sikre, at dataene passer til virksomhedens brug. Vi er en vidensdrevet løsning, der giver både computerassisterede og interaktive måder at styre integriteten og kvaliteten af dine datakilder på. Vi giver dig mulighed for at opdage, opbygge og administrere viden om dine data. Du kan derefter bruge denne viden til at udføre datarensning, matchning og profilering. Du kan også udnytte de cloud-baserede tjenester fra referencedataudbydere i et projekt af datakvalitet.
forretningsbehovet for DKs
forkerte data kan skyldes brugerindtastningsfejl, korruption i transmission eller opbevaring, uoverensstemmende dataordbogsdefinitioner og andre datakvalitets-og procesproblemer. Aggregering af data fra forskellige kilder, der bruger forskellige datastandarder, kan resultere i inkonsekvente data, ligesom anvendelse af en vilkårlig regel eller overskrivning af historiske data. Forkerte data påvirker en virksomheds evne til at udføre sine forretningsfunktioner og levere tjenester til sine kunder, hvilket resulterer i tab af troværdighed og indtægter, kundetilfredshed og overholdelsesproblemer. Automatiserede systemer fungerer ofte ikke med forkerte data, og dårlige data spilder tid og energi hos mennesker, der udfører manuelle processer. Forkerte data kan skabe kaos med dataanalyse, rapportering, data mining og oplagring.
data af høj kvalitet er afgørende for virksomhedernes og institutionernes effektivitet. En organisation af enhver størrelse kan bruge DKS til at forbedre informationsværdien af sine data, hvilket gør dataene mere egnede til den tilsigtede anvendelse. En datakvalitetsløsning kan gøre data mere pålidelige, tilgængelige og genanvendelige. Det kan forbedre fuldstændigheden, nøjagtigheden, overensstemmelsen og konsistensen af dine data, løse problemer forårsaget af dårlige data i business intelligence eller datalagerarbejdsbelastninger såvel som i operationelle OLTP-systemer.
gør det muligt for en forretningsbruger, informationsmedarbejder eller IT-professionel, der hverken er databaseekspert eller programmør, at oprette, vedligeholde og udføre deres organisations datakvalitetsoperationer med minimal opsætnings-eller forberedelsestid.
besvarelse af dette behov med DKS
datakvalitet er ikke defineret i absolutte tal. Det afhænger af, om data er egnede til det formål, de er beregnet til. Vi identificerer potentielt ukorrekte data og giver dig en vurdering af sandsynligheden for, at dataene faktisk er forkerte. DKS giver dig en semantisk forståelse af dataene, så du kan bestemme dens hensigtsmæssighed. Vi giver dig mulighed for at løse problemer, der involverer ufuldstændighed, manglende overensstemmelse, inkonsekvens, unøjagtighed, ugyldighed og dataduplikation.
DKS indeholder følgende funktioner til at løse datakvalitetsproblemer.
-
datarensning: ændring, fjernelse eller berigelse af data, der er forkerte eller ufuldstændige, ved hjælp af både computerassisterede og interaktive processer. Du kan finde flere oplysninger i data Cleansing.
-
Matching: identifikation af semantiske dubletter i en regelbaseret proces, der gør det muligt at bestemme, hvad der udgør et match og udføre de-duplikering. Du kan finde flere oplysninger i Datamatchning.
-
Referencedatatjenester: verifikation af kvaliteten af dine data ved hjælp af tjenester fra en referencedataudbyder. Du kan bruge referencedatatjenester fra Microsoft Marketplace til at rense, validere, matche og berige data. Du kan finde flere oplysninger i Referencedatatjenester.
-
profilering: analysen af en datakilde for at give indsigt i kvaliteten af dataene på hvert trin i videnopdagelses -, domænestyrings -, matchnings-og datarensningsprocesser. Profilering er et kraftfuldt værktøj i en løsning til datakvalitet. Du kan oprette en datakvalitetsløsning, hvor profilering er lige så vigtig som videnstyring, matchning eller datarensning. Du kan finde flere oplysninger i Dataprofilering og meddelelser i DKS.
-
overvågning: sporing og bestemmelse af tilstanden af datakvalitetsaktiviteter. Overvågning giver dig mulighed for at kontrollere, at din datakvalitetsløsning gør, hvad den er designet til at gøre. Du kan finde flere oplysninger under administration af DKs.
-
vidensbase: Datakvalitetstjenester er en vidensdrevet løsning, der analyserer data baseret på viden, som du bygger med DKS. Dette giver dig mulighed for at oprette datakvalitetsprocesser, der løbende forbedrer viden om dine data og dermed løbende forbedrer kvaliteten af dine data.
følgende illustration viser processen:
en Vidensdrevet løsning
DKS vidensbase er et lager af tre typer viden: viden uden for boksen, viden genereret af Datakvalitetsserver og viden genereret af brugeren. Vi gør det muligt for dig at gemme viden om dine data i vidensbasen, tilføje forretningsregler og ændre den viden, som du finder passende, og derefter anvende den til at teste integriteten og rigtigheden af dataene. Når du har opbygget vidensbasen, kan du løbende forbedre den og derefter genbruge den i flere datakvalitetsforbedringsprocesser.
viden i en vidensbase identificerer potentielt ukorrekte data og foreslår ændringer af dataene. Det kan finde datakampe, så du kan udføre dataduplikering. Det kan sammenligne kildedata med skybaserede referencedata, der vedligeholdes og garanteres af datakvalitetsudbydere. Datastyreren eller IT-fagmanden verificerer både viden i vidensbasen og de ændringer, der skal foretages i dataene, og udfører rensnings -, deduplikations-og referencedatatjenesterne.
en vidensbase gemmer al den viden, der er relateret til en bestemt type datakilde. Du kan f.eks. vedligeholde en vidensbase for en kundedatabase og en anden vidensbase for en medarbejderdatabase. Viden er indeholdt i et eller flere datadomæner, som hver især er en semantisk repræsentation af en type data i et datafelt. En vidensbase for en kundedatabase kan have domæner til firmanavne, adresser, kontakter, kontaktoplysninger osv. Et domæne indeholder en liste over værdier, der er tillid til, ugyldige værdier og fejlagtige data. Domæne viden omfatter synonym foreninger, sigt relationer, validering og forretningsregler, og matchende politikker. Bevæbnet med denne viden kan datastyreren træffe en informeret beslutning om, hvorvidt specifikke forekomster af værdierne i et domæne skal rettes.
gør det muligt at udføre import og eksport operationer med en vidensbase. Du kan importere eller eksportere domæner eller vidensbaser ved hjælp af en DKF-fil. Du kan importere værdier eller domæner fra en fil. Du kan også importere værdier, der er fundet ved en renseproces baseret på vidensbasen, tilbage til et domæne. Disse operationer gør det muligt for dig løbende at forbedre en vidensbase og sørge for, at viden opnået gennem beslutninger og opdagelser føres tilbage til vidensbasen.
den vidensdrevne løsning bruger to grundlæggende trin til at rense data:
-
en videnstyringsproces, der bygger vidensbasen
-
et datakvalitetsprojekt, der foreslår ændringer i kildedataene baseret på viden i vidensbasen.
du kan finde flere oplysninger i vidensbaser og domæner og Datakvalitetsprojekter.
komponenter
Datakvalitetstjenester består af Datakvalitetsserver og Datakvalitetsklient. Disse komponenter gør det muligt for dig at udføre tjenester af datakvalitet separat fra andre SERVEROPERATIONER. Begge er installeret fra programmet for serveropsætning.
Datakvalitetsserver implementeres som tre SERVERKATALOGER, som du kan administrere og overvåge i Serverstyringsstudiet (DKS_MAIN, DKS_PROJECTS og DKS_STAGING_DATA). DKS_MAIN omfatter DKs lagrede procedurer, dkssmotoren og offentliggjorte vidensbaser. DKS_PROJECTS indeholder data, der er nødvendige for vidensbasestyring og DKs projektaktiviteter. Data giver en mellemliggende iscenesættelsesdatabase, hvor du kan kopiere dine kildedata for at udføre operationer med DKS og derefter eksportere dine behandlede data.
Datakvalitetsklient er et selvstændigt program, der giver dig mulighed for at udføre videnstyring, datakvalitetsprojekter og administration i en brugergrænseflade. Programmet er designet til både datastyrere og administratorer. Det er en stand-alone eksekverbar fil, der udfører viden opdagelse, domænestyring, matchende politik skabelse, data udrensning, matching, profilering, overvågning og server administration. Datakvalitet klient kan installeres og køre på den samme computer som Datakvalitetsserver eller eksternt på en separat computer. Mange operationer i datakvalitet klient er guiden-drevet til brugervenlighed.
Datakvalitetsfunktionalitet i integrationstjenester og Stamdatatjenester
Datakvalitetsfunktionalitet, der leveres af Datakvalitetstjenester, er indbygget i en komponent i SSIS-Serverintegrationstjenester (SSIS) og i funktioner i Master Data Services (MDS), så du kan udføre datakvalitetsprocesser inden for disse tjenester.
Rensekomponent i integrationstjenester
RENSEKOMPONENTEN i integrationstjenester giver dig mulighed for at udføre datarensning som en del af en Integrationstjenestepakke. Når pakken køres, køres datarensning som en batchfil. Dette er et alternativ til at køre et renseprojekt i Datakvalitetsklientapplikationen. Du kan sikre kvaliteten af dine data automatisk. Du behøver ikke at udføre de interaktive trin i et datarensningsprojekt inden for Datakvalitetsklientapplikationen. Du kan medtage datarensningsprocessen i en datastrøm, der indeholder andre komponenter til integrationstjenester. Du kan finde flere oplysninger i Cleansing Transformation.
Datakvalitetsprocesser i Master Data Services
Datakvalitetstjenester funktionalitet er blevet integreret i Master Data Services (MDS), så du kan udføre de-duplikering på kildedata og stamdata i Microsoft Master Data Services-tilføjelsesprogrammet 2014 Master Data Services. Hvis du vil udføre matchning, skal du indlæse data, der administreres af MDS, i et regneark, kombinere dem med data, der ikke administreres af MDS, og derefter udføre matchning i MDS. Datakvalitetsserverkomponenterne skal installeres med MDS. Du kan finde flere oplysninger i Datakvalitetsmatchning i tilføjelsesprogrammet MDS.
Leave a Reply