moderní Enterprise Data Architecture
Data jsou základním aktivem, které každý podnik potřebuje k efektivní konkurenci v dnešní ekonomice. Hodnota datových aktiv však může být realizována pouze tehdy, jsou-li používána strategicky, operativně, důsledně a přesně v celém podniku. Přitom historicky bylo náročné. Dnešní podniky se obracejí na data-as-a-service (DaaS) jako součást své cloudové datové strategie, aby zajistily vysokou úroveň SLA, správu dat, přesnost a vysokou dostupnost vyžadovanou zákazníky a obchodní strategií. Aby plně využili přístup DaaS, musí mít zavedenou moderní datovou architekturu.
co je datová Architektura?
data architecture, navržená datovými architekty, standardizuje, jak podniky shromažďují, ukládají, transformují, distribuují a používají data za účelem pomoci analytikům dat a lidem v organizaci lépe se rozhodovat na základě Business intelligence v reálném čase. Datová architektura je základem pro modelování dat a informační architekturu, díky čemuž jsou data použitelná a užitečná v celé organizaci.
zatímco datová architektura není nová, moderní podniková datová Architektura (nebo moderní datová architektura) se vyvíjí a vyvíjí s tím, jak podniky stále více přecházejí do cloudu. Pouze cloud umožňuje rychlost, škálovatelnost a snadné použití potřebné k tomu, aby moderní datová architektura byla efektivní. Vzhledem k tomu, že podniky přecházejí na cloudové infrastruktury, transformuje se také jejich datová Architektura.
co je moderní datová Architektura?
moderní datová architektura se zaměřuje na sladění dat s možnostmi poháněnými cloudem. Tradiční datová architektura byla postavena na on-premise datových modelů, které spotřebovaly spoustu času pro zpracování dat a správu dat. Díky infrastruktuře abstrahované cloudem se moderní datová Architektura zaměřuje na to, aby data byla co nejjednodušší a co nejužitečnější pro podnikání a zákazníky. Usnadňuje snadnost, rychlost, spolupráci, analýzu v reálném čase a konzistenci.
moderní datová architektura je:
- postaven pro koncové uživatele konzumovat. Cloud umožňuje koncovým uživatelům určit, jaká data potřebují pro obchodní rozhodnutí, a architektům dat navrhnout přístup k datům, který poskytuje to, co potřebují.
- automatizováno pomocí datových potrubí a datových toků. Nikdo nemá čas čekat na pomalé zpracování dat. Díky integraci cloudu a dat mohou podniky automatizovat celý proces správy dat, takže data plynou hladce a volně všude, kam v Organizaci potřebuje, a přitom si zachovávají správu dat. Integrace dat je klíčem k zajištění toho, aby se každá část celku spojila.
- Kurátor AI / ml. Moderní podniková datová Architektura využívá sílu umělé inteligence (AI) a strojového učení (ML) k automatizaci zpracování dat, rozpoznání nových typů dat, očištění dat, opravě problémů s kvalitou dat, provádění dolování dat, zajištění zachování datových standardů a analýzy a postřehy povrchových dat. AI / ML je klíčem k rychlosti a přesnosti automatizace.
- škálovatelné pro splnění nepředvídatelných požadavků. Data jsou generována a spotřebována mimořádnými sazbami, a protože podniky řeší výkyvy v požadavcích spotřebitelů, musí být schopny škálovat data nahoru a dolů, automaticky a za rozumnou cenu.
- sdílení pro důvěryhodnou spolupráci. Sdílená data jsou zásadní pro zajištění toho, aby všichni pracovali ze stejného zdroje dat pravdy. Sdílená data také pomáhají rozebrat Sila oddělení a podporovat snadnější a důvěryhodnější spolupráci.
- Zabezpečte podle návrhu. Pro většinu podniků jsou data jejich nejcennějším aktivem. Moderní datová Architektura zohledňuje bezpečnost dat s řízeným přístupem a autorizací dat, jakož i dodržování zákonů a předpisů o ochraně osobních údajů, jako jsou GDPR a HIPAA.
pokud vytváříte datovou architekturu od nuly v cloudu, pak je snadné vytvořit tyto vlastnosti. Většina podniků však obkroužuje starší on-premise infrastrukturu s cloudem, a často multi-cloud. Jejich data se nacházejí na více místech a jsou obvykle silně siloed. Migrace dat do cloudu a integrace dat jsou prioritou.
kromě šesti charakteristik moderní datové architektury budete také chtít zajistit, aby váš návrh usnadnil následující:
- podporuje přechod na samoobsluhu a více typů uživatelů (integrátoři, vědci v oblasti dat, vedoucí představitelé podniků, zúčastněné strany)
- umožňuje hyper-připojený podnik (považujte data za nervy spojující každou část těla a bezproblémově přenášejte informace podle potřeby)
- posune podávání zpráv na prediktivní a normativní analytiku pro poznatky v reálném čase, doporučení založená na AI a aktuální rozhodování
- budoucí důkazy pro nové zdroje dat, navazující aplikace a případy použití
3 etapy moderních dat enterprise journey
vzhledem k tomu, že podniky se digitálně transformují a přesouvají směrem k cloudu, obvykle procházejí postupnou cestou k dosažení moderní datové architektury.
to lze rozdělit do tří hlavních fází:
Stage 1-On-Premises
většina podniků má vlastní systémy s nástroji pro ukládání a zpracování velkých datových sad a provádění složitých transformací. Toto prostředí je náročné z následujících důvodů:
- to vyžaduje velké kapitálové investice dopředu, aby mohli začít a velké investice do provozních nákladů (OpEx) pro potřebné pracovníky
- potřebuje specializovaný, vyhrazený soubor dovedností pro správu velkých datových nástrojů
- to má za následek pomalou dobu odezvy, včetně dodací lhůty při nákupu, přepravě a instalaci datového prostředí
podniky takto fungovaly po mnoho desetiletí a obvykle mají velké investice do on-premise modelů. Nejen, že existují finanční investice, ale riziko ztráty dat nebo odpojení přizpůsobených integrací může být příliš velké pro úplnou cloudovou migraci. Mnoho podniků má data, o kterých se domnívají, že musí zůstat v kompetenci svých vlastních serverů, a proto přistupují k hybridnímu cloudovému přístupu.
Fáze 2-Cloud: Virtual Private Cloud (VPC)
při přijetí cloudu je druhou fází cesty “lift and shift”, kdy podniky jednoduše přesunou klastry na poskytovatele cloudu běžící ve virtuální privátní cloudové síti a mohou využít výhod IaaS, jako jsou nižší náklady. Forrester uvádí, že organizace nasazující v cloudu ušetří 20-60 procent oproti nákladům na infrastrukturu v areálu, protože většina z nich překonává své servery a úložiště a poté musí tato prostředí spravovat.
tato fáze má však stále některé velké výzvy, protože:
- nedělá nic pro řešení problémů správy a údržby životního prostředí
- má vysoký OpEx
- neřeší mezeru nastavenou dovednostmi a dovednosti potřebné pro správu služeb běžících ve VPC
- má pomalou dobu odezvy
- nepodporuje nativní cloudové služby
Správa on-premise a soukromých cloudů je složitá, což často vede podniky k hledání lepšího řešení.způsob správy cloudového prostředí. To vede k přechodu na spravované cloudové služby.
Fáze 3-Cloud: Big Data jako služba
v této fázi podniky rozpoznaly výzvy a řeší je přechodem na cloudové služby, jako jsou IBM, Microsoft a Google. Tyto spravované služby osvobozují podnik od složitosti správy a údržby prostředí pro zpracování v měřítku, a nižší cenné výdaje OpEx.
Mezi další výhody patří:
- funkce na vyžádání, které využívají úložné a výpočetní prostředky pouze v případě potřeby, čímž snižují OpEx
- mnohem jednodušší způsob, jak škálovat nahoru a dolů na objemy terabajtů/petabajtů
- rychlejší doby odezvy pro obchodní potřeby
kromě toho jsou platformy velkých dat spravované cloudem navrženy se službami cloudového úložiště. Mají nativní integraci s cloudovým úložištěm, takže můžete použít cloudové úložiště jako součást distribuovaného úložiště vhodnou pro ukládání datových jezer.
promluvme si trochu o ukládání dat.
moderní datová Architektura potřebuje datová jezera
datový sklad ukládá strukturovaná data (tj. z transakčních systémů). Je optimalizován pro analýzu relačních dat, nikoli Polo / nestrukturovaných dat. Před zápisem ze zdroje dat do datového skladu je tedy třeba definovat strukturu a data je třeba vyčistit a transformovat. To vyžaduje čas a ztěžuje získání použitelných dat rychlostí, kterou podnik potřebuje. Také s tolika novými dostupnými údaji jsou náklady na skladování dat ve skutečnosti velmi neúnosné.
datová jezera podporují moderní datovou architekturu.
na rozdíl od datového skladu je datové jezero sbírkou všech datových typů: strukturovaných, polostrukturovaných a nestrukturovaných. Data jsou uložena ve formátu raw bez nutnosti jakékoli struktury nebo schématu. Ve skutečnosti nemusíte definovat datovou strukturu, když je zachycena, pouze když je čtena. Protože datová jezera jsou vysoce škálovatelná, podporují větší objemy dat za levnější cenu. A s datovým jezerem můžete ukládat data z relačních zdrojů (jako jsou relační databáze) a z nerelačních zdrojů (zařízení/ stroje IoT, sociální média atd.) bez ETL (extract, transform, load), což zpřístupňuje data pro analýzu mnohem rychleji.
4 vlastnosti moderní podnikové datové architektury
existují čtyři hlavní rysy moderní podnikové datové architektury: 1) datový cyklus, 2) ukládání dat, 3) integrační platforma a 4) doručování dat.
datový cyklus
podniky se neustále setkávají s novými zdroji dat a potřebují zachytit data dříve, než znají případný případ použití. Zachycená data jsou extrahována, aby se naplnily známé případy použití a držely se pro budoucí nedefinované případy použití. Poté musí být příchozí data přizpůsobena podnikovým standardům, aby byla zajištěna správa, kvalita, konzistence, dodržování předpisů a přesnost pro následné spotřebitele, bez ohledu na jejich obchodní potřebu, sadu dovedností nebo porozumění datové architektuře. Jakmile jsou data zachycena a přizpůsobena podnikovým standardům, refinement services připraví data pro jejich případnou následnou aplikaci a / nebo případy použití.
datové úložiště
Data jsou uložena v datovém jezeře. Přemýšlejte o datovém jezeře jako o moderní továrně na data a uvnitř jezera jsou “kontejnery”pro různé fáze zpracování dat. Prvním kontejnerem je přistávací kontejner, kde jsou přijímána příchozí surová data bez ohledu na jejich formu, transport nebo zdroj. To je místo, kde jsou nečistá data. Zde se rozhoduje o tom, jaké nezpracované údaje uchovávat. Data, která jsou uchovávána, jsou přesunuta do přizpůsobeného kontejneru.
přizpůsobený kontejner je místem, kde se čistí surová data a je zajištěna kvalita dat. Conform kontejner zajišťuje, že podnik pracuje s konzistentní soubor dat, který je v souladu s normami.
dále máme rafinovaný kontejner, který připravuje data pro svůj konečný cíl dodávky, a v závislosti na případech použití mohou existovat podmnožiny rafinérií. Jakmile jsou data vylepšena, jsou připravena k dodání na místo určení. Po dodání může být přesunuta do pracovního prostoru pro datové vědce k použití, archivována pro dlouhodobé skladování nebo smazána.
platforma pro integraci dat
integrační platforma přebírá data z různých zdrojů a kombinuje je tak, aby poskytovala jednotný pohled. V moderní datové architektuře musí být integrační platforma dostatečně flexibilní, aby podporovala všechny požadované zdroje a cíle dat, jakož i datové služby v každé fázi datového cyklu. Musí být schopen podporovat data se schématem i bez něj a spravovat metadata. Navíc musí být schopen zvládnout integraci a zpracování potřebné pro:
- Vysoká rychlost, rozmanitost a sběr dat o objemu
- integrace aplikací s nízkou latencí
- zpracování shody dat s vysokým objemem
- integrace dat od doručení do cíle
- spotřeba API (nezbytná pro ekosystémy B2B)
dále, výše uvedené scénáře musí být zpřístupněny široké uživatelské komunitě od vysoce kvalifikovaných IT profesionálů až po firemní uživatele, kteří potřebují urychlit řadu obchodních projektů v reakci na rychle se měnící podnikatelské prostředí. V moderním podniku jsou analytici a vědci v oblasti dat vyzváni, aby odpověděli na strategické otázky a odemkli inovace bezprecedentním tempem a prostě nemají luxus, že jsou závislí na IT organizaci, aby zpřístupnili kriticky nezbytné informace. Samoobsluha již není luxusem nebo pohodlím,ale nyní je kritickým požadavkem. Schopnost rychle budovat datové potrubí je nezbytná pro udržení pohybu podnikání rychlostí, kterou potřebuje v digitálním věku.
dodání dat
a konečně je třeba dodat data k příslušným cílům. Bezpečná dostupnost dat je nedílnou součástí moderní datové architektury. Správa, bezpečnost, řízení přístupu na základě rolí (RBAC), SLA, škrcení a analýza využití jsou rozhodující pro poskytování dat zamýšleným uživatelům, ať už interním zaměstnancům nebo externím partnerům.
podniky, které využívají přístup k poskytování dat jako služby, zajišťují nejvyšší úroveň dostupnosti, dostupnosti a zkušeností zákazníků bez nákladů na neustálé požární cvičení IT nebo na ohrožení bezpečnosti nebo vnitřního duševního vlastnictví. Data jsou doručena do svých konečných destinací, které budou zahrnovat datové trhy, aplikace, soubory, datové rybníky, pracovní stoly pro vědu o datech, řešení podporovaná AI a ekosystémy API.
vybudujte robustní moderní datovou architekturu
robustní moderní podniková datová Architektura zajistí, že podniky budou mít Přístupnost, rychlost, flexibilitu a spolehlivost k optimalizaci každého zdroje dat a jejich použití k lepším obchodním rozhodnutím. SnapLogic poskytuje integraci dat prostřednictvím své inteligentní integrační platformy jako služby, pomáhá podnikům budovat moderní datové architektury pro budoucí potřeby svých dat.
Leave a Reply