現代のエンタープライズデータアーキテクチャ

データは、今日の経済で効果的に競争するためにすべての企業 しかし、データ資産の価値は、ビジネス全体で戦略的、運用的、一貫して、正確に使用されている場合にのみ実現できます。 そうすることは歴史的に挑戦してきました。 今日の企業は、クラウドデータ戦略の一環としてdata-as-a-service(DaaS)に目を向けており、顧客とビジネス戦略が要求する高レベルのSLA、データガバナンス、正確性、高可用性を確保しています。 DaaSのアプローチを完全に活用するには、最新のデータアーキテクチャを導入する必要があります。

データアーキテクチャとは何ですか?

データアーキテクトによって設計されたデータアーキテクトは、データアナリストや組織内の人々がリアルタイムのビジネスインテリジェンスに基づいてより良い意思決定を行うのを支援するために、企業がデータを収集、保存、変換、配布、および使用する方法を標準化します。 データアーキテクチャは、データモデリングと情報アーキテクチャの基盤であり、どちらもデータを組織全体で使用可能かつ有用にします。

データアーキテクチャは新しいものではありませんが、現代のエンタープライズデータアーキテクチャ(または現代のデータアーキテクチャ)は、企業がクラウド 最新のデータアーキテクチャを効果的にするために必要な速度、拡張性、使いやすさを実現するのはクラウドだけです。 企業がクラウドベースのインフラストラクチャに移行するにつれて、データアーキテクチャも変革されています。

現代のデータアーキテクチャとは何ですか?データアーキテクチャ

現代のデータアーキテクチャは、クラウドによって供給される機能にデータを整列させることに焦点を当てています。 従来のデータアーキテクチャは、データ処理とデータ管理に大量の時間を消費したオンプレミスのデータモデルに基づいて構築されました。 クラウドによって抽象化されたインフラストラクチャでは、現代のデータアーキテクチャは、データにアクセスしやすく、ビジネスや顧客にできるだけ役 それは容易さ、速度、共同、実時間分析および一貫性を促進する。

現代のデータアーキテクチャは次のとおりです:

  1. エンドユーザーが消費するために構築されました。 クラウドを使用すると、エンドユーザーはビジネス上の意思決定に必要なデータを判断し、データアーキテクトは必要なデータアクセスを設計できます。
  2. データパイプラインとデータフローで自動化。 誰も遅いデータ処理を待つ時間がありません。 クラウドとデータの統合により、企業はデータ管理プロセス全体を自動化することができるため、データガバナンスを維持しながら、組織内で必要などこ データ統合は、全体のすべての部分が接続されていることを確認するための鍵です。
  3. 最新のエンタープライズデータアーキテクチャは、人工知能(AI)と機械学習(ML)の力を活用して、データ処理の自動化、新しいデータ型の認識、データの浄化、データ品質の問 AI/MLは、自動化の背後にあるスピードと精度の鍵です。
  4. データは驚異的な速度で生成され、消費され、企業が消費者の需要の変動に対処するにつれて、自動的かつ手頃な価格でデータを上下にスケールできる必
  5. 信頼できるコラボレーションのための共有可能。 共有データは、誰もが真実の同じデータソースから作業することを確実にするために重要です。 共有データは、部門のサイロを打破し、より簡単で信頼できるコラボレーションを促進するのにも役立ちます。
  6. ほとんどの企業にとって、データは最も価値のある資産です。 最新のデータアーキテクチャでは、データアクセスと承認を制御することでデータセキュリティを考慮し、GDPRやHIPAAなどのデータプライバシー法や規制の遵守も考慮

クラウドでデータアーキテクチャをゼロから作成する場合、これらの特性を構築するのは簡単です。 しかし、ほとんどの企業は、従来のオンプレミスインフラストラクチャとクラウドをまたいでおり、多くの場合、マルチクラウドを使用しています。 それらのデータは複数の場所に存在し、通常は大きくサイロ化されています。 クラウドへのデータ移行とデータ統合が優先されます。

最新のデータアーキテクチャの六つの特性に加えて、設計が次のことを容易にすることも必要です:

  • セルフサービスや複数のタイプのユーザー(インテグレーター、データサイエンティスト、ビジネスリーダー、利害関係者)への移行をサポート
  • は、ハイパーコネクテッドエンタープライズを可能にします(データは身体のあらゆる部分を結ぶ神経と考え、必要に応じてシームレスに情報を送信します)
  • リアルタイムの洞察、AI主導の勧告、および瞬間的な意思決定のための予測的および規範的分析にレポートをシフト
  • 新しいデータソース、ダウンストリームアプリケーション、およびユースケースの将来性

3 現代のデータの段階 エンタープライズジャーニー

企業はデジタル変換とクラウドへの移行を行っているため、通常は最新のデータアーキテクチャを達成するために段階的なジャーニーを経ます。

ステージ1—オンプレミス

大部分の企業にはオンプレミスのシステムがあり、ビッグデータセットを格納および処理し、複雑な変換を実行するツールがあ この環境は、次の理由で困難です:

  • 開始するには多額の設備投資が必要で、必要な人員には営業費用(OpEx)への多額の投資が必要です
  • ビッグデータツールを管理するための専門的で専用のスキ何十年もの間、通常はオンプレミスモデルに多額の投資をしています。 金融投資があるだけでなく、データを失ったり、カスタマイズされた統合を切断するリスクは、完全なクラウド移行には大きすぎる可能性があります。 多くの企業は、自分のサーバーの範囲にとどまる必要があると感じているデータを持っているので、ハイブリッドクラウドアプローチを

    ステージ2—クラウド: Virtual Private Cloud(VPC)

    クラウドを採用するにつれて、企業はオンプレミスのクラスターを仮想プライベートクラウドネットワークで実行されているクラウド-プロバイダに移動するだけで、低コストなどのIaaSの利点を利用できる”リフト-アンド-シフト”が第二段階となっている。 Forresterによると、クラウドに展開する組織は、ほとんどの場合、サーバーとストレージをオーバープロビジョンし、これらの環境を管理する必要があるため、オンプレミスインフラストラクチャのコストを20-60パーセント節約すると報告しています。

    しかし、この段階にはまだいくつかの大きな課題があります。:

    • 環境の管理と維持の課題に対処するために何もしません
    • は高いOpExを持っています
    • はスキルセットのギャップに対処せず、VPC
    • で実行されているサー3029>オンプレミスおよびプライベートクラウドの管理は複雑であり、多くの場合、企業はクラウド環境を管理するためのより良い方法を探すように これにより、マネージドクラウドサービスへの移行が可能になります。

      ステージ3—クラウド: サービスとしてのビッグデータ

      この段階で、企業は課題を認識し、IBM、Microsoft、Googleなどのクラウド管理サービスに移行することによってそれらに対処しています。 これらのマネージドサービスは、大規模な処理環境の管理と保守の複雑さから企業を解放し、貴重なOpEx支出を削減します。

      他の利点は下記のものを含んでいます:

      • ストレージとコンピューティングリソースを必要なときにのみ利用するオンデマンド機能により、OpEx
      • テラバイト/ペタバイトのボリュームにスケールアップ/ダウンするはるかに簡単な方法
      • ビジネスニーズに対する応答時間の高速化

      さらに、クラウド管理されたビッグデータプラットフォームは、クラウドストレージサービスで設計されています。 Cloud storageとネイティブに統合されているため、data lake storageに適した分散ストレージコンポーネントとしてcloud storageを使用できます。

      データストレージについて少し話しましょう。

      現代のデータアーキテクチャにはデータレイクが必要

      データウェアハウスには構造化データ(トランザクションシステムからのデータ)が格納されます。 これは、半/非構造化データではなく、リレーショナルデータを分析するために最適化されています。 したがって、データソースからデータウェアハウスに書き込む前に、構造を定義し、データをクリーンアップして変換する必要があります。 これには時間がかかり、企業が必要とする速度で使用可能なデータを取得することがより困難になります。 また、非常に多くの新しいデータが利用可能であるため、データウェアハウスのコストは実際には非常に法外です。

      データレイクは最新のデータアーキテクチャをサポートします。

      データウェアハウスとは異なり、データレイクは構造化、半構造化、非構造化のすべてのデータ型のコレクションです。 データは、構造やスキーマを必要とせずに生の形式で保存されます。 実際には、キャプチャ時にデータ構造を定義する必要はなく、読み取り時にのみ定義する必要があります。 データレイクは非常にスケーラブルであるため、より安価な価格で大量のデータをサポートします。 また、データレイクを使用すると、リレーショナルソース(リレーショナルデータベースなど)や非リレーショナルソース(IoTデバイス/マシン、ソーシャルメディアなど)から ETL(extract、transform、load)を使用しないと、データを分析に使用できなくなります。

      現代のエンタープライズデータアーキテクチャの4つの機能

      現代のエンタープライズデータアーキテクチャには、1)データサイクル、2)データストレージ、3)統合プラット

      データサイクル

      企業は常に新しいデータソースに遭遇し、最終的なユースケースを知る前にデータをキャプチャする必要があります。 キャプチャされたデータは、既知のユースケースを設定するために抽出されるだけでなく、将来の未定義のユースケースのために保持されます。 その後、インバウンドデータは、ビジネスニーズ、スキルセット、データアーキテクチャの理解にかかわらず、下流の消費者のガバナンス、品質、一貫性、規制コンプライアンス、および正確性を確保するために、企業基準に準拠する必要があります。 データが取得され、企業標準に準拠すると、refinement servicesは最終的なダウンストリームアプリケーションおよび/またはユースケースのためにデータを準備します。

      データストレージ

      データはデータレイクに格納されます。 データレイクを現代のデータファクトリと考え、レイク内にはさまざまな段階のデータ処理のための”コンテナ”があります。 最初のコンテナはランディングコンテナで、フォーム、トランスポート、またはソースに関係なく、インバウンド生データが受信されます。 これは、汚れたデータが行く場所です。 どの生データを保持するかについての決定はここで行われます。 保持されているデータは、適合したコンテナに移動されます。

      準拠したコンテナは、生データがクリーンアップされ、データ品質が保証される場所です。 Conformコンテナは、企業が標準に準拠した一貫性のあるデータセットを使用して作業していることを保証します。

      次に、最終的な配信目標のためにデータを準備する洗練されたコンテナがあり、ユースケースによっては精製所のサブセットがあるかもしれません。 データが洗練されると、データはその宛先に配信されるようにステージングされます。 配信後、データサイエンティストが使用するための作業領域に移動したり、長期保存のためにアーカイブしたり、削除したりすることができます。

      データ統合プラットフォーム

      統合プラットフォームは、異なるソースからデータを取得し、それらを組み合わせて統一されたビューを提供します。 最新のデータアーキテクチャでは、統合プラットフォームは、必要なすべてのデータソースとターゲット、およびデータサイクルの各段階を通じてデータサービスをサポー スキーマの有無にかかわらずデータをサポートし、メタデータを管理できる必要があります。 さらに、以下のために必要な統合と処理を処理できる必要があります。:

      • 高速、多様性、およびボリュームのデータキャプチャ
      • 低遅延アプリケーション統合
      • 大量のデータ適合処理
      • 配信からターゲットへのデータ統合
      • API消費(B2B)

      さらに、上記のシナリオは、高度に熟練したITプロフェッショナルから、急速に変化するビジネス環境に対応して、ビジネスプロジェクトのラインを加速する必要があるビジネスユーザーに至るまで、幅広いユーザーコミュニティにアクセスできるようにする必要があります。 現代の企業では、アナリストやデータ科学者は、戦略的な質問に答え、前例のないペースで革新のロックを解除するために呼び出されていると、単に批判的に必要な情報を利用できるようにするためにIT組織に依存しているの贅沢を持っていません。 セルフサービスはもはや贅沢か便利ではないが、今成果重視の条件である。 データパイプラインを迅速に構築できることは、デジタル時代に必要な速度でビジネスを移動させ続けるために不可欠です。

      データ配信

      最後に、データを適切なターゲットに配信する必要があります。 安全なデータアクセシビリティは、最新のデータアーキテクチャに不可欠です。 ガバナンス、セキュリティ、ロールベースのアクセス制御(RBAC)、SLA、調整、および使用状況分析は、社内の従業員または外部パートナーを問わず、目的のユーザーにデータを提

      サービスとしてのデータ配信アプローチを取る企業は、一定のIT火災訓練を犠牲にしたり、セキュリティや内部の知的財産を侵害することなく、最高レベルの可用性、アクセシビリティ、および顧客体験を保証します。 データは、データマート、アプリケーション、ファイル、データ池、データサイエンス作業台、AI対応ソリューション、APIエコシステムなど、最終的な宛先に配信されます。

      堅牢な最新のデータアーキテクチャを構築

      堅牢な最新のエンタープライズデータアーキテクチャは、企業がすべてのデータソースを最適化し、より良いビジネ SnapLogicは、intelligent integration platform as a serviceを介してデータ統合を提供し、企業がデータニーズを将来的に証明するための最新のデータアーキテクチャを構築するのを支援します。

Leave a Reply