開発

データレイク

読み方: データレイク

データレイク とは

構造化・非構造化を問わずあらゆる形式の生データを大規模に格納するストレージリポジトリ。処理・変換・スキーマ定義を後回しにして「とりあえず溜める」設計が特徴。AWS S3・Azure Data Lake Storage・Google Cloud Storageが代表的。ML学習データの蓄積基盤として重要。
用語集一覧に戻る