テクノロジ系 / データベース
データレイク
データレイクは、さまざまな形式のデータを加工せず、そのままの形で大量にためておく保管場所です。
もう少し詳しく
構造化データ(表形式)も非構造化データ(画像・文書・ログなど)も、形式を問わずそのまま蓄積できるのが特長です。用途を後から決められる柔軟さがあります。あらかじめ整理・加工してためるデータウェアハウスと対比され、「とりあえず生のまま貯める」のがデータレイクと整理できます。
試験での見方
例:センサーのログや画像を加工せずそのままため、後から分析用途に応じて活用します。
データウェアハウス(整形後に蓄積)との違いが頻出です。「生データをそのまま大量に貯める」点を押さえましょう。