Data lake

Data lake je centrální úložiště, které bylo v podstatě navrženo tak, aby ukládalo jakýkoliv typ dat. Data jsou často v nezpracovaném raw formátu. Může to být video, obrázek, dokument, graf, prostě cokoliv, co byste chtěli vložit do databáze nebo nějakým způsobem uložit. Při ukládání dat je data lake spojuje s identifikátory a tagy metadat pro rychlejší načítání.

Existuje mnoho způsobů, jak použít data lakes. Můžete používat všechna strukturovaná i nestrukturovaná data a vytvářet modely, aby je šlo použít v jejich nezpracované podobě. Pokud tato data však chcete použít pro analytické a reportovací účely je potřeba data vyčistit a uložit do databáze či datového skladu. V tomto ohledu dává smysl využívat data lake hlavně v oblasti machine learning a AI, kteří z něj vytěží nejvíce.

Data lakes jsou obvykle seskupována na clusteru levného a škálovatelného komoditního hardwaru.To umožňuje ukládání dat do data lake pro případ, že by je později bylo potřeba, aniž byste se museli starat o kapacitu úložiště. Clustery mohou existovat buď lokálně či v cloudu.

Občas lidé zaměňují Data lake s data warehouse, ale mezi sebou mají mnoho rozdílů, které mohou poskytnout velké výhody pokud si firma zvolí správně – obzvláště když big data a procesy big dat stále migrují z lokálních úložišť do cloudu.

Pokud využíváte data lake pouze k zaznamenávání transakcí, měli byste přejít na databázi. Na druhou stranu, pokud máte velké množství dat, kterých je příliš mnoho na to, aby je vaše databáze zvládla, měli byste zvážit integraci datového skladu. A v poslední řadě, pokud máte všechna tato data, se kterými si nevíte rady, jsou nestrukturovaná či polostrukturovaná, nevejdou se do databáze, pak bychom Vám doporučili data lake.

Pokud si stále nevíte rady a chtěli byste Vaše otázky prodiskutovat, napište nám a rádi se s Vámi spojíme.

Scroll to Top