technologia

Przechowywanie danych w chmurze

Dane coraz częściej przechowujemy w chmurze, jednak nie każdy wie, że można je magazynować na różne sposoby. Co więcej, wybór odpowiedniej architektury może wpłynąć na przebieg procesów biznesowych. Jakie rozwiązania mamy do wyboru? Czym są block storage i object storage?

Tradycyjne przechowywanie danych

Za standardowy format przechowywania danych uznaje się zapis plikowy. Termin ten może wprawdzie brzmieć niejasno, ale właściwie każdy z nas korzysta z tradycyjnego przechowywania danych, chociaż nie wszyscy wiedzą, że tak się ten system nazywa. Na czym polega?

Zapis plikowy można porównać do przechowywanie książek w wielkiej bibliotece. Aby znaleźć pojedynczą pozycję, musimy znać drogę do niej (dział, regał, półka). Przed podobnym wyzwaniem stoi komputer, który przechowuje dane tradycyjnie. Gromadzi on pojedyncze dane w folderach, do których musi znać ścieżkę, aby uruchomić konkretne pliki.

Dane przechowywane w systemie plikowym są uporządkowane i ułożone w sposób hierarchiczny. W tym systemie wszystko "zdaje się być na swoim miejscu". Z tego też powodu pamięć file storage bywa nazywana po prostu pamięcią hierarchiczną. Korzystasz z niej za każdym razem, gdy uzyskujesz dostęp do dokumentów zapisanych na swoim komputerze. Aby uruchomić jakiś plik, otwierasz jeden folder, drugi folder, trzeci folder… aż w końcu znajdujesz to, czego szukasz.

Niestety, tradycyjne przechowywanie danych, chociaż łatwe w nawigacji, ma swoje ograniczenia. Aby zwiększyć pojemność systemu plikowego, trzeba dodać nową przestrzeń dyskową. Nie ma tutaj mowy o skalowalności, jaką zapewnia przechowywanie danych w chmurze.

Przechowywanie danych w chmurze

Chmura obliczeniowa ma wiele zastosowań, a jednym z nich jest właśnie przechowywanie danych. To rozwiązanie, które wyróżnia się trzema zasadniczymi cechami.

  • Dostęp na żądanie – korzystanie z rozwiązań chmurowych, w tym z przechowywania danych, odbywa się na żądanie. Użytkownik uzyskuje dostęp do danych na swoich zasadach. Może to zrobić z każdego miejsca na świecie, o ile jest połączony z siecią.
  • Wirtualizacja – chmura nie wymaga inwestycji we własne systemy. Wszystkie zasoby są wirtualne, dzięki czemu zarządzanie big data przebiega sprawnie i szybko.
  • Skalowalność – zasoby w chmurze są w pełni skalowalne, co oznacza, że użytkownik może w każdej chwili zwiększyć przestrzeń dyskową. Płaci za wykorzystaną moc.

Chmura obliczeniowa dostępna jest w trzech modelach: publicznym, prywatnym i hybrydowym. Więcej przeczytasz o nich w sekcji wiedza na naszym blogu.

W tym artykule skupimy się natomiast na formatach przechowywania chmurowego. System może magazynować dane jako pliki, bloki lub obiekty. Jak przechowywane są pliki, już wiesz. Pozostałe dwie opcje, block storage i object storage, wymagają szerszego omówienia.

Co to jest block storage?

Przechowywanie danych w sposób blokowy polega na podzieleniu porcji danych o dowolnej wielkości na poszczególne bloki danych o ustandaryzowanej wielkości (np. 4KB lub 8KB) . Bloki te przechowywane są jako osobne elementy na dyskach; mają własny identyfikator, dzięki któremu system operacyjny może umieszczać pojedyncze bloki danych składające się na cały plik w najlepszych dla nich środowisku.

Chociaż dane przechowywane blokowo są odseparowane od siebie, użytkownik może w każdej chwili złożyć bloki w całość za pomocą odpowiedniego oprogramowania – zwykle wyspecjalizowanego do bezpośredniej obsługi danych blokowych – np. bazy danych.

W odróżnieniu od file storage do danych nie prowadzi tylko jedna możliwa ścieżka. Zwykle nie jest też możliwe odczytanie tak zapisanych danych za pomocą popularnych narzędzi wbudowanych w desktopowe systemy operacyjne.

Block storage sprawdza się najlepiej w przedsiębiorstwach przeprowadzających duże transakcje i tych z ogromnymi bazami danych. Niestety, blokowa pamięć ma też swoje wady. Cechuje się ograniczoną zdolnością do obsługi metadanych (czyli informacji o danych), przez co może wymagać wdrożenia dodatkowych rozwiązań.

Co to jest object storage?

Dane przechowywane w architekturze object storage dzielone są na części, tzw. obiekty. Nie magazynuje się ich w formie plików w folderach lub bloków na serwerach. Wręcz przeciwnie – obiekty są przechowywane w jednym miejscu, w płaskiej przestrzeni adresowej.

Pamięć obiektowa łączy fragmenty danych (obiekty), które następnie tworzą plik. Do niego dodawane są wszystkie metadane oraz unikalny identyfikator. System pamięci masowej pobiera dane właśnie na podstawie tych informacji. Dla użytkownika, który ma możliwość zdefiniowania metadanych, oznacza to tyle, że zyskuje większą kontrolę nad danymi i efektywniej przeprowadza analizę ich wykorzystania, również bardzo niestandardową. Wyraźnie inny jest też sposób dostępu do danych obiektowych – zwykle jest to protokół HTTP lub interfejsy programistycznie (tzw. API) dostępne w sieci internetowej.

Storage obiektowy zapewnia pełną skalowalność, a dzięki płaskiej strukturze sprawdza się w obsłudze bardzo dużych ilości danych. Z tego powodu object storage szczególnie cenią sobie firmy świadczące usługi przechowywania. Korzysta z nich na przykład nasz klient, serwis Fotosik.

Niemniej, pamięć obiektowa ma swoje wady. Jest wolniejsza od block storage, więc nie sprawdzi się tam, gdzie dostęp do danych powinien być natychmiastowy, np. w systemach finansowych. Należy też pamiętać, że obiekty przechowywane w niej, nie mogą być modyfikowane.

Podsumowanie

Przed podjęciem decyzji o skorzystaniu z usług chmurowych warto zastanowić się, jaki format przechowywania danych przyniesie Twojej firmie najwięcej korzyści. Aby tak się stało, warto znać różnice między file storage, block storage oraz object storage.

File storage jest najbardziej zhierarchizowany, przez co łatwy w nawigacji, jednak ma ograniczoną pojemność. Block storage dzieli dane na bloki, które przechowywane są w sposób umożliwiając ich szybkie przetwarzanie – ale wymaga specjalizowanego oprogramowania. Object storage zapewnia natomiast dużą kontrolę nad danymi i udostępnia wirtualnie nieograniczoną przestrzeń na dane, wraz z wygodnym interfejsem dostępu do danych. Dzięki zrozumieniu tych różnic można wybrać możliwie najlepszy sposób przechowywania danych dla Twojego biznesu.