Rozhovor: Nedostatek kapacity? Jednoduše kousek přidejte

„Tak jako se myšlenka virtualizace zrodila s přebytkem výkonu procesorů, ScaleIO se zrodilo z přebytků kapacity na discích. V řadě firem dnes narážejí na nedostatek kapacity v úložištích, přitom v serverech zbývají stovky gigabytů zcela bez užitku. A tohle může ScaleIO změnit,“ říká Jan Teuschel, hlavní systémový inženýr ze společnosti EMC.

Softwarově definovaná úložiště jsou na první pohled splněným snem administrátorů. Možnost navýšit kapacitu a výkon úložiště, kdykoli je to potřeba. A ještě k tomu využít disky, z nichž se obvykle využívá jen malá část kapacity. Když pak firma místo nákupu drahého diskového pole využije někdy už dosluhující hardware, může se stát ScaleIO splněným snem také finančního ředitele. A zájmy těchto dvou se nesetkávají v praxi úplně často. O tom, jak ScaleIO funguje, a co může jeho nasazení firmám přinést, jsme si povídali s Janem Teuschelem, hlavním systémovým inženýrem EMC.

Kde se vlastně ScaleIO vzalo? Proč se tradiční výrobce hardware, a zejména úložišť, rozhodl nabídnout zákazníkům něco, jako je ScaleIO, tedy čistě softwarové úložiště? Nejde tím proti svému byznysu?

Jan_TeuschelAč to může znít paradoxně, tak nejde. Trh úložišť se totiž mění, zákazníci prakticky ve všech oborech jsou pod velkým tlakem, zejména pokud jde o efektivitu a schopnost reagovat na přání svých klientů. EMC muselo této situaci vyjít vstříc. Přemýšleli jsme o tom, jak zákazníkům pomoci jednoduše škálovat kapacitu úložišť, a také efektivněji využívat jejich IT infrastrukturu, včetně disků, které používají. Je to vlastně docela jednoduché, před nějakou dobou zrodil nadbytek výkonu procesorů myšlenku virtualizace infrastruktury. A nadbytek kapacity v úložištích zase zrodil myšlenku softwarově definovaných úložišť, jakým je ScaleIO.

Je to tedy o čistě softwarový produkt, který dokáže vytvořit nové a relativně velmi výkonné úložiště z disků, které nebyly dosud téměř využívány nebo které už svým výkonem pomalu přestávají stačit. ScaleIO tak může v některých případech velmi výrazně prodloužit životnost hardware a tím i snížit celkové náklady na vlastnictví.

Přebytek kapacit na úložištích? Myslím, že celá řada administrátorů čelí přesně opačnému problému a neustále zápasí s nedostatkem kapacity v diskových polích. Takže co myslíte tím přebytkem kapacity?

Zápasí s nedostatkem rozumně využitelné kapacity, bychom měli spíše říct. A to je přesně to, oč jde. Objem dat v současnosti strmě roste a v řadě firem skutečně stojí před rozhodnutím, co dál. Protože jejich stávající diskové pole se již blíží ke svým limitům. Zároveň ale nákup nového úložiště je nemalá investice, která se nemusí vždy vyplatit. Zejména v okamžiku, kdy jsou zvýšené nároky na kapacitu pouze sezónní záležitostí. Na podobné požadavky finanční ředitelé jen velmi neradi slyší. Protože kapacita v diskových polích je stále poměrně drahá.

Zároveň ale víme, že ve firmách leží ladem relativně velké kapacity. Ty se ukrývají například v různých aplikačních serverech, kde se dnes celkem běžně používají disky s kapacitou vyšší než půl terabyte, a přitom servery reálně využívají jen malou část této kapacity. Koupit dnes serverové disky není žádný problém a jejich cena je – ve srovnání s diskovými poli – relativně nízká. A teď si uvědomme, že takových serverů můžeme mít ve firmě i desítky, což může znamenat i několik terabyte diskové kapacity ležící ladem. Přesně to je situace pro nasazení ScaleIO, to totiž umožní z těchto různých „zbytků“ poskládat softwarově definované diskové pole. Jeho vytvoření je navíc velmi snadné a rychlé, takže navýšit kapacitu v případě krátkodobého nárůstu požadavků na kapacitu lze – trochu nadneseně řečeno – pomocí pár kliků myší během několika minut. Jednoduše přiřadíte volnou kapacitu z některých dalších disků v síti.

A co potom pracovní stanice, nemohli bychom sebrat část kapacity uživatelům?

Technologicky by to samozřejmě možné bylo a mohli bychom vytvořit diskové pole z jednotlivých pracovních stanic. V praxi to ale není úplně dobrý nápad, zejména s ohledem na míru dostupnosti dat, kterou u diskových polí, i těch softwarových, potřebujeme. Proto nejsou ani ve ScaleIO desktopové systémy podporovány.

 

Mluvil jste o scaleio-opengraph_2dostupnosti dat. To je možná věc, která řadu IT specialistů zarazí. V diskových polích se používají extrémně spolehlivé – a také poměrně drahé – disky. A teď najednou říkáme, že bychom mohli postavit diskové pole z „obyčejných“ serverových disků? Nesnížíme tím spolehlivost celého řešení?

V tom je právě kouzlo ScaleIO, v možnosti volby. Ta neznamená jen možnost vybrat si mezi klasickým diskovým polem a tím softwarovým. ScaleIO je totiž konstruováno tak, aby zákazník či uživatel měl pod absolutní kontrolou svou infrastrukturu a nabízí celou řadu nastavení, které zajistí srovnatelnou úroveň dostupnosti a funkcionality jako u diskového pole. Jednou z nich je schopnost tak zvaného inteligentního převrstvování. Což v podstatě znamená, že ScaleIO umí automaticky vyhodnocovat jak rychlost a dostupnost jednotlivých disků či jejich částí, tak „popularitu“ jednotlivých dat. Takže přesouvá bez nutnosti jakéhokoli zásahu administrátora často využívaná data na rychlejší servery, a naopak ta, ke kterým uživatelé přistupují jen občas na pomalejší disky. Tím se výkon celého řešení dále zvyšuje. Zároveň ScaleIO automaticky vyrovnává zatížení jednotlivých bodů, které jej tvoří, tak aby byly vytížené přibližně stejně.

Takže obava, že ScaleIO je nějaké nouzové řešení, není opravdu na místě. Pokud je administrátor správně nastaví a má k dispozici i relativně výkonné komponenty, může postavit také výkonné řešení. Dokonce jeden z našich zákazníků nedávno testoval ScaleIO proti nejnovějšímu modelu běžného diskového pole a softwarově definované úložiště na bázi ScaleIO bylo ve všech parametrech výkonnější.

Přesto, výrobci disků nás učí, že každý typ disku má své použití. Většina firem už se snad odnaučila používat desktopové disky v serverech. A teď máme najednou začít používat serverové disky v diskových polích? Není to příliš velké riziko?

Není, protože to je opět faktor, se kterým architektura ScaleIO počítá. Pochopitelně je jasné, že spolehlivost takových disků může být menší. Proto jsou data vždy ukládána tak, aby i v případě havárie celého disku – nebo dokonce celé skupiny disků – uživatel prakticky nezaznamenal rozdíl. ScaleIO  ukládaná data rozděluje do tak zvaných chunků, Každý chunk přitom musí mít vždy jednu svou kopii. Takže pokud nějaký disk nebo server zhavaruje, případně nastane jiný problém v síti, pořád je zde další kopie. ScaleIO cluster okamžitě začne obnovovat původní stav se dvěma kopiemi. Takže uživatel nic nepozná, snad s výjimkou nějakých extrémních případů. Data má neustále k dispozici. To je mimochodem důvod, proč pro vytvoření ScaleIO úložiště potřebujeme minimálně tři různé servery (uzly).

Funguje to tak, že nejsou zrcadleny celé servery či disky, ale vždy jednotlivé chunky, přičemž kvůli bezpečnosti se používá RAID 1. Administrátor má zároveň možnost některé skupiny serverů označit jako tzv. failure domény. Na ně pak systém ukládá chunky vždy tak, aby jedna kopie byla v jedné failure doméně a druhá kopie v jiné failure doméně. Příkladem takové konfigurace může být rack plný serverů tvořících uzel ve ScaleIO clusteru, kde všechny servery jsou napájeny z jedné fáze. Pokud by vypadlo napájení pro tento rack, budou ztraceny všechny chunky. Proto se může takový rack označit jako failure doména, ScaleIO pak jednu kopii uloží do ní a druhou vždy zásadně mimo ní. Takže problém výpadku napájení je vyřešen. Těchto závislostí existuje více (síť, napájení, datové centrum) a při vhodném designu ScaleIO clusteru pak bude jeho odolnost vyšší než 99,999 %.

Jan_Teuschel_2

To ale znamená, že bych mohl teoreticky postavit diskové pole třeba z vyřazených aplikačních serverů?

Přesně tak, dokonce lze použít i vyřazená disková pole, která jednoduše přidáme do ScaleIO clusteru. Pokud totiž přestane třeba aplikační server stačit svým výpočetním výkonem, musí ho firma nahradit. Tento upgrade je dnes, vzhledem k rychle rostoucím nárokům na výkon, poměrně častý. Přitom ale například obsluhu disků zvládne tento server stále bez nejmenších problémů.

Takže místo aby firma tento server vyhodila, jednoduše si z něj udělá s pomocí ScaleIO diskové pole a získá další kapacitu vlastně zadarmo. Životnost hardware se tak samozřejmě významně prodlouží, a tím se nezanedbatelně sníží celkové náklady na vlastnictví (TCO), což je pro většinu firem klíčový parametr.

Paradoxně tak může firma inovovat servery mnohem častěji než dříve. Zatímco nyní třeba kupuje servery jednou za 5 let, podle investičního plánu, a poslední dva roky již běží na hraně výkonu, nyní může nový server koupit už za tři roky a starý zařadit do ScaleIO clusteru. Tam bude dále dobře sloužit a firma bude mít k dispozici i aktuální aplikační hardware. To jí může poskytnout důležitou konkurenční výhodu na trhu.

Takže opravdu je to tak, jak jsme říkali na začátku. IT oddělení má k dispozici novější i výkonnější hardware než dříve a nebojuje již s nedostatkem kapacity v úložištích. A finanční oddělení? To sleduje klesající TCO a efektivitu využívání hardware. Jako třešinku na dortu k tomu máme ještě spokojené uživatele, kterým vše funguje, jak má!

Napsat komentář

Vaše emailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *