;

Michal Řehák, Ness: Data dnes nepotřebná mohou být užitečná v budoucnu

28. 1. 2013
Doba čtení: 6 minut

Sdílet

Autor: © vege - Fotolia.com
Na téma velkých dat a BI jsme si povídali s Michalem Řehákem, senior consultantem ve společnosti Ness Czech.

CIO Business World: Společnosti jsou dnes zatíženy záplavou nejrůznějších dat z vnitřních i vnějších zdrojů. Jak oddělit zrno od plev tak, aby se růst nákladů na datové úložiště když ne zastavil, tak alespoň zpomalil? Lze vůbec v záplavě dat efektivně selektovat ta kvalitní ještě před tím, než jsou vůbec uložena?

Michal Řehák: V současné době není možné jednoznačně určit, která data má smysl ukládat a dále analyticky zpracovávat. Data z dnešního pohledu nepotřebná, mohou být užitečná v budoucnu. Na druhou stranu samotné ukládání již díky klesajícím cenám stále výkonnějšího hardware není nejnákladnější položkou v procesu naplňování datových potřeb společnosti.

Výrazně vyšší náklady generují procesy zpracování (transformace) a konsolidace dat ze zdrojů do podoby vhodné k jejich smysluplné uživatelské interpretaci, a to při zachování všech metodických standardů. Již při zadávání požadavků na data je proto důležité rozhodnout, která data ukládat levně bez sofistikovaných transformací, případně s nižšími nároky na metodiku či datovou kvalitu, a u kterých se vyplatí investovat do „high-tech“ zpracování.

Vhodným nástrojem pro tuto selekci jsou různé formy prototypingu, kde lze natolik zpřesnit zadání, že na jeho základě budou nákladně ukládána pouze kvalitní a přínosná data.

Studie IDC ukazuje, že společnosti reálně potřebují pouze 15 % dat, která v reálu ukládají. Jakým způsobem je možné tuto statistiku zvrátit?

Michal Řehák, NessUvedenou statistiku lze interpretovat více způsoby. Můj pohled na ni je, že společnosti využívají 85 % dat pouze velmi zřídka. Pokud je jasně definován jejich business přínos, není ještě minimální využívání samo o sobě důvodem k neukládání takových dat.

Klíčovým faktorem k vyššímu upotřebení dat je efektivní řízení požadavků na datové služby. Znamená to, že v souladu se strategií společnosti jsou realizovány primárně požadavky, jejichž reálné využití je předem zřejmé.

Existují kromě deduplikace i další způsoby, jak snižovat extrémní objemy ukládaných dat?

Kromě běžných technik, jako ukládání dat v některé z normálových forem nebo výběr vhodného přístupu k historizaci, je možné využít i další přístupy ke snižování objemu uložených dat. Podíváme-li se na data z hlediska jejich stáří, je výhodné přesunovat stará a již minimálně používaná data na levnější datová úložiště, či zcela odmazávat. Tato technika je nazývána v odborné literatuře Data Agying a mezi její další pozitiva patří i vyšší odezva uživatelských přístupů k novějším datům. Za čistě technologický způsob snížení objemu uložených dat lze považovat datovou kompresi, která je dnes integrována ve většině databázových řešení.

Průzkumy ukazují, že společnosti, které se důsledně zabývají datovou analytikou, mohou nad konkurencí získat zajímavé konkurenční výhody. Předpokládejme, že podnik zatím žádnou pokročilejší analytiku neprovádí. Jak by měl celý projekt systémově uchopit tak, aby získal maximální přínosy?

Celý projekt musí být vždy v souladu se strategií společnosti. Na základě strategie je zásadní nastavení hlavních cílů, jakých má být v rámci projektu dosaženo. V neposlední řadě nelze opominout zvážení zdrojů, které má společnost k dispozici pro dosažení uvedených cílů. Pokud jsou dostupné zdroje (včetně lidských) slabší než nastavená očekávání, nelze očekávat úspěšný výsledek.

Maximální přínosy lze získat postupnými realizačními kroky - od jednoduchých reportů až po složité analytické modely. Pro každý krok musí být před jeho realizací nastaveny kromě akceptačních kritérií i jeho jasné přínosy, které budou vždy po dokončení kroku vyhodnoceny. Rozsah jednotlivých kroků nesmí přesáhnout uchopitelnou mez pro  všechny účastníky projektu. Proto je vhodné upřednostňovat spíše menší ucelené kroky (quick-win) před realizací rozsáhlé a nepřesně specifikované datové oblasti.

Jaké typy podniků mohou od BI očekávat největší přínosy a kde půjde naopak spíše o plýtvání penězi?

Největší a dlouhodobé přínosy od BI lze očekávat ve firmách s jasnou vizí a podporou vedení v této oblasti. Téměř okamžité a nepříliš nákladné zlepšení je rovněž typické u firem, které zatím s BI nezačaly, protože i jednoduché reporty mohou posunout řízení společnosti na vyšší úroveň. Mezi perspektivní odvětví bych v ČR kromě tradičního finančního a telekomunikačního sektoru zařadil zdravotnictví a energetiku, kde vidím velký potenciál pro analýzu sbíraných dat.

Plýtvání prostředky sleduji dnes ve společnostech, kde jsou zaváděny BI řešení bez jednoznačných a předem definovaných přínosů.

V souvislosti s termínem big data se často hovoří o tom, že jde pouze o nový, marketingově atraktivní název pro dávno používané technologie. Existují kromě možnosti paralelizace úloh i další vodítka, jak poznat skutečně inovativní řešení pro zpracování dat?

Na skutečně inovativní řešení si ještě budeme muset nějakou dobu počkat. Nicméně současné trendy jako big data, cloud či mobility jdou ruku v ruce s technologickým pokrokem a nově tak umožňují oprášit dřívější obtížně realizovatelné myšlenky. Inovativní řešení by mělo přinést zcela jiný, revoluční pohled na zpracovávání dat. Myslím, že budoucnost je v postupném odbourávání současných technologických bariér (výkon při transformaci, diskový prostor, apod.) a přiblížení tak datového zpracování pohledu běžného uživatele.

bitcoin školení listopad 24

Velmi zajímavé výsledky přináší trend in-memory computingu, tedy rychlého zpracování obrovských objemů dat přímo v paměti serverů. Toto řešení se však zatím zdá být finančně obtížně dostupné. Přijde někdy doba, kdy se z něj stane mainstream?

Je zřejmé, že se snižováním cen pamětí vše směřuje k tomu, aby se z in-memory computingu stal základní stavební kámen většiny BI řešení. V této oblasti se nicméně necítím být odborníkem. Když se však zamyslím například nad osudem CD nosičů, nezbývá mi než pouze provokativně nadnést čtenáři otázku, jak dlouhá to bude doba, než přijde nový trend?