Daar zit je dan, je ziet de data dagelijks groeien, back-up vensters kruipen naar de 24-uur, de enorme nachtelijke data bewegingen verstoppen het netwerk als aderverkalking in een kransslagader. De nieuwe aanvraag voor 5 terrabyte ligt bovenop de aanvraag van 7 terrabyte. Hoe gaan we aan de business uitleggen dan we weer een storage-uitbreiding nodig hebben terwijl de vorige uitbreiding van 7,5 ton nog maar 7 maanden geleden was. Hoe gaan we uitleggen dat we weer tonnen aan storage en toebehoren nodig hebben om de datagroei binnen het bedrijf op te vangen? Hoelang kunnen we met deze nieuwe investering eigenlijk de datagroei te lijf? Hoe ziet de groeiprognose er eigenlijk uit voor de komende twee à drie jaar? Is deze investering eigenlijk wel nodig, wat als we ongebruikte data verwijderen? Redden we het dan wel? En waarom back-uppen we nu eigenlijk alles, is dat echt nodig?
onze groei, 100 Terrabyte in 8 mnd
Data groeit exponentieel 25% p/jr "There was 5 exabytes of information created between the dawn of civilization through 2003, that much information is now created every 2 days, and the pace is increasing ... Eric Schmidt CEO Google
Virtual Servers fueling the wildfire
wat betekent data voor CZ CZ is een informatie gedreven organisatie naast de relatie met de klant en onze kennis over de processen van zorgverzekeren, is data onze meest waardevolle asset
de algemeen heersende opinie we hebben teveel data en datagroei we spenderen teveel aan storage en backup er kan veel data weg omdat het dubbel is, onnodig is, of oud is.
waarom is controle zo moeilijk? onze data heeft onduidelijke waarde omdat we niet precies weten wat de waarde is, weten we niet hoeveel tijd en geld we moeten investeren in classificatie, opslag, management en backup. de waarde is subjectief wie bepaalt wat weg mag, hoe lang het bewaard moet blijven, hoeveel kopieën ervan moeten zijn. het bepalen van de waarde is een moeizaam multidisciplinair proces, capaciteit uitbreiden is de weg van de minste weerstand
gedeelde verantwoordelijkheid twee partijen: partij die de data genereert en consumeert partij verantwoordelijk voor opslag en bescherming werkzaam in compleet gescheiden afdelingen met verschillende doelen, missie en prioriteiten
data & informatie IB/TAB beheert de data de business is eigenaar van & beheert de informatie Data wordt informatie zodra het door mensen in context geplaatst en geïnterpreteerd kan worden.
onbegrip laag bewustzijn van kosten die gepaard gaan met het beheer en management van de data. weinig inzicht in deze kosten. opties en keuzes zijn onvoldoende transparant en leiden tot inefficiënt gebruik van resources. IT budget en human resources staan onder druk. onbeantwoorde vraag : wiens data/informatie is het nu eigenlijk? ICT behandelt alle data gelijkwaardig (full backup & gold level) data verwijderen is definitief en onomkeerbaar, wie neemt de beslissing, data kan in een nieuwe context weer nieuwe waarde krijgen (data analysis)
de realiteit data groeit exponentieel, niet lineair (80% van alle data is gegenereerd in de laatste 2 jaar) opslag wordt goedkoper, nieuwe technieken als deduplicatie en thin provisioning maken opslag efficiënter, maar vraag blijft beschikbare capaciteit overstijgen technologie is niet de Haarlemmer olie voor kosten beheersing
Data management omvat governance, risk & compliance architectuur, analyse & design database management security (access, encryption, vernietiging, diefstal) kwaliteit (opschoning, integriteit, verrijking) tiering & archivering data warehousing & BI (datamarts, mining, golden records) ECM content & records management metadata BCP
Information Lifecycle Management “ILM omvat het samenspel van beleid, processen, praktijken en tooling toegepast om bedrijfswaarde van informatie af te stemmen op de best passende en meest kosten effectieve IT-infrastructuur, vanaf het moment dat informatie wordt gevormd tot en met haar definitieve verwijdering. De informatie is afgestemd op de business eisen met behulp van policies en service levels in samenhang met alle toepassingen, metadata en gegevens.”
Informatie De business is eigenaar van de informatie. Informatie is opgeslagen op basis van business eisen. De waarde van informatie kan veranderen met de tijd, waarde wordt regelmatig opnieuw geëvalueerd. De eisen tav informatie zijn helder, goed gecommuniceerd en worden regelmatig geëvalueerd
Leeftijd en gebruik van data
Information Lifecycle Management storage hardware storage virtualisatie SAN Beheer storage resource beheer Service Level Monitoring SLA / OLA beheer Information Lifecycle Management
3 onderdelen van een ILM strategie Een ILM strategie omvat minimaal deze 3 aandachtsgebieden: Data lifecycle management infrastructuur Behandelt de infrastructuur die helpt bij het vaststellen van de juiste opslag categorie, performance, replicatie, backup levels etc. Deze infrastructuur levert ILM en helpt bij de vermindering van de totale kosten van data & informatie opslag Security Security is essentieel in het kader van naleving van regel en wetgeving (GRC), beperkte toegang tot gevoelige informatie beperkt de risico’s. Wie heeft toegang? Hoe wordt je identiteit gecontroleerd. Hoe is de informatie beschermd? Integratie Beschrijft en realiseert de integratie van applicaties met de fysieke Data Lifecycle Management infrastructuur. Er bestaat geen complete single vendor oplossing die kan voldoen aan alle specifieke informatie eisen van CZ, samenwerking tussen verschillende leverancier tbv een goede integrale oplossing is essentieel.
Storage Tiering, wat heb je nodig Stakeholders bepalen de behoeften. Bepaal hoeveel tiers je echt nodig hebt, hoe minder hoe beter. Bepaal hoe je de tiers technologisch levert. Bepaal de behoeften binnen elke tier tav de lifecycle van de data.
Classificatie van data Vanuit het datacenter perspectief is de informatie van de CZ business slechts DATA IT managed alleen de DATA: files, volumes, bits & bytes Informatie is data in context geplaatst : business beslissingen zijn gebaseerd op informatie Nauwe samenwerking met de business is nodig om goed te bepalen wat de service behoeften zijn Met behulp van de geïnventariseerde behoeften kun je een SLA opstellen Business Informatie stakeholders: Applicatie performance, beschikbaarheid , restore-baarheid Response tijden eindgebruiker, waarde bepaling van de data Kosten van opslag, kopieën, bescherming, retentie, backup, groei Organisatie informatie stakeholders: Security officer :versleuteling ,vertrouwelijkheid, beschikbaarheid Records Manager: bewaar termijnen,... Compliance officer: autorisatie,retentie,... Classificatie proces schept de voorwaarden om onderstaande te realiseren: Opstellen van een service catalogus Opstellen van data classificatie policies Afstemmen van de data op de juiste tier gebaseerd op de overeengekomen requirements
voorbeeld van een storage catalogus
ILM maturity Initial Repeatable Defined & measured Quantatitivaly managed Optimizing -no storage service strategy -no service lifecycle -no metrics -no SLA -introduction of service design proces & functions -event/fault monitoring -manual configuration -some reporting -storage service catalog -service level transition -capacity management -ILM reporting -all storage classes in CMDB -config & asset mngmt -tools -processes -highly automated strategy defined design of proces & function transistion to service service operation full service lifecycle
Next Steps workshop met IT & business stakeholders start met awareness, who’s data is it? creëer transparantie in tco/abc en mogelijkheden inventariseer behoeften