Bits&Chips

Energie besparen in datacentra

Auteur: Björn Postema en Boudewijn Haverkort
20 november 2015 

Het aantal datacentra op de wereld neemt enorm toe, en daarmee het energieverbruik. Björn Postema en Boudewijn Haverkort beschrijven de modelgebaseerde aanpak waar de UT aan werkt om tijdens de ontwerpfase inzicht te krijgen in het verbruik en de prestaties van die serverparken.

Wereldwijd neemt het stroomverbruik van datacentra enorm toe. In 2012 en 2013 consumeerden zij naar schatting circa 350 TWh per jaar (Figuur 1) - voldoende om honderd miljoen huishoudens een jaar lang van stroom te voorzien. Volgens het CBS merkt ook Nederland een forse toename in de energieconsumptie: van 2010 tot 2013 steeg die alleen al in Amsterdam met zestien procent, voornamelijk te wijten aan bestaande en nieuwe datacentra. Het geplande datacentrum van Google in Eemshaven zal straks evenveel energie verbruiken als vierhonderdduizend huishoudens.

Figuur 1: Wereldwijd verbruikten datacentra in 2012 en 2013 naar schatting 40 GW x 365 dagen x 24 uur = circa 350 TWh per jaar. Bron: Datacenterdynamics (DCD) Intelligence Study 2014

De landelijke en wereldwijde toename in stroomverbruik bij datacentra maakt veel vragen los. Kunnen de serverparken zuiniger? Zo ja, op welke energiemaatregel moeten we ons richten? Deze vragen zijn niet eenvoudig te beantwoorden vanwege de grote hoeveelheid factoren waarmee we rekening moeten houden.

In datacentra is niet alleen het energieverbruik van belang; vooropstaan de applicatie-eisen van klanten, vaak vastgelegd in een service-level agreement (sla). Deze eisen hebben betrekking op beschikbaarheid, schaalbaarheid, flexibiliteit, veiligheid en prestaties. Allemaal hebben ze hun weerslag op de configuratie van de datacentra: de infrastructuur, de serverarchitectuur, de netwerktopologie, maar ook de componenten die nodig zijn om alle servers te voorzien van stroom en koeling.

Aangezien stroomlevering aan servers niet volledig efficiënt is en koeling relatief veel energie kost, hebben datacentra veel extra energie nodig. In het gunstigste geval hangt deze hoeveelheid lineair af van het verbruik van de servers (het zogenaamde cascade-effect) - de literatuur noemt factoren van 1,5 tot 2,5. Besparingsmaatregelen op serverniveau hebben hierdoor een meervoudig effect op de totale energieconsumptie van datacentra.

Passende strategie

Aan de Universiteit Twente ontwikkelen we (interactieve) modellen waarmee een datacentrumconfiguratie eenvoudig is te beschrijven en waarbinnen energiemaatregelen eenvoudig zijn te ‘implementeren’. Dit project is onderdeel van STW’s Perspectief-programma ‘Robust design of cyber-physical systems’. De focus ligt op maatregelen op serverniveau.

Een voorbeeld van zo’n maatregel is dynamisch powermanagement. Dit biedt de mogelijkheid om servers in toestanden te zetten met lager stroomverbruik, waarbij je nog wel moet waarborgen dat je voldoet aan sla’s. Hiervoor moet je een strategie opstellen voor wanneer je wisselt tussen de verschillende toestanden, bijvoorbeeld op basis van de recente gebruikshistorie van servers. Dynamisch powermanagement wordt toegepast bij serverclusters of -groepen die regelmatig een periode hebben met inactieve machines. Na een time-out gaan de systemen in slaapstand. Doe je dit te snel, dan ben je extra tijd en energie kwijt om ze weer aan te zetten; doe je het te laat, dan ben je onnodig energie kwijt om ze wakker te houden. Met de ontwikkelde modellen is de juiste trade-off te vinden.

Andere energiemaatregelen die we bestuderen, zijn virtualisatie en dynamic voltage and frequency scaling (dvfs). Virtualisatie geeft de mogelijkheid om meerdere volledig functionerende virtuele machines te activeren op één fysiek systeem. Dit wordt vaak toegepast wanneer er meerdere servers zijn die matig actief zijn, waarbij met virtualisatie het aantal machines, en daarmee het energieverbruik, drastisch is te verlagen.

Dvfs is een techniek om de frequentie van processoren in servers automatisch aan te passen om energie te besparen of hitteproductie te reduceren. Ook hier speelt de keuze van een passende strategie een belangrijke rol, te meer omdat de werklast vooraf onbekend is. Om die onzekerheid mee te nemen, maken we gebruik van stochastische modellen.

Responstijdverhogend

Gegeven een datacentrumconfiguratie en een (stochastische) werklast kunnen we met de modellen een schatting maken van het energieverbruik, de serverbelasting en de responstijden. Aan de ene kant berekenen we gemiddelden om effecten op de langere termijn te observeren. Aan de andere kant maken we een reeks momentopnames om ook kortetermijneffecten van de strategieën on-the-fly te kunnen bestuderen.

De modellen hebben we uitgewerkt tot een interactieve simulatieomgeving, ontwikkeld met behulp van de Anylogic-toolset. Hiermee zijn eenvoudige zogeheten discrete event- en agent-based modellen te combineren. Agent-based modellen maken het mogelijk het gedrag van afzonderlijke servers in een populatie te definiëren om uiteindelijk inzicht te verkrijgen in het globale effect van het hele machinepark. Hierdoor kunnen we voor ieder type server een specifiek model definiëren.

Figuur 2: Dashboard van de interactieve simulatietool, met midden boven en geheel rechts de verschillende configuratie-instellingen (zowel numerieke waardes als diverse sliders en opties), linksboven het verloop van de power-states van de servers in de tijd, daaronder de gemeten responstijden (groen) en de empirische distributie daarvan, midden en midden onder het energieverbruik (blauw) in de tijd en de distributie daarvan.

In de eenvoudigste setting vormt elke server een queueing model, dat taken ontvangt en in een buffer plaatst tot ze aan de beurt zijn om te worden afgehandeld. Voor serverclusters zijn ze met een load balancer te verdelen over meerdere machines. Het interactieve dashboard stelt de gebruiker in staat een datacentrum te configureren, een powermanagementstrategie te kiezen en de gevolgen daarvan te bestuderen (Figuur 2).

Als voorbeeld stellen we een cluster van tweehonderd servers voor waarbij gemiddeld 33 procent van alle machines bezig is met taken verwerken en de overige systemen niks doen. Met dynamisch powermanagement zijn overbodige servers automatisch in een slaapstand te zetten. Wanneer we dat te vaak doen, verliest het cluster performance; de machines worden steeds in slaapstand gezet en wakker gemaakt, wat vaak responstijdverhogend werkt en energie kost (voor het herstarten). Het interessante gebied ligt daar waar we energiewinst behalen ten koste van responstijd mits deze acceptabel blijft. Als de sla bijvoorbeeld een responstijd eist van maximaal 25 seconden, kunnen we het energieverbruik met vijftig procent verlagen ten opzichte van de situatie waarin alle servers aan blijven.

Koelingsaspecten

Een belangrijke stap in het ontwikkelproces van de simulatietool is validatie om vast te stellen of de modellen realistisch zijn. Zo willen we helder krijgen waar we details moeten toevoegen om een betere voorspellende waarde te krijgen. In samenwerking met projectpartner Target Holding (die servers heeft staan bij het Centrum voor Informatietechnologie in Groningen) gaan we de modellen valideren en verbeteren. Als onderdeel van de validatie werken we, samen met studenten, ook aan een minidatacentrum op basis van Raspberry Pi’s.

Ten slotte zullen we de modellen verfijnen voor de (fysieke) koelingsaspecten. Dat doen we in samenwerking met de Rijksuniversiteit Groningen, een andere projectpartner. Voornamelijk de plaatsing van servers in de ruimte, de positionering van aan- en afvoeren voor koude lucht en de daarvan afhankelijke luchtstromen zijn van belang voor een goede en effectieve temperatuurbeheersing, en daarmee voor de effectiviteit van energiebesparende maatregelen.

Boudewijn Haverkort is hoogleraar ontwerp en analyse van communicatiesystemen aan de Universiteit Twente. Onder zijn leiding analyseert Björn Postema het energieverbruik en de prestaties van datacentra. Dit promotieonderzoek kadert binnen STW’s Perspectief-programma ‘Robust design of cyber-physical systems’.

Redactie Nieke Roos

Abonneer direct op onze nieuwsbrief

abonneren

Introduction to sysML

22 mei

Eindhoven

Introduction to sysML

22 mei

Eindhoven

Power integrity for product designers

24 mei - 25 mei

Eindhoven