Ocena wpływu routerów na środowisko w świecie rzeczywistym

Kobieta Technologia

Dane dotyczące mocy urządzeń sieciowych są często trudne do zrozumienia. Nie zawsze jest jasne, czy podawana jest moc układu, karty czy systemu, i jakie warunki wykorzystano do oceny. Jeśli zamierzamy dążyć do tego, aby routery i przełączniki były bardziej energooszczędne, musimy zrozumieć, co to naprawdę oznacza.

Zróbmy krok do tyłu i zastanówmy się nad lepszym sposobem rejestrowania wyników. Moim zdaniem – i miejmy nadzieję, że wkrótce również waszym – są to: dzienne zużycie energii przez system oraz moc dostarczana (liczba i pojemność zasilaczy w celu zapewnienia redundancji i pracy w najgorszych warunkach). W tym wpisie skoncentrujemy się na omówieniu składników zużycia energii na poziomie systemu. W kolejnych postach zostaną omówione zagadnienia związane z dostarczaniem zasilania oraz konfigurowaniem środowiska testowego w celu standaryzacji oceny zasilania.

Zacznijmy od zdefiniowania jednostki dla metryki. Proponuję „wat na 100G bez optyki” na podstawie zużycia energii przez system. Jest to powszechnie stosowana jednostka szerokości pasma i (w przypadku routerów wysokiej klasy) obecnie pozwala uzyskać wartości w zakresie 1-50 W, z którymi większość z nas dobrze się czuje. Optykę należy odjąć, ponieważ jest ona bardzo zmienna w zależności od typu modułu (np. 400G ZR+ jest dwa razy mocniejsze niż FR4). Ponieważ układy optyczne mogą wpływać na wymagania dotyczące chłodzenia, dobrym punktem odniesienia jest bardziej szczegółowa definicja „Watów na 100G w typowej temperaturze z układami optycznymi o długości 2 km minus moc modułu optycznego”. Można również zdefiniować warianty tej definicji, takie jak układy optyczne ZR+ lub mniejsza liczba kart lub portów, na potrzeby porównań specyficznych dla danego operatora.

Moc systemu

Zużycie energii przez system jest kluczowym parametrem, na którym należy się skupić. Moc układów scalonych to interesujący sposób porównywania urządzeń, ale nie ma znaczenia przy płaceniu rachunków za prąd czy ocenie wpływu na środowisko. Przyjrzyjmy się, co składa się na moc systemową, analizując następujące kluczowe elementy:

  • Elektryczna ścieżka danych
  • Optyka
  • Chłodzenie
  • Konstrukcja mechaniczna
  • Płaszczyzna sterowania
  • Straty w konwersji napięcia i sygnalizacji

Elektryczna ścieżka danych

Kluczowe elementy mocy elektrycznej ścieżki danych obejmują układy PHY, retimery i układy ASIC odpowiedzialne za przekazywanie danych. PHY to małe urządzenia wykorzystywane w takich funkcjach, jak MACsec lub jako przekładnie, które łączą serializatory/deserializatory (SerDes, używane do szybkiego wejścia/wyjścia przez płytki drukowane) lub rozdzielają je na różne prędkości. Typową operacją przekładni jest konwersja 2x 56G SerDes z układu ASIC na 4x 28G SerDes podłączone do portu QSFP28 100 GbE. Retimery służą do wydłużania sygnałów elektrycznych. Retimery są powszechnie stosowane w przypadku długich ścieżek, takich jak łączenie optyki z układami ASIC w „tylnym rzędzie” karty liniowej.

Pod względem mocy obliczeniowej układy ASIC są gwiazdami przedstawienia, więc zrozumiałe jest, że to im poświęca się najwięcej uwagi. Są one najbardziej złożonymi komponentami i w dużych systemach modułowych, takich jak Cisco 8800, stanowią kluczowy czynnik wpływający na moc systemu. Moc układów ASIC można podzielić na trzy główne kategorie: SerDes, moc rdzenia w stanie spoczynku i moc rdzenia dynamicznego. W układach o wysokiej przepustowości, takich jak Cisco Silicon One Q200, są one mniej więcej równe. W tym blogu skupię się na tej klasie układów. Obejmuje ona urządzenia takie jak Jericho 2 firmy Broadcom (w NCS 5500) i Trident/Tomahawk (NCS 5000). Układy klasy Edge, takie jak Lightspeed Plus firmy Cisco, mają podobną charakterystykę, ale zużywają więcej energii na złożone operacje okołopakietowe (np. więcej liczników), a mniej na SerDes ze względu na mniejszą przepustowość.

Każda z tych kategorii ma inną charakterystykę zużycia energii. SerDes wymagają stałego zasilania niezależnie od obciążenia ruchem, ale mogą być wyłączane w celu oszczędzania energii. W urządzeniach serii 8000 dzieje się tak, gdy porty są wyłączane lub gdy gniazdo karty fabric lub liniowej jest puste. W tym drugim przypadku wyłączane są odpowiednie SerDes na karcie łączącej (np. niektóre SerDes karty Fabric Card (FC) są wyłączane, gdy gniazda karty Line Card (LC) są puste).

Moc w stanie bezczynności układu ASIC jest dokładnie taka, jak się wydaje. Jest to moc wymagana do utrzymania wewnętrznych bloków układu w stanie gotowości do pracy bez obciążenia ruchem. Moc dynamiczna występuje podczas przesyłania pakietów. Część mocy dynamicznej jest zużywana na operacje na pakietach (obciążenie pps), a część jest potrzebna do przesunięcia pasma wzdłuż ścieżki przesyłania (obciążenie bps).

Moc rdzeniowego (nieserDes) układu ASIC jest bardzo różna w różnych urządzeniach, ponieważ sieciowe układy ASIC pełnią wiele funkcji i mają różne wymagania. Moc rdzeniowego układu ASIC może się różnić w zależności od kilku czynników:

  • Funkcja – DC vs. SP Edge vs. SP Core wykonują różne poziomy operacji na pakietach
  • Wydajność sieciowa vs. wydajność fabryczna – interfejsy ASIC, które mogą się łączyć tylko z przełącznikami fabrycznymi, są znacznie prostsze i mają mniejszą moc.
  • Węzeł technologiczny (7nm to obecna generacja, 16nm i 28nm to poprzednie węzły TSMC)
  • Projekt – nowsze mikroarchitektury mają zwykle większą wydajność niż układy, które mają starsze ograniczenia. Umiejętności inżynierów projektantów również mają znaczenie i przekładają się na końcowy wynik mocy.
  • Temperatura urządzenia – gorący układ ASIC ma nieznacznie wyższą moc.
  • Obciążenie – liczba tranzystorów przerzucanych w danym czasie (głównie funkcja liczby pps i przepustowości, ale także zdolności projektu do bramkowania nieużywanych układów logicznych).

Większość starszych projektów SP ASIC została zoptymalizowana pod kątem dużych systemów modułowych z przełącznikami. Takie podejście spowodowało, że część We/Wy ASIC (tkanina wymaga zwiększenia szybkości, więc zwykle nieco ponad 50%, aby uwzględnić narzut) została zakodowana na potrzeby operacji wykonywanych przez tkaninę. To znacznie upraszcza projekt w porównaniu z układami, które mogą przeznaczyć całą swoją przepustowość na sieć. Logika odszukiwania w infrastrukturze jest znacznie prostsza niż operacje sieciowe, a zatem wymaga mniej miejsca w krzemie i mniejszej mocy.

Wady operacji we/wy związanych z architekturą ujawniają się w systemach jednoukładowych. Przepustowość sieci jest tracona i nie można jej przekierować do sieci. Można to zniwelować, stosując dwa układy scalone obok siebie z „tkaniną” punkt-punkt, ale i tak jest to mniej wydajne niż pojedynczy układ scalony, który może podłączyć całą swoją przepustowość do sieci. Gdy potrzebne są dwa układy ASIC, moc obliczeniowa układu wzrasta dwukrotnie. Jeśli w małych systemach (2-3 RU) wymagana jest większa liczba układów i przełącznik, moc jest jeszcze większa.

Optyka

Optyka to dary sprzętu routerów. Zużywają dużo energii, zajmują mało miejsca na radiatory, a ich maksymalna temperatura jest o 50°C niższa niż w przypadku układów ASIC. Zarządzanie termiczne modułami optycznymi było jednym z najtrudniejszych wyzwań w początkowej fazie projektowania mechanicznego systemów klasy 400G – a potem moduły ZR+ podwoiły wymagania z 11 W (DR4/FR4) do 22 W (ZR+).

Moc modułów optycznych jest stosunkowo stała dla każdego zasięgu (np. LR8 lub FR4) u różnych producentów. Moc systemu do chłodzenia modułów jest różna. Na przykład chłodzenie modułu QSFP-DD w tradycyjnej obudowie z pionowym przepływem powietrza (tzn. każdy moduł ogrzewa powietrze dla modułu znajdującego się nad nim) może być trudniejsze niż w nowszej obudowie ortogonalnej (zimne powietrze dociera bezpośrednio do wszystkich modułów). Strona . Konstrukcje QSFP-DD i OSFP mają również wpływ na moc wymaganą do chłodzenia. Obie wersje mogą obsługiwać układy optyczne o dużej mocy, ale konstrukcja QSFP-DD umożliwia ciągłe wprowadzanie innowacji w zakresie radiatorów dostosowanych do obudowy. Dzięki temu przepływ powietrza potrzebny do chłodzenia modułów jest mniejszy, a tym samym moc systemu jest niższa niż w przypadku OSFP, który jest zamknięty w standardowej konstrukcji radiatora, co ogranicza innowacyjność.

Chłodzenie

Routery są chłodzone powietrzem; wentylatory przepychają lub wyciągają powietrze przez obudowę. Ścieżka przepływu powietrza jest ważna, ponieważ każdy komponent ogrzewa powietrze dla kolejnych urządzeń w obudowie. Moc wentylatorów jest bardzo zróżnicowana w zależności od systemu i warunków pracy. W największej obudowie serii 8800 (8818) 40 wentylatorów może zużywać od 600 do 6400 W. Tak duża rozpiętość wynika z charakteru poboru mocy wentylatorów. Jest on w przybliżeniu sześcienny w stosunku do ilości poruszanego powietrza. Kiedy prędkość obrotowa wentylatorów wchodzi w zakres 80-100%, ich moc drastycznie wzrasta, dlatego należy zadbać o zminimalizowanie potrzeby korzystania z szybkich wentylatorów, ustawiając je na maksymalną prędkość tylko wtedy, gdy jest to absolutnie konieczne.

Konstrukcja mechaniczna

Chłodzenie nie jest jedynym aspektem konstrukcji mechanicznej. Inne decyzje obejmują wysokość karty, liczbę i rozmiar wentylatorów, układy płyt, radiatory i inne. Na przykład, niewielkie różnice w wysokości karty graficznej mogą wpłynąć na wielkość radiatorów i na to, jak bardzo ograniczony jest przepływ powietrza. Oba te czynniki mają wpływ na temperaturę układów scalonych i moc wentylatorów.

Płaszczyzna sterowania

Płaszczyzna sterowania obejmuje procesory, pamięci DRAM, dyski SSD, wewnętrzne przełączniki ethernetowe oraz małe komponenty, takie jak konsole i ethernet zarządzający. Moc procesora jest stosunkowo niska w porównaniu z układami ASIC. Pozostałe komponenty płaszczyzny sterowania nie zużywają znacznej ilości energii.

Straty w konwersji napięcia i sygnalizacji

Widoczne komponenty nie są jedynymi odbiorcami energii. Pięć do 10% całkowitej mocy jest tracone, gdy zasilacze konwertują napięcie obiektu (np. 48 V DC lub 220 V AC) na napięcie systemowe (np. 12 V lub 54 V DC). Dalsza utrata mocy następuje podczas przekształcania napięcia systemowego na poziom wykorzystywany przez układy elektroniczne (np. 3,3 V dla układów optycznych). Moc jest także tracona na rezystancję płytek drukowanych, gdy sygnały przechodzą z urządzenia do urządzenia.

W przeszłości czynniki te mogły być ignorowane przez użytkowników, ale ponieważ pobór mocy staje się coraz bardziej krytyczny, nie powinny być już dłużej ignorowane. W serii 8000 wprowadzono wiele zakulisowych optymalizacji w tych obszarach, takich jak nowe zasilacze i bardziej wydajna wewnętrzna dystrybucja zasilania.

Metryki dla Cisco 8000 Series

Na początku tego dokumentu zaproponowano metrykę watów na 100G bez optyki. Na zakończenie przyjrzyjmy się tym wartościom dla kilku konkretnych konfiguracji. Poniższe dane są testowane w temperaturze 22C z pakietami 768B, przepustowością 15% i bez optyki.

Wnioski

Wiele mówi się o sprawności energetycznej na poziomie układu scalonego, ale nie jest to ostateczny cel – to jedynie środek do celu. Operatorzy nie powinni zwracać uwagi na to, czy moc jest wykorzystywana do przerzucania tranzystorów czy kręcenia wentylatorami. Chcą tylko, aby system był wydajny. Ocena systemów powinna obejmować benchmarki, które można znormalizować, a także konfiguracje specyficzne dla danej sieci, które mogą obejmować sprzęt wielu generacji, częściowo wypełnioną obudowę lub różne obciążenia ruchem.

W arkuszach danych dla serii 8000 typowa moc jest określona dla w pełni obciążonego systemu w temperaturze 25C, przy 15% maksymalnej przepustowości i 768B pakietów bez optyki. W przypadku serii 8800, 8800-LC0-36FH oparty na Q200

jest używana jako karta liniowa wraz z najnowszą infrastrukturą przełącznika dostępną dla chassis.

Inne platformy Cisco IOS XR używają wyższych poziomów ruchu dla „typowego” przypadku w programie Cisco Power Calculator i dołączają optykę LR4 na wszystkich portach. Wprowadziliśmy zmiany dla serii 8000, aby lepiej odzwierciedlić codzienne wzorce ruchu zgłaszane przez naszych klientów oraz dane zebrane z sieci produkcyjnych. Gdybyśmy zwiększyli obciążenie ruchem do 512 B i 50% maksymalnej przepustowości, moc byłaby o około 10% wyższa.

Może to nie odzwierciedlać wzorca Twojej sieci lub programu RFP, dlatego w przypadku serii 8800 opracowaliśmy modele oparte na szeroko zakrojonych testach laboratoryjnych, które umożliwiają dokładne oszacowanie mocy dla dowolnej kombinacji kart liniowych, typu i liczby kart typu fabric, rozmiaru pakietów, przepustowości, układów optycznych i temperatury.

Podsumowując, kluczową miarą zużycia energii jest moc systemu w typowych warunkach. Podczas zakupów routerów należy pytać sprzedawców o dane na poziomie systemu, które spełniają rzeczywiste wymagania użytkownika, oraz o szczegóły dotyczące sposobu testowania lub obliczania tych danych. Należy również dokładnie przyjrzeć się harmonogramom kwalifikacji i wdrażania, aby ocenić systemy dostępne w tej samej generacji i nie porównywać sprzętu, który można wdrożyć, tylko na podstawie informacji prasowych.

Dowiedz się więcej

W firmie Cisco wierzymy, że przyszłość dla wszystkich musi uwzględniać wszystkich, w tym przyszłe pokolenia. Dlatego też wyznaczamy długoterminowe, możliwe do zrealizowania cele w zakresie wpływu naszych produktów i działań na środowisko. W ramach tych działań koncentrujemy się na zwiększaniu efektywności energetycznej i ograniczaniu emisji. Nasze inicjatywy na rzecz zrównoważonego rozwoju obejmują ponad 440 projektów w zakresie efektywności energetycznej zrealizowanych w ciągu ostatnich pięciu lat, a wiele z nich jest jeszcze przed nami. Zachęcamy do poświęcenia kilku minut na zapoznanie się z naszą podróżą w kierunku zrównoważonej, integracyjnej przyszłości, aby zrozumieć, co to oznacza dla Ciebie i Twojej organizacji.

Podziel się

:

Czytaj dalej: https://blogs.cisco.com/sp/assessing-the-real-world-environmental-impact-of-routers

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.