Cisco UCS X-Series, Napędy testowe rozwiązań

Kobieta Technologia

Witamy gościa blogera, Tushara Patela, Głównego Inżyniera, Oracle Solutions

Sprawdzone 37 milionów IOPS, teraz wzbogacone o 100G Networking i zintegrowany GPU – Oh My!

Żyjemy w świecie zmian. Wielu z nas jest na tyle starych, by pamiętać czasy, zanim telewizja kablowa, Internet i telefony komórkowe stały się powszechne. Filmy nakręcone w latach 80. pozwalają spojrzeć w przeszłość. Jednak postęp technologiczny był podyktowany chęcią wprowadzenia, na przykład, programów telewizyjnych szybciej i w takiej formie, aby oszczędzić konsumentom złożoności i kosztów. Programy telewizyjne przeszły z wielkiego drewnianego pudła w pokoju rodzinnym na kasety magnetowidowe, płyty DVD, aż po streaming w serwisie Netflix oglądany na najnowszym smartfonie. Wszystko to zmieniło się w ciągu jednego pokolenia!

W ciągu ostatniej dekady zmieniła się także architektura serwerów. Kiedy w 2009 r. firma Cisco wprowadziła na rynek system Unified Computing System (UCS), serwer Cisco UCS B-Series 200 blade miał pojemność tylko dwóch dysków, z których jeden mieścił system operacyjny, a drugi służył jako dysk zapasowy. Wszystkie pliki aplikacji lub baz danych były umieszczane na zewnętrznych macierzach pamięci masowej, takich jak NetApp. Doprowadziło to do rozwoju infrastruktur konwergentnych, takich jak FlexPod (Cisco UCS i NetApp) oraz FlashStack (Cisco UCS i Pure Storage), które stały się powszechnie akceptowaną infrastrukturą do hostowania dużych baz danych, systemów ERP i innych obciążeń o znaczeniu krytycznym. Największe bazy danych Oracle są hostowane na infrastrukturach konwergentnych i nadal będzie istniał duży rynek dla tej konstrukcji systemu.

Technologia wciąż się rozwija, a firma Cisco wykorzystała wiele z tych osiągnięć w nowej obudowie Cisco UCS serii X, w której mieści się do ośmiu węzłów obliczeniowych UCS X210c M6. Węzły te można traktować jako serwery zoptymalizowane pod kątem stelaża, które są umieszczone pionowo w nowym systemie modułowym Cisco X-Series (chassis Cisco UCS 9508). Ta nowa konstrukcja jest zarządzana przez Cisco Intersight, opartą na chmurze funkcję zarządzania systemem, która wykorzystuje kluczowe funkcje poprzedniego UCS Manager, który zarządzał systemami poprzedniej generacji. Chociaż istnieje wiele nowych możliwości, które moglibyśmy omówić, na dziś skupmy się na tym, że X210c ma sześć dysków półprzewodnikowych (SSD) NVMe PCI Gen 4 oprócz dwóch dysków, na których znajduje się system operacyjny.

Obudowa serwera Cisco UCS X9508 (widok z przodu)

W tym miesiącu rozszerzamy możliwości! Administratorzy baz danych (DBA) zwracają uwagę na każdy punkt konstrukcji systemu, aby zmaksymalizować jego wydajność. Szerokość pasma sieciowego, tradycyjnie będąca domeną administratorów sieci, była uważana za nieosiągalną dla DBA. Jednak Cisco UCS X-Series obsługuje obecnie sieci 100G, dzięki czemu zespoły te mogą projektować nowe rozwiązania, osiągając nowe progi wydajności. Pomyśl tylko o możliwościach! Ten system może z łatwością obsługiwać bazy danych, VDI, AI/ML i inne aplikacje korporacyjne.

Dzięki nowej konstrukcji klienci, którzy posiadają bazy danych pojedynczych instancji, takie jak Oracle lub Microsoft SQL Server, mają teraz do dyspozycji do 90 TB wbudowanej przestrzeni dyskowej na każdy węzeł obliczeniowy X210c. Architekci systemów mogą wykorzystać te dyski do umieszczenia pojedynczej instancji bazy danych i uniknąć kosztów i złożoności inwestycji w zewnętrzną pamięć masową. Pozwala to również zaoszczędzić miejsce i energię w centrum danych bez utraty wydajności.

Serwery obsługujące wirtualne pulpity mogą obsługiwać bardziej złożone aplikacje niż kiedykolwiek wcześniej. Obciążenia graficzne wymagają jednostek przetwarzania graficznego (GPU), aby zmaksymalizować wydajność.

Wydajność. Seria X oferuje dwie opcje. Pierwszą z nich jest możliwość skonfigurowania 1-2 procesorów graficznych Nvidia T4 na każdy węzeł obliczeniowy X210c. Druga opcja to dedykowany węzeł obliczeniowy z GPU, który jest idealny dla szerokiej gamy obciążeń, takich jak VDI.

Być może pamiętacie, że w lipcu 2021 roku John opublikował blog, w którym opisał testy infrastruktury wirtualnych pulpitów (VDI) przeprowadzone na pojedynczym węźle X210c M6. Wyniki pokazały, że ten węzeł obliczeniowy może zapewnić doskonałą wydajność. Czytający to administratorzy baz danych zauważą, że baza danych z wielu powodów jest zupełnie inna. Choć mają rację, chcieliśmy najpierw określić podstawową wydajność tych dysków. Częstą praktyką jest ocena wydajności bazowej systemu przed wdrożeniem jakiejkolwiek aplikacji bazodanowej. Testy wydajności bazowej systemu są wykonywane za pomocą popularnych narzędzi do kalibracji operacji we/wy, takich jak Linux FIO. Narzędzia te mogą generować wzorce operacji we/wy, które naśladują typ operacji we/wy wykonywanych przez bazy danych Oracle.

W naszych testach użyliśmy generatora obciążeń FIO do przećwiczenia 6 lokalnych dysków Intel 5600 NVMe o pojemności 3,2 TB każdy. Mimo że jest to pojedyncza instancja bazy danych Oracle działająca na pojedynczym serwerze typu blade, zdecydowaliśmy się przeprowadzić testy wydajności na wszystkich 8 w pełni obsadzonych ostrzach X210c jednocześnie, aby upewnić się, że każda z ostrzy maksymalizuje swoją zaprojektowaną wydajność w obudowie X9108. Na podstawie tych testów można wyciągnąć następujące wnioski

:

  • Brak wpływu na wydajność pojedynczego serwera blade ze względu na zasilanie i chłodzenie.
  • Brak zależności od gniazda. Wszystkie serwery blade osiągają identyczną wydajność, niezależnie od gniazda w obudowie.

Kryteria testowe

  • Warunkowanie wstępne wszystkich dysków przez zapisywanie losowych wzorców danych.
  • Obserwacja i weryfikacja stałych wartości IOP i wydajności w ciągu 30 minut, 1 godziny i 4 godzin przy średnich i 90. percentylu submilisekundowych opóźnień dla różnych współczynników odczytu/zapisu. Przeprowadzono wiele przebiegów dla każdej iteracji i dokonano dokładnej analizy w celu sprawdzenia spójności danych.
  • Generowanie powtarzalnych wyników przy minimalnych zmianach parametrów, przy jednoczesnym naśladowaniu zachowania aplikacji. Innymi słowy, można wygenerować nieco wyższe liczby, ale celem nie jest wygenerowanie szczytowych wyników benchmarku wydajności. Dla każdego testu wybrano odpowiednią głębokość i liczbę zadań FIO oraz async IO jako parametr

Wyniki wydajności

  • Każdy serwer blade wygenerował około 4,7 miliona ciągłych operacji wejścia-wyjścia przy 100% odczycie, a łącznie około 37+ milionów operacji wejścia-wyjścia przy opóźnieniu prawie 500 mikrosekund i blokach danych 4K.
  • Niemal identyczne zachowanie IO na wszystkich serwerach 8-łopatkowych

To jest doskonała wydajność, lepsza niż można było sobie wyobrazić! Teraz, gdy mamy już ten punkt odniesienia, czas załadować pojedynczą instancję bazy danych Oracle 19c i sprawdzić, jak radzi sobie X210c M6 – będzie to tematem naszego kolejnego bloga. Bądźcie czujni!

Podziel się

:

Czytaj dalej: https://blogs.cisco.com/datacenter/cisco-ucs-x-series-solution-test-drives

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.