Βασικά συμπεράσματα
- Απαράμιλλη απόδοση σε έναν μόνο κόμβο:Ο R7725xd διατηρούσε πάνω από 300 GB / s εσωτερικού εύρους ζώνης και 160 GB / s μέσω NVMe-oF RDMA, ανταγωνιζόμενος τα clusters αποθήκευσης πολυ-νόδων μέσα σε ένα πλαίσιο 2U.
- Αληθινή Αρχιτεκτονική Γενιάς 5, Χωρίς Διακόπτες, Χωρίς Fan-Out:Όλα τα 24 Micron 9550 PRO SSD λαμβάνουν ειδικές λωρίδες x4 PCIe Gen5 απευθείας από το σύμπλεγμα CPU, επιτρέποντας την κλιμάκωση του ρυθμού γραμμής χωρίς διαμάχη.
- Δυναμικό AMD EPYC 9005 σειράς:Δύο επεξεργαστές AMD EPYC 9575F παρέχουν τον αριθμό λωρίδων, το εύρος ζώνης μνήμης και την τοπολογία NUMA που απαιτούνται για διαρκή υψηλή ταυτόχρονη Ε/Ε.
- Σχεδιασμένο για τεχνητή νοημοσύνη, αναλύσεις και βαριά φορτία εργασίας σημείων ελέγχου:Το σύστημα εξαλείφει τα μπουκάλια I/O που καθυστερούν τους σύγχρονους αγωγούς GPU, επιτρέποντας συνεχή, υψηλής εύρους ζώνης παράδοση δεδομένων.
- ΠΙΚ: Η AIO ξεκλειδώνει τον πλήρη παράλληλο:ΠΕΙΚ: Το λογισμικό του AIO διατηρεί τις δομές ουράς κορεσμένες κάτω από το φορτίο, παρέχοντας επιδόσεις επιχειρήσεων σε μια συναρπαστική αναλογία δολαρίου ανά GB.
Το τμήμα αποθήκευσης του iDRAC 10 παρουσιάζει μια πλήρη επισκόπηση όλων των φυσικών δίσκων που είναι εγκατεστημένοι στο R7725xd.συνοδευόμενο από ένα οπτικό τετραγωνικό διάγραμμα που απεικονίζει τις καταστάσεις κίνησηςΣε αυτή τη διαμόρφωση, 24 SSD NVMe είναι ενεργά και αναφέρουν ότι είναι έτοιμα, με δύο πρόσθετες συσκευές εκκίνησης που βρίσκονται στο σύστημα, ξεχωριστά από την κύρια μπροστινή τράπεζα NVMe.
Στο δεξί μέρος, ο πίνακας Σύνοψη Δίσκων τα διαλύει σε φυσικούς δίσκους και σε οποιουσδήποτε συνδεόμενους εικονικούς δίσκους.,όλες οι μονάδες οδήγησης αναφέρονται ως μη-RAID και μπορούν να διευθύνονται μεμονωμένα, σύμφωνα με τον σχεδιασμό του συστήματος για μεγάλες ομάδες NVMe και πλατφόρμες SDS.
Κάτω από την περίληψη της κατάστασης, η περιοχή Recently Logged Storage Events απαριθμεί τα αρχεία καταγραφής εισαγωγής για κάθε SSD PCIe, οργανωμένα από αποβάθρα και slot.Αυτό το αρχείο επιβεβαιώνει την ορθή ανίχνευση σε όλα τα αποθέματα κίνησης και βοηθά στην αναγνώριση τυχόν προβλημάτων με καθίσματαΓια μεγάλες αναπτύξεις, αυτά τα αρχεία καταγραφής είναι χρήσιμα κατά την παρακολούθηση της προμήθειας της κίνησης ή την επαλήθευση ότι η χωρητικότητα έχει πλημμυρίσει όπως αναμένεται.
Το τελευταίο screenshot δείχνει την λεπτομερή προβολή συσκευής NVMe στο iDRAC10. Κάθε μονάδα NVMe που έχει εγκατασταθεί στο σύστημα παρατίθεται με την κατάσταση, την χωρητικότητα και την τοποθεσία της αποβάθρας.Η επιλογή ενός ατομικού δίσκου ανοίγει μια πλήρη διάσπαση των χαρακτηριστικών του.
Σε αυτό το παράδειγμα, ο πίνακας πληροφοριών οδήγησης εμφανίζει την πλήρη σειρά μοντέλων, το πρωτόκολλο συσκευής, τον παράγοντα φόρμας και τις ρυθμίσεις PCIe που έχουν διαπραγματευτεί.Οι συσκευές NVMe λειτουργούν με ταχύτητα σύνδεσης 32 GT / s με διαπραγματευμένη σύνδεση x4Το τμήμα πληροφοριών αναφέρει επίσης το ποσοστό αντοχής, τη διαθέσιμη κατάσταση εφεδρικού και τον τύπο πρωτοκόλλου,βοηθώντας τους διαχειριστές να παρακολουθούν τις προσδοκίες για την υγεία και τον κύκλο ζωής των οχημάτων.
Αυτή η λεπτομερής αναφορά δίσκου είναι πολύτιμη σε ρυθμίσεις NVMe υψηλής πυκνότητας όπου το πλάτος σύνδεσης, η διαπραγματευόμενη ταχύτητα και η κατάσταση του μέσου επηρεάζουν άμεσα τη συμπεριφορά του φόρτου εργασίας και τις επιδόσεις αποθήκευσης.
Συνολικά, η διεπαφή iDRAC 10 παρέχει μια σαφή, κεντρική στην συσκευή εικόνα της αρχιτεκτονικής αποθήκευσης NVMe R7725xd, επιτρέποντας εύκολη επικύρωση της υγείας συνδέσμου, της κατάστασης της μονάδας,και ακεραιότητα του συστήματος σε μια ματιά.
Dell PowerEdge R7725xd Απόδοση
Πριν από τις δοκιμές, το σύστημά μας ήταν εξοπλισμένο με δύο επεξεργαστές AMD EPYC 9575F, το καθένα με 64 πυρήνες υψηλής συχνότητας.και συνδυάζεται με 24 DDR5 DIMM 32GB που λειτουργούν με 6400 MT/sΓια αποθήκευση, το σασί είναι πλήρως γεμάτο με 24 SSD Micron 9550 PRO U.2 NVMe 15.36TB, το καθένα συνδεδεμένο μέσω ενός ειδικού συνδέσμου PCIe Gen5 x4. Αυτό παρέχει συνολική ακατέργαστη χωρητικότητα 368.64 TB,και οι δίσκοι Micron 9550 PRO παρέχουν διαδοχικές ταχύτητες ανάγνωσης έως και 14,000 MB/s και διαδοχικές ταχύτητες εγγραφής έως και 10.000 MB/s. Το δίκτυο χειρίζεται από τέσσερις προσαρμογείς Broadcom BCM57608 που παρέχουν συνολικά οκτώ θύρες 200Gb,μαζί με μια NIC OCP BCM57412 που προσφέρει δύο πρόσθετες θύρες 10 gigabits.
Προδιαγραφές συστήματος δοκιμής
- Η CPU:2x επεξεργαστές υψηλής συχνότητας AMD EPYC 9575F 64 πυρήνων
- Μνήμη:24x 32GB DDR5 @ 6400MT/s
- Αποθήκευση:24x 15.36TB Micron 9550 PRO U.2 δίσκοι (συνδεδεμένοι σε 4x λωρίδες PCIe Gen5 καθένας) υποστηρίζει μέχρι 128TB δίσκους σήμερα με μεγαλύτερες χωρητικότητες στον ορίζοντα
- Δίκτυο:4x Broadcom BCM57608 2x200G NIC, 1x BCM57412 2x10Gb OCP NIC
- Κλείστρο:Dell PowerSwitch Z9664
Κεντρικό δείκτη επιδόσεων του FIO
Για τη μέτρηση της απόδοσης αποθήκευσης του PowerEdge R7725xd, χρησιμοποιήσαμε μετρήσεις του βιομηχανικού προτύπου και το εργαλείο FIO.
- Τυχαίο 4K 1M
- Ακολουθική 4K 1M
Διοικητική αρχή
Κατά τη δοκιμή της τοπικής πρόσβασης στις 24 μονάδες NVMe PCIe Gen5 μέσα στο Dell PowerEdge R7725xd,Το σύστημα δείχνει ακριβώς τι θα περιμένατε από μια πλατφόρμα όπου κάθε μονάδα είναι συνδεδεμένη με CPUs χρησιμοποιώντας μια πλήρη x4 λωρίδα PCIe Gen5 σύνδεσηΧωρίς το στρώμα δικτύου που εμπλέκεται, αυτή είναι η καθαρή, εσωτερική απόδοση της διάταξης αποθήκευσης Gen5 της Dell και το εύρος ζώνης PCIe της πλατφόρμας AMD EPYC που λειτουργεί χωρίς περιορισμό.
Οι διαδοχικές αναγνώσεις ξεκινούν στα 184 GB / s με μπλοκ 4K και κλιμακώνονται γρήγορα καθώς το μέγεθος του μπλοκ αυξάνεται.που είναι μια ισχυρή ένδειξη του πόσο καλά το σύστημα μπορεί να συγκεντρώσει όλες τις λωρίδες 24 × 4 Gen5 σε διαρκές εύρος ζώνης ανάγνωσης χωρίς προβλήματα στο στάδιο του ελεγκτή.
Οι διαδοχικές εγγραφές ακολουθούν μια διαφορετική καμπύλη, αλλά παραμένουν σταθερά στο αναμενόμενο εύρος.Αυτό ευθυγραμμίζεται με τη συμπεριφορά εγγραφής των Micron 9550 PRO SSDs και το overhead που είναι εγγενές στις υψηλές παράλληλες εγγραφές NVMe σε πολλές ανεξάρτητες συσκευές.
Το σύστημα επιτυγχάνει ταχύτητες σχεδόν 300 GB/s στα μικρότερα μεγέθη μπλοκ, μειώνεται ελαφρώς στο μεσαίο εύρος,και στη συνέχεια ανακτάται στην ανώτερη 200s και χαμηλή 300s σε μεγαλύτερα μεγέθη μπλοκΣτο 1M, οι τυχαίες αναγνώσεις φτάνουν στο μέγιστο των 318 GB/s, αποδεικνύοντας την ικανότητα της πλατφόρμας να διανέμει μικτές λειτουργίες ομοιόμορφα σε όλες τις 24 μονάδες.
Οι τυχαίες εγγραφές έρχονται με χαμηλότερο ρυθμό, κάτι που είναι τυπικό για τα διασκορπισμένα μεταδεδομένα και τις εργασίες κατανομής εγγραφής σε ένα ευρύ σύνολο NVMe.Τα αποτελέσματα παραμένουν στην περιοχή 140 έως 160 GB/s για το μεγαλύτερο μέρος της δοκιμής και μειώνονται σε λίγο κάτω από 100 GB/s σε 1 M.
Διοικητική αρχή ∆ημοτικό ∆ημόσιο
Όταν εξετάζεται η πλευρά IOPS, το R7725xd επιδεικνύει ισχυρή απόδοση μικρών τεμαχίων,Με τα ποσοστά αιτήσεων να φτάνουν σε δεκάδες εκατομμύρια πριν τα μεγαλύτερα μεγέθη μπλοκ μετατοπίσουν το φορτίο εργασίας προς ένα προφίλ με εύρος ζώνης.
Σε 4K, οι αναγνώσεις έφτασαν τα 44,9 εκατομμύρια IOPS και οι εγγραφές έφτασαν τα 36,3 εκατομμύρια.αποδεικνύοντας την ικανότητα του συστήματος να κατανέμει αποτελεσματικά φορτία εργασίας υψηλής σειράς σε όλες τις μονάδεςΑυτές οι τιμές φυσικά συρρικνώνονται καθώς αυξάνονται τα μεγέθη των τεμαχίων, αλλά η εξέλιξη παραμένει σταθερή μέσα στις περιοχές 8K, 16K και 32K.
Με τα μπλοκ 16K και 32K, οι αναγνώσεις καταλήγουν σε 17,4 εκατομμύρια και 8,35 εκατομμύρια IOPS, με τις τυχαίες αναγνώσεις να ταιριάζουν στενά στα 16,5 εκατομμύρια και 8,15 εκατομμύρια.παρακολούθηση χαμηλότερη αλλά σταθερή τόσο σε διαδοχικά όσο και σε τυχαία πρότυπα πρόσβασης.
Καθώς προχωράμε σε 64K και άνω, οι δοκιμές μεταβαίνουν από καθαρά IOPS σε ένα πιο περιορισμένο σε εύρος ζώνης σενάριο.Σε μέγεθος μπλοκ 1M, διαβάζει IOPS γη περίπου 300K, γράφει περίπου 174K, και τυχαίες πράξεις τελειώνουν στην ίδια γειτονιά.
Συνολικά, τα αποτελέσματα των τοπικών IOPS δείχνουν σαφώς την ικανότητα του συστήματος να διατηρεί πολύ υψηλά φορτία εργασίας με βάθος ουράς σε μικρά μπλοκ,με προβλέψιμη κλιμακώρηση καθώς οι μεταφορές αυξάνονται και το εύρος ζώνης γίνεται ο κυρίαρχος παράγοντας.
Γιατί το Dell PowerEdge R7725xd ταιριάζει σε αυτό το φορτίο εργασίας
Το PEAK:AIO έχει σχεδιαστεί για περιβάλλοντα που απαιτούν εξαιρετικά γρήγορη πρόσβαση σε μεγάλα σύνολα δεδομένων με χαμηλή καθυστέρηση, συνήθως για εκπαίδευση τεχνητής νοημοσύνης, αγωγούς συμπερασμάτων, χρηματοοικονομικό μοντέλα και ανάλυση σε πραγματικό χρόνο.Η πλατφόρμα ευδοκιμεί με πυκνή αποθήκευση NVMeΓια να ανταποκριθεί στις απαιτήσεις αυτές, η Επιτροπή θα πρέπει να επιδιώξει την επίτευξη ενός ισορροπημένου εύρους ζώνης PCIe και προβλέψιμης καθυστέρησης σε κλίμακα.το υποκείμενο υλικό πρέπει να παρέχει διαρκή απόδοση, διατηρώντας παράλληλα σταθερή και επαναλαμβανόμενη απόδοση υπό ταυτόχρονα βαριά φορτία.
Η αρχιτεκτονική του συστήματος είναι σχεδιασμένη για να μεγιστοποιεί τους πόρους PCIe Gen5, εκθέτοντας το πλήρες εύρος ζώνης των 24 εμπρόσθιων U του.2 πύλες NVMe απευθείας στις CPUΑυτή η διάταξη δίνει στο PEAK: AIO το προφίλ παράλληλου και καθυστέρησης που αναμένει από σύγχρονους αγωγούς δεδομένων βασισμένους σε NVMe.Η ρύθμιση του συστήματος διαιρεί τα SSD NVMe σε δύο ομάδες RAID0.
Στο δοκιμασμένο σενάριο, χρησιμοποιήσαμε δύο συστήματα πελατών συνδεδεμένα με το R7725xd, το καθένα εξοπλισμένο με Broadcom BCM57608 2x 200G NICs.Σπρώχνοντας το R7725xd σε μια ρεαλιστική υψηλής απόδοσης διαμόρφωση που αντικατοπτρίζει τι PEAKΑυτό το επίπεδο εύρους ζώνης του δικτύου μας έδωσε το περιθώριο να τονίσουμε πλήρως το υποσύστημα NVMe, την τοπολογία PCIe,και η CPU διασυνδέεται χωρίς συμφόρηση στο επίπεδο NIC.
Το αποτέλεσμα είναι μια πλατφόρμα που ευθυγραμμίζεται αποτελεσματικά με τα φορτία εργασίας PEAK: AIO.και τη δυνατότητα δικτύωσης για τη διατήρηση της πρόσληψης δεδομένων από πολλούς πελάτες σε εκατοντάδες gigabits ανά πελάτηΌλα αυτά τα χαρακτηριστικά είναι θεμελιώδη για την επίτευξη των προσδοκιών επιδόσεων του PEAK:AIO.
ΠΕΙΚ:ΑΙΟ ∆ΕΔΜΑ RDMA ∆αύλος ζώνης
Εξετάζοντας τα αποτελέσματα εύρους ζώνης NVMe-oF RDMA στο PowerEdge R7725xd με PEAK: AIO, η συνολική τάση είναι ακριβώς αυτή που αναμένουμε από ένα σύστημα με τόσο μεγάλο εύρος ζώνης PCIe και δικτύου.Καθώς το μέγεθος του μπλοκ αυξάνεται, η χωρητικότητα αυξάνεται ραγδαία μέχρι να ισορροπήσει κοντά στο πρακτικό όριο της πλατφόρμας.
Στα μικρά μεγέθη των τεμαχίων, η απόδοση ξεκινά στα μέσα του εύρους των 20GB / s τόσο για την ανάγνωση όσο και για την εγγραφή, κάτι που είναι φυσιολογικό επειδή οι μεταφορές 4K και 8K πιέζουν την πορεία IOPS πολύ πιο σκληρά από την πορεία χωρητικότητας.Μόλις μπούμε στα μπλοκ 16K και 32KΟι αναγνώσεις πηδούν σε περίπου 154 GB/s σε 32K και συνεχίζουν να ανεβαίνουν στην περιοχή των 160 GB/s, που είναι ακριβώς εκεί που θα περιμέναμε μια εγκατάσταση διπλού πελάτη πάνω από τέσσερις συνδέσεις 200 Gb/s προς την ξηρά.
Το AIO κάνει καλή δουλειά να τροφοδοτεί τις ουρές εντολών.Έτσι το τυχαίο εύρος ζώνης ανάγνωσης ουσιαστικά ακολουθεί το διαδοχικό εύρος ζώνης ανάγνωσης μέχρι το τέλος., η οποία σταθεροποιείται σε περίπου 159 έως 161 GB/s από 32K έως 1M. Αυτό δείχνει ότι η στοίβα αποθήκευσης δεν είναι μειωμένη υπό τα πρότυπα μικτής πρόσβασης,και η τοπολογία PCIe R7725xd ς κατανέμει το φορτίο ομοιόμορφα στις 24 μονάδες NVMe Gen5.
Η απόδοση εγγραφής ακολουθεί παρόμοια καμπύλη, αν και κορυφώνεται ελαφρώς χαμηλότερα από τις αναγνώσεις.βυθίζεται σε περίπου 117 GB/s σε 128K αλλά ανακάμπτει καθώς το μέγεθος του μπλοκ αυξάνεταιΟι τυχαίες εγγραφές συμπεριφέρονται διαφορετικά και ισοπεδώνονται πιο κοντά στα 110-117 GB/s, το οποίο είναι φυσιολογικό για εργασιακά φορτία μικτής ουράς που εισάγουν πρόσθετα έξοδα.
Το βασικό takeaway από αυτό το τμήμα είναι ότι το R7725xd δεν έχει πρόβλημα να διατηρήσει εξαιρετικά υψηλό εύρος ζώνης μέσω NVMe-oF, ακόμη και με πολλούς πελάτες που οδηγούν το σύστημα στα όριά του.Μόλις τα μεγέθη των τεμαχίων φτάσουν τα 32K ή υψηλότεραΑυτό είναι ακριβώς το είδος της απόδοσης που το PEAK:AIO έχει σχεδιαστεί για να εξάγει,καθιστώντας αυτά τα αποτελέσματα μια ισχυρή επικύρωση της ικανότητας της πλατφόρμας να κλιμακωθεί υπό πραγματικές συνθήκες.
ΠΕΙΚ ΑΙΟ ΝΒΜ-ΟΦ RDMA IOPS
Από την πλευρά του IOPS, το PowerEdge R7725xd παρουσιάζει ισχυρές επιδόσεις μικρών τεμαχίων, αν και αρχικά παρατηρήσαμε χαμηλότερους αριθμούς από τους αναμενόμενους.Αυτό το πρόβλημα αναμένεται να αντιμετωπιστεί με βελτιωμένη υποστήριξη των οδηγών δικτύου στο μέλλον.Ακόμη και με αυτό στο παιχνίδι, η συνολική τάση κλιμάκωσης εμφανίζεται ακριβώς όπως η NVMe-oF RDMA συνήθως συμπεριφέρεται όταν το μέγεθος του μπλοκ αυξάνεται.
Στο μικρότερο μέγεθος μπλοκ, το σύστημα μπορεί να παραδώσει πάνω από 6 εκατομμύρια IOPS σε διαδοχικά και τυχαία φορτία εργασίας.Και τυχαία γράψτε όλα κάθονται περίπου στην ίδια περιοχή σε 4K και 8K, γεγονός που υποδηλώνει ότι οι προνομιακοί πελάτες, η υποδομή PCIe και οι ίδιοι οι οδηγοί NVMe δεν έχουν πρόβλημα να συμβαδίσουν με το ποσοστό αιτήσεων.
Καθώς τα μεγέθη των τεμαχίων αυξάνονται, η αναμενόμενη πτώση των IOPS αρχίζει.,Η αύξηση της τάξης της τάξης των 3,3 εκατομμυρίων IOPS, η οποία ευθυγραμμίζεται με το πρόσθετο κόστος ουράς και CPU που εισάγεται από τα πρότυπα μικτής πρόσβασης.
Μετακινούμενοι στα μεγάλα μπλοκ, το IOPS συνεχίζει να συρρικνώνεται με προβλέψιμο γραμμικό τρόπο.και IOPS φυσικά πέφτει στα μέσα των εκατοντάδων χιλιάδωνΣε ένα μέγεθος μπλοκ 1M, όλα τα φορτία εργασίας συγκλίνουν σε 140K-153K IOPS, σύμφωνα με τους αριθμούς εύρους ζώνης που είδαμε στο προηγούμενο τμήμα.
GPUDirect Απόδοση αποθήκευσης
Μια από τις δοκιμές που κάναμε στο R7725xd ήταν η δοκιμή Magnum IO GPUDirect Storage (GDS).Το GDS είναι ένα χαρακτηριστικό που αναπτύχθηκε από την NVIDIA που επιτρέπει στις GPU να παρακάμπτουν την CPU κατά την πρόσβαση σε δεδομένα που αποθηκεύονται σε μονάδες NVMe ή άλλες συσκευές αποθήκευσης υψηλής ταχύτητας.Αντί να δρομολογεί δεδομένα μέσω της CPU και της μνήμης συστήματος, το GDS επιτρέπει την άμεση επικοινωνία μεταξύ της GPU και της συσκευής αποθήκευσης, μειώνοντας σημαντικά την καθυστέρηση και βελτιώνοντας την απόδοση δεδομένων.
Πώς λειτουργεί το GPUDirect Storage
Παραδοσιακά, όταν μια GPU επεξεργάζεται δεδομένα που αποθηκεύονται σε μια μονάδα NVMe, τα δεδομένα πρέπει πρώτα να ταξιδέψουν μέσω της CPU και της μνήμης του συστήματος πριν φτάσουν στην GPU.καθώς η CPU γίνεται ένας μεσάζωνΗ GPUDirect Storage εξαλείφει αυτή την αναποτελεσματικότητα επιτρέποντας στην GPU να έχει πρόσβαση σε δεδομένα απευθείας από τη συσκευή αποθήκευσης μέσω της λεωφορείας PCIe.Αυτή η απευθείας διαδρομή μειώνει την κίνηση δεδομένων, επιτρέποντας ταχύτερες και αποτελεσματικότερες μεταφορές δεδομένων.
Η εκπαίδευση μεγάλων νευρωνικών δικτύων απαιτεί την επεξεργασία τεραβάιτ δεδομένων,και οποιαδήποτε καθυστέρηση στη μεταφορά δεδομένων μπορεί να οδηγήσει σε ελλιπή χρήση των GPU και μεγαλύτερο χρόνο εκπαίδευσηςΗ GPUDirect Storage αντιμετωπίζει αυτή την πρόκληση εξασφαλίζοντας ότι τα δεδομένα παραδίδονται στην GPU όσο το δυνατόν γρηγορότερα, ελαχιστοποιώντας τον χρόνο αδρανείας και μεγιστοποιώντας την υπολογιστική απόδοση.
Επιπλέον, το GDS είναι ιδιαίτερα επωφελές για φορτία εργασίας που περιλαμβάνουν ροή μεγάλων συνόλων δεδομένων, όπως επεξεργασία βίντεο, επεξεργασία φυσικής γλώσσας ή συμπεράσματα σε πραγματικό χρόνο.Μειώνοντας την εξάρτηση από την CPU, το GDS επιταχύνει την κίνηση δεδομένων και απελευθερώνει πόρους CPU για άλλες εργασίες, βελτιώνοντας περαιτέρω τη συνολική απόδοση του συστήματος.
Πέρα από το ακατέργαστο εύρος ζώνης, το GPUDirect με NVMe-oF (TCP/RDMA) παρέχει επίσης I/O εξαιρετικά χαμηλής καθυστέρησης. Αυτό εξασφαλίζει ότι οι GPU δεν λιμοκτονούν ποτέ για δεδομένα, καθιστώντας το σύστημα ιδανικό για συμπεράσματα AI σε πραγματικό χρόνο,αναλυτικοί αγωγοί, και αναπαραγωγή βίντεο.
GDSIO Διαβάστε διαδοχικά
Κατά την εξέταση του PEAK:AIO με έναν πελάτη που χρησιμοποιεί το GDSIO, η απόδοση ανάγνωσης παρουσιάζει σαφές μοτίβο κλιμάκωσης καθώς αυξάνεται τόσο το μέγεθος του μπλοκ όσο και ο αριθμός των νήμων.Αυτός ο μοναδικός πελάτης συνδέθηκε μέσω δύο συνδέσεων 400G, περιορίζοντας τη συνολική του δυναμικότητα στα 90 GB/s.
Στα μικρότερα μεγέθη των τεμαχίων και χαμηλό αριθμό thread, η απόδοση είναι μέτρια, με τις αναγνώσεις 4K να ξεκινούν από περίπου 189 MiB / s σε ένα μόνο thread.Το σύστημα ανταποκρίνεται αμέσως., σπρώχνοντας 691MiB/s σε τέσσερα νήματα και σπάζοντας στο εύρος των πολλαπλών GiB/s καθώς μπαίνουμε σε μεγαλύτερα μπλοκ.
Τα μεσαία μεγέθη μπλοκ δείχνουν την ισχυρότερη ευαισθησία στον αριθμό των νήμων.με μόνο ελαφριά σύσφιξη πέρα από αυτόΈνα παρόμοιο μοτίβο εμφανίζεται σε 64K και 128K, όπου το σύστημα μεταβαίνει από χαμηλά μονοψήφια GiB/s σε χαμηλό παράλληλο σε πάνω από 30 GiB/s καθώς η κλίμακα του φόρτου εργασίας.
Μόλις φτάσουμε στα μεγαλύτερα μεγέθη μπλοκ, η απόδοση αρχίζει να ισορροπεί καθώς το σύστημα πλησιάζει το ανώτατο όριο απόδοσης για έναν μόνο πελάτη.Η απόδοση αυξάνεται από 11GiB/s σε ένα νήμα σε περίπου 88GiB/s σε υψηλό αριθμό νήματοςΟι μεταβιβάσεις 5 ΜB και 10 ΜB δείχνουν το ίδιο οροπέδιο, που κορυφώνεται γύρω στα 89 ̇ 90 GiB/s, ανεξάρτητα από το αν η δοκιμή εκτελείται σε 64, 128 ή 256 νήματα.
GDSIO Γράψτε διαδοχικά
Από την πλευρά της εγγραφής, η συμπεριφορά κλιμάκωσης ακολουθεί ένα παρόμοιο πρότυπο με τις αναγνώσεις, αλλά με ελαφρώς χαμηλότερη απόδοση στα περισσότερα μεγέθη μπλοκ, το οποίο αναμένεται για τα διαδοχικά φορτία εργασίας εγγραφής.Στα μικρότερα μεγέθη μπλοκΗ διαπερατότητα ξεκινά από 165 MiB / s για ένα ενιαίο νήμα σε 4K και αυξάνεται σταθερά καθώς αυξάνεται ο παράλληλος.
Τα μεσαία μεγέθη μπλοκ δείχνουν ισχυρότερα κέρδη καθώς αυξάνεται ο αριθμός των νήμων.Οι σειρές 64K και 128K συνεχίζουν την τάση, μετακινούνται από τα χαμηλά μονοψήφια GiB/s στα μέσα των 30 GiB/s και τα 50 GiB/s καθώς το φόρτο εργασίας γίνεται πιο παράλληλο.
Μεγαλύτερες μεταβιβάσεις συμβαίνουν όταν το σύστημα εγκατασταθεί στο φυσικό του ανώτατο όριο παραγωγής εγγραφής.Οι δοκιμές 5 MiB και 10 MiB ακολουθούν παρόμοιο πρότυπο, με τα αποτελέσματα να φτάνουν τα 90 GiB/s ανεξάρτητα από το αν το σύστημα τρέχει σε 64, 128 ή 256 νήματα.
Επαναπροσδιορισμός της απόδοσης στην εποχή της γενιάς 5
Υπεύθυνος Επικοινωνίας: Ms. Sandy Yang
Τηλ.:: 13426366826



