Το MinIO κυκλοφόρησε το MemKV, ένα ειδικό χώρο αποθήκευσης μνήμης περιεχομένου που δημιουργήθηκε για να επιλύσει ένα κρίσιμο μπουκάλιο εντός των αγωγών συμπερασμάτων τεχνητής νοημοσύνης μεγάλης κλίμακας.Το MinIO είναι η δεύτερη κορυφαία λύση παράλληλα με το AIStorΤο MemKV επεκτείνει την υποδομή δεδομένων της εταιρείας στο επίπεδο μνήμης.
MinIO AIStor
Καθώς τα συστήματα τεχνητής νοημοσύνης προχωρούν από τις μονομερείς απαντήσεις σε αιτιολόγηση πολλαπλών στροφών και αυτοματοποιημένη εκτέλεση εργασιών, η διατήρηση συνεχούς συνάρτησης σε κύκλους συμπερασμάτων έχει γίνει όλο και πιο απαραίτητη.Υπό τις υφιστάμενες αρχιτεκτονικές, τα δεδομένα περιεχομένου συχνά απορρίπτονται λόγω της περιορισμένης χωρητικότητας των επιπέδων μνήμης που βρίσκονται δίπλα στην GPU, συμπεριλαμβανομένων των HBM και DRAM. Αυτό αναγκάζει τις GPU να επαναπροσδιορίζουν το υπάρχον πλαίσιο επανειλημμένα, αυξάνοντας την καθυστέρηση,χρήση υπολογισμού και κατανάλωση ενέργειαςΤο MinIO ορίζει αυτό το περιττό φορτίο εργασίας ως τον "φόρο επαναπροσδιορισμού", μια αναποτελεσματικότητα που επιδεινώνεται εκθετικά σε περιβάλλοντα cloud υπερκλίμακας.
Το MemKV έχει σχεδιαστεί για να ανακουφίσει αυτό το σημείο πόνου μέσω ενός κοινού, μόνιμου στρώματος μνήμης ικανού για αποθήκευση σε κλίμακα petabyte με καθυστέρηση πρόσβασης σε επίπεδο μικροδευτερόλεπτου.Διατηρώντας τα δεδομένα του πλαισίου σε όλες τις ροές εργασίας συμπεράσματος, η πλατφόρμα μειώνει τις περιττές υπολογίσεις και αυξάνει τη συνολική αποτελεσματικότητα της υποδομής.Εσωτερικά δεδομένα αναφοράς από το MinIO επαληθεύουν βελτιωμένη καθυστέρηση χρόνου-πρώτου τόκεν υπό ταυτόχρονη παραγωγήΣε μια τυπική ανάπτυξη εξοπλισμένη με 128 GPUs και 128K-token context windows, η αξιοποίηση της GPU πήδηξε από περίπου 50% σε πάνω από 90%, μεταφράζοντας σε σημαντικές ετήσιες μειώσεις του κόστους υπολογισμού.
Τα στελέχη της MinIO δήλωσαν ότι το κόστος επαναπροσδιορισμού παραμένει αδιανόητο σε μικρής κλίμακας αναπτύξεις, αλλά μετατρέπεται σε ένα θεμελιώδες δομικό ελάττωμα σε επιχειρηματική κλίμακα.η επαναλαμβανόμενη αναγέννηση του πλαισίου συνεπάγεται υψηλότερη κατανάλωση ενέργειας και δαπάνες υποδομής, καθιστώντας τα εξειδικευμένα συστήματα μνήμης απαραίτητα για τη βιώσιμη λειτουργία της τεχνητής νοημοσύνης.
Αντιμετωπίζοντας την Ανταλλαγή στην Σκηνοθεσία Μνήμης
Η παραδοσιακή υποδομή τεχνητής νοημοσύνης αναγκάζει τους προγραμματιστές να συμβιβαστούν μεταξύ ταχύτητας πρόσβασης και χωρητικότητας αποθήκευσης.Τα επίπεδα μνήμης υψηλής απόδοσης όπως το HBM και το DRAM παρέχουν καθυστέρηση μικροδευτερόλεπτου, αλλά έρχονται με περιορισμένα όρια χωρητικότητας και υψηλά κόστηΑντίθετα, τα συμβατικά συστήματα αποθήκευσης προσφέρουν τεράστια κλιμακωτότητα, αλλά υποφέρουν από καθυστέρηση επιπέδου χιλιοστών δευτερολέπτων, καθιστώντας τα ασυμβίβαστα με την συμπερίληψη σε πραγματικό χρόνο και τις εργασίες συλλογισμού μακρού πλαισίου.
Micron HBM4
Το MemKV γεφυρώνει αυτό το χάσμα της βιομηχανίας εισάγοντας ένα ενδιάμεσο επίπεδο κοινής μνήμης που εξισορροπεί την εξαιρετικά χαμηλή καθυστέρηση και τη μεγάλη κλιμακωτότητα αποθήκευσης.Είναι συμβατό με το NVIDIA BlueField-4 STX και ενσωματωμένο με το NVIDIA Dynamo μαζί με τα εργαλεία NIXL, η λύση επιτρέπει σε ολόκληρα γκρουπ GPU να έχουν πρόσβαση σε ενοποιημένες δεξαμενές δεδομένων περιεχομένου με ταχύτητες μετάδοσης ευθυγραμμισμένες με συμπεράσματα.Αυτό το σχέδιο εξαλείφει την συχνή μετανάστευση δεδομένων περιβάλλοντος μεταξύ απομονωμένων στρωμάτων μνήμης και αποθήκευσης, μειώνοντας την καθυστέρηση και αυξάνοντας την απόδοση του συστήματος.
NVIDIA BlueField-4
Αρχιτεκτονική βελτιστοποιημένη για φορτία εργασίας συμπεράσματος
Προσαρμοσμένο αποκλειστικά για αγωγούς δεδομένων συμπεράσματος, το MemKV εντάσσεται στο στρώμα G3.5 του πλαισίου ιεραρχίας μνήμης GPU του MinIO.επιτυγχάνει χωρητικότητα επιπέδου petabyte διατηρώντας την καθυστέρηση πρόσβασης μικροδευτερολέπτου, αποσυνδέοντας με επιτυχία την επεκτασιμότητα μνήμης από τους υπολογιστικούς πόρους της GPU.
Το σύστημα εγκαταλείπει τις δύσκολες παραδοσιακές αφαιρέσεις αποθήκευσης, μεταφέροντας δεδομένα απευθείας από τις μονάδες NVMe σε αγωγούς δεδομένων AI μέσω μετάδοσης RDMA από άκρο σε άκρο.Αυτό μειώνει το κόστος απόδοσης που προκαλείται από τα πρωτόκολλα HTTP, τη μετατροπή συστημάτων αρχείων και τους διακομιστές ενδιάμεσης αποθήκευσης, κοινά προβλήματα στις αρχιτεκτονικές αποθήκευσης αντικειμένων και αρχείων.
Πηγή: Google
Βασικές βελτιστοποιήσεις αρχιτεκτονικής περιλαμβάνουν την εγγενή διπλή εκτέλεση ARM64 στο NVIDIA BlueField-4 STX, ενσωματωμένη απευθείας στο στρώμα αποθήκευσης για να μειωθεί η εξάρτηση από εξωτερικούς κόμβους αποθήκευσης x86.Όλες οι μεταφορές δεδομένων μεταξύ μνήμης GPU και αποθήκευσης NVMe υιοθετούν μετάδοση RDMAΕπιπλέον, το MemKV χρησιμοποιεί διευρυμένα μεγέθη μπλοκ που κυμαίνονται από 2 MB έως 16 MB,τα οποία είναι βελτιστοποιημένα για τα χαρακτηριστικά χωρητικότητας GPU αντί για τα παλαιά 4 KB μπλοκ αποθήκευσηςΥποστηρίζει προηγμένα υφάσματα υψηλής ταχύτητας διασύνδεσης, όπως το NVIDIA Spectrum-X Ethernet και το PCIe Gen6, διευκολύνοντας τη μετάδοση δεδομένων με σχεδόν ταχύτητα καλωδίου σε όλα τα clusters.
Διαθεσιμότητα
Το MinIO MemKV είναι πλέον διαθέσιμο για επιχειρηματική χρήση.
Πεκίνο Qianxing Jietong Technology Co., Ltd.
Σάντι Γιανγκ, Διευθυντής Παγκόσμιας Στρατηγικής
WhatsApp / WeChat: +86 13426366826
Ηλεκτρονικό μήνυμα: yangyd@qianxingdata.com
Ιστοσελίδα: www.qianxingdata.com/www.storagesserver.com
Επικεντρώσου στις επιχειρήσεις:
Διανομή προϊόντων ΤΠΕ/Ενσωμάτωση συστημάτων και υπηρεσίες/Λύσεις υποδομής
Με 20+ χρόνια εμπειρίας διανομής πληροφορικής, συνεργαζόμαστε με κορυφαίες παγκόσμιες μάρκες για την παροχή αξιόπιστων προϊόντων και επαγγελματικών υπηρεσιών.
Χρησιμοποιώντας την τεχνολογία για την οικοδόμηση ενός ευφυούς κόσμουΟ αξιόπιστος πάροχος υπηρεσιών προϊόντων ΤΠΕ!
Σάντι Γιανγκ, Διευθυντής Παγκόσμιας Στρατηγικής
WhatsApp / WeChat: +86 13426366826
Ηλεκτρονικό μήνυμα: yangyd@qianxingdata.com
Ιστοσελίδα: www.qianxingdata.com/www.storagesserver.com
Επικεντρώσου στις επιχειρήσεις:
Διανομή προϊόντων ΤΠΕ/Ενσωμάτωση συστημάτων και υπηρεσίες/Λύσεις υποδομής
Με 20+ χρόνια εμπειρίας διανομής πληροφορικής, συνεργαζόμαστε με κορυφαίες παγκόσμιες μάρκες για την παροχή αξιόπιστων προϊόντων και επαγγελματικών υπηρεσιών.
Χρησιμοποιώντας την τεχνολογία για την οικοδόμηση ενός ευφυούς κόσμουΟ αξιόπιστος πάροχος υπηρεσιών προϊόντων ΤΠΕ!



