Η WEKA ανακοίνωσε την ενσωμάτωση της πλατφόρμας NeuralMesh με την αρχιτεκτονική αναφοράς NVIDIA STX,σχετικά με την καθιέρωση του δικτύου αυξημένης μνήμης ως βασικού δομικού στοιχείου για την υποδομή τεχνητής νοημοσύνης επόμενης γενιάςΗ συνδυασμένη λύση αντιμετωπίζει ένα από τα σημαντικότερα σημεία συμφόρησης σε περιβάλλοντα συμπεράσματος μεγάλης κλίμακας: περιορισμούς μνήμης που επηρεάζουν άμεσα την απόδοση, το συνολικό κόστος ιδιοκτησίας, το κόστος αποθήκευσης και το κόστος αποθήκευσης.και κλιμακούμενη ανάπτυξη.
Λειτουργώντας μέσω του NeuralMesh, το WEKA's Augmented Memory Grid επεκτείνει τη μνήμη GPU με την εξωτερικοποίηση και τη διατήρηση των αποθηκευτικών αποθηκευτικών αποθηκευτικών αποθηκευτικών αποθηκευτικών αποθηκευτικών αποθηκευτικών αποθηκευτικών αποθηκευτικών αποθηκευτικών αποθηκευτικών αποθηκευτικών αποθηκευτικών αποθηκευτικών αποθηκευτικών αποθηκευτικών αποθηκευτικών αποθηκευτικών αποθηκευτικών αποθηκευτικών αποθηκευτικών αποθηκευτικών αποθηκευτικών αποθηκευτικών αποθηκευτικών αποθηκευτικών αποθηκευτικών αποθηκευτικών αποθηκευτικών αποθηκευτικών αποθηκευτικών αποθηκευτικών αποθηκευτικών αποθηκευτικών αποθηκευτικών αποθηκευτικών αποθηκευτικών αποθηκευτικών αποθηκευτικών αποθηκευτικών αποθηκευτικών αποθηκευτικών αποθηκευτικών αποθηκευτικών αποθηκευτικών αποθηκευτικών αποθηκευτικών αποθηκευτικών αποθηκευτικών αποθηκευτικών αποθηκευτικών αποθηκευτικών αποθηκευτικώνΑυτή η αρχιτεκτονική παρέχει υψηλής απόδοσης περιβαλλοντική μνήμη αποθήκευσης για agentic AI φορτία εργασίαςΣύμφωνα με την εταιρεία, οι ρυθμίσεις που συνδυάζουν τα συστήματα NVIDIA Vera Rubin NVL72, τις DPU BlueField-4,και το Spectrum-X Ethernet μπορεί να αυξήσει την απόδοση του κωδικού μνήμης περιεχομένου από 4x έως 10xΗ πλατφόρμα προβλέπεται επίσης να παρέχει τουλάχιστον 320 GB/s διαβάζοντας και 150 GB/s γράφοντας απόδοση, περισσότερο από διπλάσια από την απόδοση των παραδοσιακών αρχιτεκτονικών αποθήκευσης τεχνητής νοημοσύνης.
Η Υποδομή Μνήμης Γίνεται Το Σφραγίδιο Συμπεράσματος
Η WEKA επικεντρώνει αυτή την ολοκλήρωση στην αυξανόμενη πρόκληση του τοίχου μνήμης στις σύγχρονες αναπτύξεις τεχνητής νοημοσύνης.που οδηγεί σε επαναλαμβανόμενο υπολογισμό και μειωμένη λειτουργική αποτελεσματικότηταΚαθώς η ταυτόχρονη λειτουργία του συστήματος αυξάνεται, αυτές οι αναποτελεσματικότητες πολλαπλασιάζονται, αυξάνοντας τα έξοδα υποδομής και μειώνοντας την προβλεψιμότητα των επιδόσεων.
Η εταιρεία προωθεί την κοινή υποδομή KV cache ως λύση.Η κοινή αποθήκευση απομακρύνει την περιττή επεξεργασία και σταθεροποιεί την απόδοση των tokenΗ NVIDIA STX παρέχει την επικυρωμένη αρχιτεκτονική αναφοράς για αυτό το μοντέλο, ενώ η WEKA παρέχει το στρώμα επέκτασης αποθήκευσης και μνήμης.
NeuralMesh και Αυξημένη Αρχιτεκτονική Δίκτυου Μνήμης
Το NeuralMesh λειτουργεί ως η διανεμημένη πλατφόρμα αποθήκευσης του WEKA, κατασκευασμένη για να ενσωματώνεται απρόσκοπτα σε ολόκληρο το NVIDIA STX stack.ενώ το Augmented Memory Grid χρησιμεύει ως ένα αφιερωμένο στρώμα επέκτασης μνήμης που ενοποιεί το KV cache εκτός της μνήμης GPU.
Αυτή η σχεδίαση επιτρέπει στα περιβάλλοντα συμπεράσματος να διατηρούν συνεδρίες μεγάλου περιεχομένου χωρίς να υπερφορτώνουν τους πόρους της GPU.Η πλατφόρμα διατηρεί υψηλή αξιοποίηση και σταθερή απόδοση καθώς οι αναπτύξεις κλιμακώνονται.
Η WEKA σημειώνει ότι το Augmented Memory Grid, που παρουσιάστηκε για πρώτη φορά στο GTC 2025 και είναι τώρα γενικά διαθέσιμο, έχει επικυρωθεί σε πλατφόρμες CPU NVIDIA Grace σε συνδυασμό με DPU BlueField.Η αρχιτεκτονική παρέχει μετρήσιμα κέρδη στην αποδοτικότητα συμπερασμάτων, συμπεριλαμβανομένου του δραστικά ταχύτερου χρόνου-πρώτου-τοκεν, της υψηλότερης απόδοσης για κάθε GPU και της σταθερής απόδοσης υπό αυξημένη ταυτόχρονη λειτουργία.Η αποφόρτιση της διαδρομής δεδομένων στο BlueField-4 μειώνει επίσης το CPU overhead και ανακουφίζει από τα μπουκάλια I / O.
Αύξηση της απόδοσης και της αποτελεσματικότητας
Σε περιβάλλοντα όπως η παραγωγή, η πλατφόρμα έχει σχεδιαστεί για να ενισχύσει την ανταπόκριση και την αποτελεσματικότητα της υποδομής.Η WEKA δηλώνει ότι το Augmented Memory Grid μπορεί να μειώσει το χρόνο-προς-πρώτο-τόκεν από 4x έως 20xΟι βελτιώσεις αυτές οφείλονται σε υψηλότερα ποσοστά επιτυχίας KV cache και λιγότερους κύκλους επαναπροσδιορισμού,Επιτρέποντας στα συστήματα να διατηρούν τις επιδόσεις καθώς αυξάνονται τα μεγέθη του περιβάλλοντος και ο αριθμός των χρηστών.
Η Firmus, ένας πάροχος υποδομής τεχνητής νοημοσύνης, αναδεικνύεται ως ένας από τους πρώτους υιοθετητές που αξιοποιεί το NeuralMesh με υποδομή βασισμένη στην NVIDIA.,με κέρδη που προέρχονται από την αποτελεσματικότερη χρήση των υφιστάμενων GPU αντί για πρόσθετες αναπτύξεις υλικού.
Συμπεράσματα για το σχεδιασμό υποδομής τεχνητής νοημοσύνης
Η ενσωμάτωση αυτή υπογραμμίζει μια μετατόπιση στον σχεδιασμό συστημάτων AI, όπου οι στρατηγικές μνήμης και αποθήκευσης καθορίζουν όλο και περισσότερο τη συνολική απόδοση και την αποδοτικότητα κόστους.Καθώς τα φορτία εργασίας της αντιπροσωπευτικής τεχνητής νοημοσύνης επεκτείνονται και τα παράθυρα περιεχομένου διευρύνονται, οι προσεγγίσεις μόνο με DRAM γίνονται μη βιώσιμες λόγω των αυξανόμενων δαπανών επαναπροσδιορισμού και των ελλιπώς χρησιμοποιούμενων GPU.
Η WEKA θέτει την μόνιμη, κοινή KV cache ως θεμελιώδη ικανότητα για εργοστάσια τεχνητής νοημοσύνης.μικρότερη κατανάλωση ενέργειας ανά εργασία συμπεράσματοςΑντίθετα, τα περιβάλλοντα που βασίζονται αποκλειστικά στην τοπική μνήμη GPU πιθανότατα θα αντιμετωπίσουν αυξανόμενα λειτουργικά κόστη και μειωμένες αποδόσεις καθώς αυξάνονται τα φορτία εργασίας.
Πεκίνο Qianxing Jietong Technology Co., Ltd.
Σάντι Γιανγκ, Διευθυντής Παγκόσμιας Στρατηγικής
WhatsApp / WeChat: +86 13426366826
Ηλεκτρονικό μήνυμα: yangyd@qianxingdata.com
Ιστοσελίδα: www.qianxingdata.com/www.storagesserver.com
Επικεντρώσου στις επιχειρήσεις:
Διανομή προϊόντων ΤΠΕ/Ενσωμάτωση συστημάτων και υπηρεσίες/Λύσεις υποδομής
Με 20+ χρόνια εμπειρίας διανομής πληροφορικής, συνεργαζόμαστε με κορυφαίες παγκόσμιες μάρκες για την παροχή αξιόπιστων προϊόντων και επαγγελματικών υπηρεσιών.
Χρησιμοποιώντας την τεχνολογία για την οικοδόμηση ενός ευφυούς κόσμουΟ αξιόπιστος πάροχος υπηρεσιών προϊόντων ΤΠΕ!
Σάντι Γιανγκ, Διευθυντής Παγκόσμιας Στρατηγικής
WhatsApp / WeChat: +86 13426366826
Ηλεκτρονικό μήνυμα: yangyd@qianxingdata.com
Ιστοσελίδα: www.qianxingdata.com/www.storagesserver.com
Επικεντρώσου στις επιχειρήσεις:
Διανομή προϊόντων ΤΠΕ/Ενσωμάτωση συστημάτων και υπηρεσίες/Λύσεις υποδομής
Με 20+ χρόνια εμπειρίας διανομής πληροφορικής, συνεργαζόμαστε με κορυφαίες παγκόσμιες μάρκες για την παροχή αξιόπιστων προϊόντων και επαγγελματικών υπηρεσιών.
Χρησιμοποιώντας την τεχνολογία για την οικοδόμηση ενός ευφυούς κόσμουΟ αξιόπιστος πάροχος υπηρεσιών προϊόντων ΤΠΕ!



