εταιρικά νέα για Lightbits και ScaleFlux demo 100x έως 280x KV επιτάχυνση Cache

Όλα τα Προϊόντα

Κεντρικός υπολογιστής αποθήκευσης ραφιών
(179)

Κεντρικός υπολογιστής τήξης Huawei
(31)

Κεντρικός υπολογιστής της Dell Poweredge
(59)

H3C κεντρικός υπολογιστής
(31)

Διακόπτες Datacom
(96)

Συσκευή WLAN
(21)

Έξυπνος ασύρματος δρομολογητής
(17)

Σκληρός δίσκος HDD
(78)

Εσωτερικός σκληρός δίσκος SSD
(16)

Γραφική κάρτα Geforce
(27)

Επεξεργαστής της INTEL ΚΜΕ
(20)

RAM μνήμης κεντρικών υπολογιστών
(6)

Ανανεωμένος κεντρικός υπολογιστής αποθήκευσης
(6)

Ενότητα πομποδεκτών SFP
(4)

Διακόπτης καναλιών ινών
(125)

Πιστοποίηση

Κίνα Beijing Qianxing Jietong Technology Co., Ltd. Πιστοποιήσεις

Αναθεωρήσεις πελατών

Το προσωπικό πωλήσεων της Co. τεχνολογίας του Πεκίνου Qianxing Jietong, ΕΠΕ είναι πολύ επαγγελματικό και υπομονετικό. Μπορούν να παρέχουν τις αναφορές γρήγορα. Η ποιότητα και η συσκευασία των προϊόντων είναι επίσης πολύ υψηλές. Η συνεργασία μας είναι πολύ ομαλή.

—— 《Festfing DV》 LLC

Όταν έψαχνα τη Intel ΚΜΕ και Toshiba SSD επειγόντως, αμμώδης από το Πεκίνο Qianxing Jietong η Co. τεχνολογίας, ΕΠΕ μου έδωσε πολλή βοήθεια και με πήρε τα προϊόντα που χρειάστηκα γρήγορα. Την εκτιμώ πραγματικά.

—— Γεν γατακιών

Αμμώδης του Πεκίνου Qianxing Jietong η Co. τεχνολογίας, ΕΠΕ είναι πολύ προσεκτικός πωλητής, ο οποίος μπορεί να υπενθυμίσει σε με τα λάθη διαμόρφωσης εγκαίρως πότε αγοράζω έναν κεντρικό υπολογιστή. Οι μηχανικοί είναι επίσης πολύ επαγγελματικοί και μπορούν γρήγορα να ολοκληρώσουν την εξεταστική διαδικασία.

—— Strelkin Mikhail Vladimirovich

Είμαστε πολύ ευχαριστημένοι με την εμπειρία μας συνεργασίας με την Beijing Qianxing Jietong. Η ποιότητα των προϊόντων είναι εξαιρετική και η παράδοση γίνεται πάντα στην ώρα της. Η ομάδα πωλήσεων είναι επαγγελματική, υπομονετική και πολύ εξυπηρετική με όλα μας τα ερωτήματα. Εκτιμούμε πραγματικά την υποστήριξή τους και προσβλέπουμε σε μια μακροχρόνια συνεργασία. Συνιστάται ανεπιφύλακτα!

—— Ahmad Navid

Ποιότητα: Μεγάλη εμπειρία με τον προμηθευτή μου.Το MikroTik RB3011 είχε ήδη χρησιμοποιηθεί, αλλά ήταν σε πολύ καλή κατάσταση και όλα λειτουργούν τέλεια.Η επικοινωνία ήταν γρήγορη και ομαλή.Και όλες μου οι ανησυχίες λύθηκαν γρήγορα.- Πολύ αξιόπιστος προμηθευτής.

—— Γκεράν Κολέσιο

Είμαι Online Chat Now

επιχείρηση Ειδήσεις

Lightbits και ScaleFlux demo 100x έως 280x KV επιτάχυνση Cache

Η Lightbits Labs και η ScaleFlux έχουν επιτύχει μια 100x έως 280x αύξηση απόδοσης για φόρτους εργασίας KV cache, αξιοποιώντας το λογισμικό cache LightInferra για την ανάγνωση δεδομένων από SSDs υπολογιστικής αποθήκευσης ScaleFlux.

Οι δύο εταιρείες προμήθευσαν δεδομένα KV cache σε GPUs που αναπτύχθηκαν σε περιβάλλον κέντρου δεδομένων FarmGPU και θα παρουσιάσουν αυτή την καινοτομία στο επερχόμενο συνέδριο GTC της Nvidia. Μια KV cache αποθηκεύει διανύσματα token στη μνήμη υψηλού εύρους ζώνης (HBM) μιας GPU. Μόλις εξαντληθεί η χωρητικότητα της HBM, τα μπλοκ δεδομένων KV cache πρέπει να υπολογιστούν εκ νέου — μια διαδικασία που καταναλώνει χρόνο και υποβαθμίζει τις ταχύτητες εκπαίδευσης και εξαγωγής συμπερασμάτων AI. Αυτή η επιβράδυνση γίνεται ιδιαίτερα έντονη καθώς οι φόρτοι εργασίας AI κλιμακώνονται, οδηγώντας σε απότομη αύξηση του αριθμού των token που χρησιμοποιούνται για τη δημιουργία διανυσμάτων.

Το λογισμικό KV cache επεκτείνει λογικά το επίπεδο cache προς τα έξω: πρώτα στην CPU x86 και τη DRAM της στον διακομιστή GPU, στη συνέχεια σε τοπικούς δίσκους NVMe στο ίδιο σύστημα x86, και περαιτέρω σε εξωτερικούς SSD NVMe. Αυτή η κλιμακωτή επέκταση εξαλείφει την ανάγκη επανυπολογισμού διανυσμάτων token. Ενώ οι SSD NVMe έχουν φυσικά υψηλότερη καθυστέρηση πρόσβασης από την HBM ή τη DRAM, η ανάκτηση προ-υπολογισμένων διανυσμάτων token είναι πολύ ταχύτερη από τον επανυπολογισμό δεκάδων χιλιάδων από αυτά από την αρχή. Η Lightbits και η ScaleFlux ισχυρίζονται ότι η λύση τους επιταχύνει δραστικά την ανάκτηση δεδομένων KV cache από SSDs.

Ο Arthur Rasmusson, Διευθυντής Αρχιτεκτονικής AI στην Lightbits Labs, δήλωσε: «Μεταμορφώνουμε τη μνήμη εξαγωγής συμπερασμάτων από μια αντιδραστική cache σε ένα έξυπνο, ροϊκό επίπεδο δεδομένων».

Πώς;

«Προ-ανακτώντας μόνο τα δεδομένα που έχουν σημασία και παραδίδοντάς τα σε GPUs μέσω RDMA υψηλής ταχύτητας πριν χρειαστούν, εξαλείφουμε τις καθυστερήσεις που παραδοσιακά περιορίζουν την απόδοση μεγάλου πλαισίου. Το αποτέλεσμα είναι χαμηλότερος Χρόνος-προς-Πρώτο-Token (TTFT), πιο σταθερή απόδοση υπό πραγματικό φορτίο και σημαντικά υψηλότερη αποτελεσματική χρήση της GPU».

Ο Keith McKay, Ανώτερος Διευθυντής Αρχιτεκτονικής Λύσεων και Τεχνικών Συνεργασιών στην ScaleFlux, σχολίασε: «Αυτό που δείχνουμε στο GTC είναι μια πρώιμη ματιά στο πώς η έξυπνότερη τοποθέτηση δεδομένων και η διαχείριση επίμονης κατάστασης προσοχής μπορούν να βοηθήσουν τα συστήματα εξαγωγής συμπερασμάτων να παραμείνουν ανταποκρίσιμα καθώς τα παράθυρα πλαισίου μεγαλώνουν. Αυτή είναι μια συνεργασία που θέλουμε να διαμορφώσουμε μαζί με πραγματικούς χειριστές».

Τόσο η Lightbits όσο και η ScaleFlux στοχεύουν να ενθαρρύνουν τους χειριστές cloud και υποδομών να υιοθετήσουν το λογισμικό και τους SSDs τους, εξαλείφοντας τον δαπανηρό χρόνο αδράνειας των GPUs.

Ας εξετάσουμε πρώτα τη συμβολή της ScaleFlux, και στη συνέχεια ας προχωρήσουμε στο πιο εξελιγμένο επίπεδο λογισμικού της Lightbits.

Η ScaleFlux παρέχει SSDs NVMe και Computational Storage Drives (CSDs) εξοπλισμένα με τεχνολογία μείωσης εγγραφής (WRT) βασισμένη σε υλικό. Τροφοδοτούμενοι από επιτάχυνση υλικού συμπίεσης και διαχείριση μεταδεδομένων που οδηγείται από SoC, αυτοί οι δίσκοι προσφέρουν έως και τέσσερις φορές περισσότερη λογική χωρητικότητα από την φυσική αποθήκευση, παραμένοντας πλήρως διαφανείς στα συστήματα υποδοχής. Η εταιρεία είναι μέλος του κοινοπραξίας Open Flash Platform (OFP), η οποία εργάζεται για τον επαναπροσδιορισμό της υποδομής δεδομένων AI με πυκνά, χαμηλής καθυστέρησης, ενεργειακά αποδοτικά συστήματα — προσφέροντας 10 φορές την πυκνότητα της συμβατικής αποθήκευσης AI βασισμένης σε αρχεία και μόλις το ένα δέκατο της κατανάλωσης ενέργειας.

Βασιζόμενη σε αυτούς τους δίσκους αποθήκευσης, η Lightbits προσθέτει έξυπνη προ-ανάκτηση δεδομένων KV Cache πριν οι GPUs τα χρειαστούν, αποτρέποντας καθυστερήσεις που προκαλούνται από ανεπαρκή χωρητικότητα KV ή δαπανηρό επανυπολογισμό διανυσμάτων token. Το λογισμικό LightInferra χρησιμοποιεί αλγορίθμους caching βελτιστοποιημένους για KV Cache για να φέρει τα απαιτούμενα δεδομένα στη μνήμη της GPU με ταχύτητες RDMA πριν από την πραγματική ζήτηση.

Και πάλι, πώς;

Το λογισμικό εκτελείται στον κεντρικό υπολογιστή x86 που είναι ενσωματωμένος στους διακομιστές GPU και παρακολουθεί τα μοτίβα πρόσβασης των μπλοκ δεδομένων KV Cache. Χρησιμοποιώντας αυτή την τηλεμετρία, λειτουργεί μια μηχανή Sub-Linear Sparse Attention Prefetch (SLSAP) για να εντοπίσει τα μπλοκ KV που είναι πιο πιθανό να χρειαστούν στη συνέχεια.

Αυτή η μηχανή συνδυάζει hashing ευαίσθητο στην τοποθεσία (LSH) με μοντελοποίηση στατιστικής επαναχρησιμοποίησης — αναλύοντας την ιστορική τοποθεσία πρόσβασης σε υπολογισμούς προσοχής — για να βαθμολογήσει και να δώσει προτεραιότητα στα μπλοκ KV, και στη συνέχεια επιλέγει αυτά με την υψηλότερη πιθανότητα να ζητηθούν από τις GPUs.

Αυτή η διαδικασία επιλογής αξιοποιεί την εγγενή αραιότητα στην πρόσβαση δεδομένων της GPU: τα περισσότερα token σχετίζονται ουσιαστικά μόνο με ένα μικρό υποσύνολο προηγούμενων token. Απομονώνοντας αυτά τα μπλοκ υψηλής πιθανότητας, η λύση μειώνει δραστικά τον όγκο των διανυσμάτων token που πρέπει να μεταδοθούν πίσω στις GPUs.

Ένας δεύτερος αλγόριθμος εστιάζει σε μοτίβα επαναχρησιμοποίησης: πρόσφατα token, σημασιολογικά παρόμοια token και δομικά μοτίβα κοινά σε σενάρια RAG ή συνομιλίας πολλαπλών γύρων επαναχρησιμοποιούνται συχνά και δίνεται προτεραιότητα ανάλογα.

Το LightInferra ανακτά αυτά τα μπλοκ token πρώτα από τη DRAM του διακομιστή x86, ή από εξωτερικούς SSDs ScaleFlux εάν είναι απαραίτητο, και στη συνέχεια τα προφορτώνει στη HBM της GPU μέσω συνδέσεων RDMA.

Η Lightbits έχει κάνει benchmark αυτή την προσέγγιση σε σύγκριση με την επανυπολογισμό του περιεχομένου που είναι αποθηκευμένο στην cache από την αρχή, χρησιμοποιώντας φόρτους εργασίας μεγάλων γλωσσικών μοντέλων, μετρώντας βελτιώσεις στον Χρόνο-προς-Πρώτο-Token (TTFT). Οι αναφερόμενες τιμές επιτάχυνσης 100x έως 280x προέρχονται απευθείας από αυτά τα αποτελέσματα δοκιμών.

Φυσικά, θα θέλαμε να δούμε αποτελέσματα benchmark που συγκρίνουν την επιτάχυνση KV Cache Lightbits-ScaleFlux

σχήμα με επιταχυντές KV Cache από DDN, Hammerspace, VAST Data, WEKA και άλλους, αλλά αυτά

δεν είναι διαθέσιμα.

Υπάρχουν γραφήματα που δείχνουν πώς το LightInferra-ScaleFlux βελτιώθηκε σταδιακά στον TTFT αναγέννησης cache

καθώς το μέγεθος του μοντέλου αυξάνεται. Π.χ.;

τα τελευταία νέα της εταιρείας για Lightbits και ScaleFlux demo 100x έως 280x KV επιτάχυνση Cache 1

Όλα τα σχετικά δεδομένα benchmark παρουσιάζονται σε γραφήματα λογαριθμικής κλίμακας, προσαρμοσμένα κυρίως για επαγγελματίες επιστήμης υπολογιστών, αλλά η απλή γλώσσα καθιστά τον πραγματικό αντίκτυπο πολύ πιο εύκολο να γίνει κατανοητός: «Το αποτέλεσμα είναι σταθερή απόδοση Χρόνου-προς-Πρώτο-Token (TTFT) καθώς το πλαίσιο κλιμακώνεται από 100k token προς 1 εκατομμύριο και παραπάνω».

Όπως λέει ο Jonmichael Hands της FarmGPU, όταν μια συνομιλία 400k token συνεχίζεται και το σύστημα πρέπει να αναγεννήσει ολόκληρη την KV cache από την αρχή, αυτό σημαίνει δύο πλήρη λεπτά χρόνου λειτουργίας της GPU χωρίς παραγωγή token. Το LightInferra αλλάζει εντελώς το οικονομικό μοντέλο — ο ίδιος φόρτος εργασίας παράγει το πρώτο του token σε λιγότερο από μισό δευτερόλεπτο, μετατρέποντας μια μη βιώσιμη βαθμίδα προϊόντος σε κερδοφόρα.

Η Lightbits και η ScaleFlux έχουν σχεδιάσει αυτή την κοινή λύση ειδικά για τις GPU φάρμες επόμενης γενιάς, όπου μεγάλα pods GPU εκτελούν εκατοντάδες ή ακόμη και χιλιάδες ταυτόχρονους φόρτους εργασίας μοντέλων AI. Σχεδόν όλοι αυτοί οι φόρτοι εργασίας θα φτάσουν στο όριο της χωρητικότητας της KV cache στη μνήμη υψηλού εύρους ζώνης (HBM) της GPU.

Σε παραδοσιακές ρυθμίσεις, οι ομάδες αντιμετωπίζουν δύο δαπανηρές επιλογές: αργή ανάκτηση διανυσμάτων token από γενική εξωτερική αποθήκευση, ή η πολύ πιο χρονοβόρα διαδικασία επανυπολογισμού αυτών των διανυσμάτων από την αρχή — και οι δύο αφήνουν τις GPUs αδρανείς για ώρες. Ο συνδυασμός LightInferra και ScaleFlux εξαλείφει εντελώς αυτό το καταστροφικό πρόβλημα της βιομηχανίας.

Ο CEO της FarmGPU, Jonmichael Hands, πρόσθεσε: «Η γρήγορη δικτυωμένη αποθήκευση από την Lightbits ξεκλειδώνει μια πληθώρα νέων περιπτώσεων χρήσης για εξαγωγή συμπερασμάτων μεγάλου πλαισίου. Συνδυάζοντας την διαχειριζόμενη υπηρεσία μας με την υψηλής απόδοσης αποθήκευση της Lightbits που λειτουργεί σε δίσκους NVMe της ScaleFlux, μπορούμε να μειώσουμε τον χρόνο προς το πρώτο token και να αυξήσουμε την αξιοποίηση της GPU, μειώνοντας δραστικά το συνολικό κόστος ιδιοκτησίας (TCO) για φόρτους εργασίας εξαγωγής συμπερασμάτων».

Beijing Qianxing Jietong Technology Co., Ltd.
Sandy Yang/Global Strategy Director
WhatsApp / WeChat: +86 13426366826
Email: yangyd@qianxingdata.com
Website: www.qianxingdata.com/www.storagesserver.com

Επιχειρηματική Εστίαση:
Διανομή Προϊόντων ICT/Ενσωμάτωση Συστημάτων & Υπηρεσίες/Λύσεις Υποδομών
Με 20+ χρόνια εμπειρίας στη διανομή IT, συνεργαζόμαστε με κορυφαίες παγκόσμιες μάρκες για την παροχή αξιόπιστων προϊόντων και επαγγελματικών υπηρεσιών.
«Χρησιμοποιώντας την Τεχνολογία για την Οικοδόμηση ενός Έξυπνου Κόσμου» Ο Αξιόπιστος Πάροχος Υπηρεσιών Προϊόντων ICT!

Χρόνος μπαρ : 2026-03-18 11:34:46 >> κατάλογος ειδήσεων

Στοιχεία επικοινωνίας

Beijing Qianxing Jietong Technology Co., Ltd.

Υπεύθυνος Επικοινωνίας: Ms. Sandy Yang

Τηλ.:: 13426366826

εταιρικά νέα για Lightbits και ScaleFlux demo 100x έως 280x KV επιτάχυνση Cache

Κεντρικός υπολογιστής αποθήκευσης ραφιών

Κεντρικός υπολογιστής τήξης Huawei

Κεντρικός υπολογιστής της Dell Poweredge

H3C κεντρικός υπολογιστής

Διακόπτες Datacom

Συσκευή WLAN

Έξυπνος ασύρματος δρομολογητής

Σκληρός δίσκος HDD

Εσωτερικός σκληρός δίσκος SSD

Γραφική κάρτα Geforce

Επεξεργαστής της INTEL ΚΜΕ

RAM μνήμης κεντρικών υπολογιστών

Ανανεωμένος κεντρικός υπολογιστής αποθήκευσης

Ενότητα πομποδεκτών SFP

Διακόπτης καναλιών ινών

Πώς;

Και πάλι, πώς;

Κεντρικός υπολογιστής αποθήκευσης ραφιών

12 κεντρικός υπολογιστής ραφιών Lenovo ThinkSystem SR630 κεντρικών υπολογιστών κόλπων 1U Rackmount

Επεξεργαστής της Intel Xeon ε-2378G κεντρικών υπολογιστών αποθήκευσης ραφιών ThinkSystem SR250 V2 4SFF

Το ράφι Inspur NF5180M6 1U κεντρικών υπολογιστών αποθήκευσης ραφιών της Intel C621A τοποθετεί τον κεντρικό υπολογιστή

Κεντρικός υπολογιστής τήξης Huawei

FusionServer 5288 κεντρικός υπολογιστής 32 DDR4 DIMMs ραφιών V6 4U 44 σκληροί δίσκοι 3,5 ιντσών

Υπερβολικός κεντρικός υπολογιστής 1288H V5 αποθήκευσης δικτύων κεντρικών υπολογιστών 1U τήξης Huawei υψηλής πυκνότητας

Νέο GEN OceanStor 5310 υβριδική αποθήκευση λάμψης κεντρικών υπολογιστών ραφιών Huawei