logo
Αρχική Σελίδα Υποθέσεις

Η IBM Παρουσιάζει Αποθήκευση Ενήμερη για Περιεχόμενο για Φορτία Εργασίας RAG

Πιστοποίηση
Κίνα Beijing Qianxing Jietong Technology Co., Ltd. Πιστοποιήσεις
Κίνα Beijing Qianxing Jietong Technology Co., Ltd. Πιστοποιήσεις
Αναθεωρήσεις πελατών
Το προσωπικό πωλήσεων της Co. τεχνολογίας του Πεκίνου Qianxing Jietong, ΕΠΕ είναι πολύ επαγγελματικό και υπομονετικό. Μπορούν να παρέχουν τις αναφορές γρήγορα. Η ποιότητα και η συσκευασία των προϊόντων είναι επίσης πολύ υψηλές. Η συνεργασία μας είναι πολύ ομαλή.

—— 《Festfing DV》 LLC

Όταν έψαχνα τη Intel ΚΜΕ και Toshiba SSD επειγόντως, αμμώδης από το Πεκίνο Qianxing Jietong η Co. τεχνολογίας, ΕΠΕ μου έδωσε πολλή βοήθεια και με πήρε τα προϊόντα που χρειάστηκα γρήγορα. Την εκτιμώ πραγματικά.

—— Γεν γατακιών

Αμμώδης του Πεκίνου Qianxing Jietong η Co. τεχνολογίας, ΕΠΕ είναι πολύ προσεκτικός πωλητής, ο οποίος μπορεί να υπενθυμίσει σε με τα λάθη διαμόρφωσης εγκαίρως πότε αγοράζω έναν κεντρικό υπολογιστή. Οι μηχανικοί είναι επίσης πολύ επαγγελματικοί και μπορούν γρήγορα να ολοκληρώσουν την εξεταστική διαδικασία.

—— Strelkin Mikhail Vladimirovich

Είμαστε πολύ ευχαριστημένοι με την εμπειρία μας συνεργασίας με την Beijing Qianxing Jietong. Η ποιότητα των προϊόντων είναι εξαιρετική και η παράδοση γίνεται πάντα στην ώρα της. Η ομάδα πωλήσεων είναι επαγγελματική, υπομονετική και πολύ εξυπηρετική με όλα μας τα ερωτήματα. Εκτιμούμε πραγματικά την υποστήριξή τους και προσβλέπουμε σε μια μακροχρόνια συνεργασία. Συνιστάται ανεπιφύλακτα!

—— Ahmad Navid

Ποιότητα: Μεγάλη εμπειρία με τον προμηθευτή μου.Το MikroTik RB3011 είχε ήδη χρησιμοποιηθεί, αλλά ήταν σε πολύ καλή κατάσταση και όλα λειτουργούν τέλεια.Η επικοινωνία ήταν γρήγορη και ομαλή.Και όλες μου οι ανησυχίες λύθηκαν γρήγορα.- Πολύ αξιόπιστος προμηθευτής.

—— Γκεράν Κολέσιο

Είμαι Online Chat Now

Η IBM Παρουσιάζει Αποθήκευση Ενήμερη για Περιεχόμενο για Φορτία Εργασίας RAG

April 24, 2026
Η IBM αποκάλυψε μια αρχιτεκτονική αποθήκευσης με επίγνωση περιεχομένου (CAS) που ενσωματώνει την επεξεργασία δεδομένων AI απευθείας στο επίπεδο αποθήκευσης. Αυτή η προσέγγιση είναι προσαρμοσμένη για ροές εργασίας ανάκτησης-επαυξημένης παραγωγής (RAG), καθώς ενσωματώνει την διανυσματοποίηση εγγράφων στο ίδιο το σύστημα αποθήκευσης – μειώνοντας την ανάγκη για εξωτερικές διαδικασίες προεπεξεργασίας.

Το CAS μεταφέρει μια βασική λειτουργία RAG – την ενσωμάτωση εγγράφων μέσω μεθόδων βασισμένων σε μεγάλα γλωσσικά μοντέλα (LLM) – στην υποδομή αποθήκευσης. Αυτό επιτρέπει στις επιχειρήσεις να επεξεργάζονται και να ευρετηριάζουν δεδομένα στην υπάρχουσα τοποθεσία τους, ευθυγραμμίζοντας τα συστήματα αποθήκευσης με φόρτους εργασίας που καθοδηγούνται από την AI και ελαχιστοποιώντας τη μετακίνηση δεδομένων μεταξύ διαφορετικών επιπέδων υποδομής. Η IBM το τοποθετεί ως μέσο απλοποίησης της ανάπτυξης, ενώ παράλληλα ενισχύει την απόδοση και βελτιώνει την τοπικότητα των δεδομένων για εφαρμογές AI.

Βάση Δεδομένων Διανυσμάτων σε Κλίμακα


Στην καρδιά της υλοποίησης CAS της IBM βρίσκεται μια βάση δεδομένων διανυσμάτων βελτιστοποιημένη για σημασιολογική αναζήτηση. Οι βάσεις δεδομένων διανυσμάτων υποστηρίζουν την αναζήτηση κατά προσέγγιση πλησιέστερου γείτονα (ANN), επιτρέποντας στα συστήματα AI να ανακτούν σχετικά τμήματα δεδομένων με βάση μετρικές ομοιότητας όπως η ομοιότητα συνημιτόνου ή η απόσταση L2. Αυτή η δυνατότητα είναι θεμελιώδης για το RAG, όπου τα ερωτήματα των χρηστών μετατρέπονται σε διανύσματα και αντιστοιχίζονται με ευρετηριασμένα εταιρικά δεδομένα για να παρέχουν απαντήσεις με επίγνωση του πλαισίου.


τελευταία εταιρεία περί Η IBM Παρουσιάζει Αποθήκευση Ενήμερη για Περιεχόμενο για Φορτία Εργασίας RAG  0
Διάγραμμα CAS της IBM Πηγή: IBM

Η IBM Research, σε συνεργασία με τη Samsung και την NVIDIA, παρουσίασε ένα πρωτότυπο σύστημα ικανό να κλιμακωθεί σε 100 δισεκατομμύρια διανύσματα σε έναν μόνο διακομιστή. Το σύστημα πέτυχε πάνω από 90% ανάκληση και ακρίβεια, με μέση καθυστέρηση ερωτήματος κάτω από 700 χιλιοστά του δευτερολέπτου. Αυτή η κλίμακα εξυπηρετεί εταιρικά περιβάλλοντα όπου τα σύνολα δεδομένων μπορούν να εκτείνονται σε δισεκατομμύρια αρχεία και, μόλις ευρετηριαστούν πλήρως, να φτάσουν σε εκατοντάδες δισεκατομμύρια διανύσματα.

Ενσωμάτωση Διοχέτευσης RAG


Το RAG γίνεται μια προτιμώμενη προσέγγιση για την εταιρική AI, καθώς βελτιώνει την ακρίβεια των αποτελεσμάτων χωρίς την ανάγκη επανεκπαίδευσης μοντέλων. Λειτουργεί συμπληρώνοντας τις προτροπές με εταιρικά-ειδικά δεδομένα που ανακτώνται από μια βάση δεδομένων διανυσμάτων.

Η διοχέτευση ξεκινά με την εισαγωγή δεδομένων, όπου έγγραφα όπως PDF και παρουσιάσεις αναλύονται, χωρίζονται σε τμήματα και μετατρέπονται σε ενσωματώσεις. Αυτές οι ενσωματώσεις αποθηκεύονται σε μια βάση δεδομένων διανυσμάτων που οργανώνει τα δεδομένα για αποτελεσματική αναζήτηση ομοιότητας. Κατά την υποβολή ερωτημάτων, η είσοδος του χρήστη ενσωματώνεται και αντιστοιχίζεται με αποθηκευμένα διανύσματα, με σχετικό περιεχόμενο που περνά στο γλωσσικό μοντέλο ως πλαίσιο. Αυτός ο μηχανισμός θεμελίωσης μειώνει τις παραισθήσεις και αυξάνει την εμπιστοσύνη στα αποτελέσματα που παράγονται από την AI.

Το CAS της IBM ενσωματώνει ολόκληρη αυτή τη διοχέτευση απευθείας στην αποθήκευση, ενοποιώντας την εισαγωγή, την ευρετηρίαση και την ανάκτηση σε κοντινή απόσταση από τα δεδομένα.

Αντιμετώπιση Προκλήσεων Κλίμακας και Κόστους


Τα εταιρικά συστήματα αποθήκευσης λειτουργούν ήδη σε κλίμακα petabyte. Όταν επεκτείνονται σε CAS, κάθε αρχείο μπορεί να δημιουργήσει εκατοντάδες διανύσματα, επεκτείνοντας γρήγορα το μέγεθος του συνόλου δεδομένων. Οι παραδοσιακές βάσεις δεδομένων διανυσμάτων συνήθως κλιμακώνονται σε πολλούς διακομιστές, εισάγοντας επιπλέον κόστος και λειτουργική πολυπλοκότητα. Η ευρετηρίαση και η επανευρετηρίαση μεγάλων συνόλων δεδομένων γίνονται επίσης χρονοβόρες εργασίες.

Η προσέγγιση της IBM επικεντρώνεται στη βελτίωση της πυκνότητας διανυσμάτων και στη μείωση του κόστους ευρετηρίασης για τον περιορισμό της επέκτασης της υποδομής. Η αρχιτεκτονική διαχωρίζει την αποθήκευση διανυσμάτων και ευρετηρίων από την υπολογιστική ισχύ ερωτημάτων, επιτρέποντας την ανεξάρτητη κλιμάκωση των πόρων αποθήκευσης και υπολογιστικής ισχύος. Αυτό καθίσταται δυνατό από το IBM Storage Scale και το σύστημα παράλληλων αρχείων υψηλής απόδοσης.

Αρχιτεκτονική Αποθήκευσης και Υλικού


Η υλοποίηση CAS αξιοποιεί το IBM Storage Scale System 6000 (ESS 6000), μια πλατφόρμα all-flash σχεδιασμένη για AI και φόρτους εργασίας υψηλής απόδοσης. Το σύστημα υποστηρίζει έως και 48 μονάδες NVMe ανά περίβλημα 4U, με μεμονωμένες χωρητικότητες μονάδων που κυμαίνονται από 7 TB έως 60 TB. Ενσωματώνει συνδεσιμότητα PCIe Gen5, 400 Gb InfiniBand ή 200 Gb Ethernet, παρέχοντας έως και 340 GB/s ανάγνωσης και 175 GB/s εγγραφής ανά κόμβο, μαζί με έως και 7 εκατομμύρια IOPS.

Η πλατφόρμα υποστηρίζει επίσης το NVIDIA GPUDirect Storage, διευκολύνοντας άμεσες διαδρομές δεδομένων μεταξύ αποθήκευσης και GPU, καθώς και BlueField-3 DPUs για την εκφόρτωση εργασιών δικτύου και επεξεργασίας δεδομένων.

Οι μονάδες Samsung PM9D3a PCIe Gen5 NVMe SSD παρέχουν αποθήκευση υψηλής απόδοσης και υψηλής πυκνότητας. Βασισμένες στην όγδοη γενιά TLC V-NAND, αυτές οι μονάδες προσφέρουν έως και 30,72 TB ανά συσκευή, με ταχύτητες σειριακής ανάγνωσης έως 12 GB/s και ταχύτητες εγγραφής έως 6,8 GB/s. Η χρήση εμπορικά διαθέσιμων εταιρικών SSD επιτρέπει στην αρχιτεκτονική να κλιμακώνεται χρησιμοποιώντας τυπικά εξαρτήματα.

Ιεραρχική Ευρετηρίαση και Επιτάχυνση GPU


Για την αντιμετώπιση της ευρετηρίασης σε κλίμακα, η IBM ανέπτυξε ένα ιεραρχικό μοντέλο ευρετηρίασης που αποτελείται από πολλαπλά υπο-ευρετήρια που μπορούν να βελτιστοποιηθούν ανεξάρτητα. Αυτή η δομή επιτρέπει επαυξητικές ενημερώσεις και τοπική επανευρετηρίαση χωρίς να διαταράσσεται ολόκληρο το σύνολο δεδομένων, βελτιώνοντας τόσο τη διαθεσιμότητα όσο και τη λειτουργική αποδοτικότητα.

Η επιτάχυνση GPU μειώνει δραστικά τον χρόνο ευρετηρίασης σε σύγκριση με τις προσεγγίσεις μόνο με CPU. Εργασίες που θα διαρκούσαν ώρες σε CPU μπορούν να ολοκληρωθούν σε λεπτά χρησιμοποιώντας NVIDIA GPUs. Σε δοκιμές, η δημιουργία ευρετηρίων για 100 δισεκατομμύρια διανύσματα διήρκεσε 4 ημέρες με 6 NVIDIA H200 GPU, σε σύγκριση με εκτιμώμενες 120 ημέρες σε σύστημα CPU διπλού socket.

Το πλήρες σύνολο δεδομένων, συμπεριλαμβανομένων των διανυσμάτων και των ευρετηρίων, κατανάλωσε περίπου 153 TiB αποθηκευτικού χώρου. Η αρχική φόρτωση και διαμέριση δεδομένων διήρκεσε εννέα ημέρες. Το προκύπτον σύστημα παρείχε μέση καθυστέρηση ερωτήματος 694ms με 90% ανάκληση, επικυρωμένο έναντι υπολογισμών brute-force ground-truth.

Οδικός Χάρτης


Η IBM και η NVIDIA συνεχίζουν να βελτιστοποιούν την πλατφόρμα, εστιάζοντας στη μείωση της καθυστέρησης ευρετηρίασης και ερωτημάτων. Οι τρέχοντες στόχοι περιλαμβάνουν την ευρετηρίαση 100 δισεκατομμυρίων ή περισσότερων διανυσμάτων εντός μίας ημέρας, τη μείωση του χρόνου εισαγωγής δεδομένων από εννέα ημέρες σε μία ημέρα και τη μείωση της καθυστέρησης ερωτημάτων στην περιοχή των 50-100 χιλιοστών του δευτερολέπτου, διατηρώντας παράλληλα 90% ανάκληση.

Η ενσωμάτωση της διανυσματικής ευρετηρίασης σε τυπικά συστήματα αρχείων στοχεύει στην απλοποίηση της ανάπτυξης και στη μείωση των εμποδίων για την υιοθέτηση της εταιρικής AI. Ενσωματώνοντας τις δυνατότητες RAG απευθείας στην αποθήκευση, η IBM τοποθετεί το CAS ως θεμελιώδες επίπεδο για υποδομές με δυνατότητες AI.

Beijing Qianxing Jietong Technology Co., Ltd.
Sandy Yang/Global Strategy Director
WhatsApp / WeChat: +86 13426366826
Email: yangyd@qianxingdata.com
Website: www.qianxingdata.com/www.storagesserver.com
Επιχειρηματική Εστίαση:
Διανομή Προϊόντων ICT/Ενοποίηση Συστημάτων & Υπηρεσίες/Λύσεις Υποδομής
Με πάνω από 20 χρόνια εμπειρίας στη διανομή IT, συνεργαζόμαστε με κορυφαίες παγκόσμιες μάρκες για την παροχή αξιόπιστων προϊόντων και επαγγελματικών υπηρεσιών.
"Χρησιμοποιώντας την Τεχνολογία για την Οικοδόμηση ενός Έξυπνου Κόσμου" Ο Αξιόπιστος Πάροχος Υπηρεσιών Προϊόντων ICT!
Στοιχεία επικοινωνίας
Beijing Qianxing Jietong Technology Co., Ltd.

Υπεύθυνος Επικοινωνίας: Ms. Sandy Yang

Τηλ.:: 13426366826

Στείλετε το ερώτημά σας απευθείας σε εμάς (0 / 3000)