Η Qdrant, ένας πάροχος λύσεων σύνθετης διανυσματικής αναζήτησης και βάσεων δεδομένων, έχει αναπτύξει αναβαθμισμένες επιδόσεις ευρετηρίασης, μηχανισμούς ανακατεύθυνσης συμπλέγματος τριών ζωνών και λειτουργίες καταγραφής ελέγχου εστιασμένες στη συμμόρφωση.
Η εταιρεία αναπτύσσει μια αυτόνομη διανυσματική βάση δεδομένων για την αποθήκευση ενσωματώσεων που απαιτούνται από μεγάλα γλωσσικά μοντέλα (LLM) και αυτόνομους πράκτορες τεχνητής νοημοσύνης, οι οποίοι συνήθως τροφοδοτούν ροές εργασιών εξαγωγής συμπερασμάτων τεχνητής νοημοσύνης, όπως το Retrieval-Augmented Generation (RAG). Σύμφωνα με την Qdrant, οι ομάδες προμηθειών επιχειρήσεων αξιολογούν πάντα τα εργαλεία διανυσματικής αναζήτησης με βάση τρία βασικά κριτήρια: επεκτασιμότητα για αυξανόμενο φόρτο εργασίας, συνέχεια υπηρεσίας εν μέσω αστοχιών υποδομής και ανιχνεύσιμο λειτουργικό έλεγχο.
Ο André Zayarni, Συνιδρυτής και Διευθύνων Σύμβουλος της Qdrant, σχολίασε: "Οι GPU δεν περιορίζονται πλέον στην εξαγωγή συμπερασμάτων μοντέλων· βελτιστοποιούν επίσης την ευρετηρίαση δεδομένων. Έχουμε ενεργοποιήσει την επιτάχυνση με GPU κατασκευή HNSW στην έκδοσή μας ανοιχτού κώδικα από την έκδοση 1.13, και αυτή η δυνατότητα είναι πλέον επίσημα διαθέσιμη στο Qdrant με τον συνδυασμένο συνδυασμό πολλαπλών ενσωματώσεων και ελέγχου AZ. εξοπλίζει τις επιχειρήσεις να αναπτύξουν το Qdrant για κρίσιμους φόρτους εργασίας παραγωγής».
Οι τελευταίες αναβαθμίσεις προϊόντων της Qdrant καλύπτουν τρεις βασικές βελτιώσεις:
Ευρετηρίαση με επιτάχυνση GPU: Οι δοκιμές συγκριτικής αξιολόγησης επιβεβαιώνουν ότι οι αποκλειστικές GPU ενισχύουν την ταχύτητα κατασκευής του δείκτη HNSW έως και τέσσερις φορές στο Qdrant Cloud. Οι χρήστες μπορούν να προσαρτήσουν πόρους GPU σε υπάρχοντα συμπλέγματα για να χειρίζονται αποτελεσματικά τις εκρήξεις ευρετηρίου υψηλής έντασης.
Συστάδες ζώνης πολλαπλής διαθεσιμότητας (AZ).: Ο μηχανισμός αντιγραφής cross-AZ αντιγράφει δεδομένα σε τρεις ζώνες διαθεσιμότητας σε μία μόνο περιοχή. Εξαλείφει τον λανθάνοντα χρόνο μη αυτόματης ανακατεύθυνσης, διασφαλίζοντας αδιάλειπτες λειτουργίες ανάγνωσης-εγγραφής ακόμη και αν μια ζώνη διαθεσιμότητας παρουσιάσει διακοπή λειτουργίας.
Καταγραφή ελέγχου: Η συνάρτηση καταγράφει όλες τις λειτουργίες που βασίζονται σε API, συμπεριλαμβανομένων των ερωτημάτων δεδομένων, των προσθηκών, των διαγραφών, της διαχείρισης συλλογής και των εργασιών στιγμιότυπου. Κάθε καταχώρηση αρχείου καταγραφής υιοθετεί δομημένη μορφή JSON, επισημαίνοντας ταυτότητες χρήστη, κλειδιά API, χρονικές σημάνσεις, συλλογές στόχων και κατάσταση εξουσιοδότησης λειτουργίας. Όταν τα αυτόνομα συστήματα εκτελούν εργασίες με βάση τα ανακτημένα δεδομένα, τα αρχεία καταγραφής παρέχουν σαφείς διαδρομές ελέγχου για τις πηγές αιτημάτων, τον χρόνο εκτέλεσης και τη νομιμότητα πρόσβασης. Οι χρήστες μπορούν να προσαρμόσουν τους κύκλους διατήρησης αρχείων καταγραφής και να εξάγουν εγγραφές εξωτερικά μέσω API για μακροπρόθεσμη αρχειοθέτηση.
Επί του παρόντος, η ευρετηρίαση με επιτάχυνση GPU είναι προσβάσιμη στο AWS, με συνεχή σχέδια για επέκταση της κάλυψης σε περισσότερους προμηθευτές και περιοχές cloud. Τα συμπλέγματα Multi-AZ ανήκουν στη βαθμίδα Premium της Qdrant, παρέχοντας χρόνο λειτουργίας με υποστήριξη SLA 99,95%. Η δυνατότητα καταγραφής ελέγχου είναι ανοιχτή σε όλα τα επί πληρωμή συμπλέγματα Qdrant Cloud.
Η επίσημη τεκμηρίωση παρέχει περισσότερες λεπτομέρειες για τις τρεις νέες δυνατότητες.
Υποσημείωση
Το Hierarchical Navigable Small World (HNSW) είναι ένας αλγόριθμος που έχει σχεδιαστεί για να αναγνωρίζει τους πλησιέστερους γείτονες του διανύσματος. Αντιστοιχίζει διανύσματα σε διασυνδεδεμένες δομές γραφημάτων, οι οποίες επεκτείνονται δραστικά με τον αυξανόμενο όγκο δεδομένων. Το HNSW στοιβάζει πολλαπλά επίπεδα εικονικών γραφημάτων: το επάνω αραιό στρώμα περιέχει ελάχιστα διανύσματα για γρήγορη προκαταρκτική αναζήτηση, ενώ τα χαμηλότερα στρώματα αποθηκεύουν όλο και περισσότερα διανύσματα έως ότου το κάτω επίπεδο καλύψει όλα τα σημεία δεδομένων. Κάθε επίπεδο λειτουργεί ως βελτιστοποιημένο σημείο εισόδου για το επόμενο, μειώνοντας σημαντικά τη συνολική καθυστέρηση αναζήτησης.
Η Qdrant αντιμετωπίζει ανταγωνισμό από πολλούς ομολόγους του κλάδου. Το Pinecone υιοθετεί επίσης αλγόριθμους HNSW και αξιοποιεί τις GPU της NVIDIA για τη βελτιστοποίηση της απόδοσης ενσωμάτωσης και ανακατάταξης. Το Zilliz παρέχει συμβατότητα HNSW και επιτάχυνση GPU. Η υποκείμενη βάση δεδομένων Milvus της ενσωματώνει το Nvidia CUDA-Accelerated Graph Index for Vector Retrieval (CAGRA) από τη βιβλιοθήκη RAPIDS cuVS για να ενεργοποιήσει την ευρετηρίαση GPU.
Beijing Qianxing Jietong Technology Co., Ltd.
Sandy Yang/Διευθυντής Παγκόσμιας Στρατηγικής
WhatsApp / WeChat: +86 13426366826
Email: yangyd@qianxingdata.com
Ιστοσελίδα: www.qianxingdata.com/www.storagesserver.com
Επιχειρηματική εστίαση:
Διανομή προϊόντων ΤΠΕ/Ενοποίηση συστήματος & Υπηρεσίες/Λύσεις υποδομής
Με 20+ χρόνια εμπειρίας διανομής πληροφορικής, συνεργαζόμαστε με κορυφαίες παγκόσμιες μάρκες για την παροχή αξιόπιστων προϊόντων και επαγγελματικών υπηρεσιών.
«Χρησιμοποιώντας την τεχνολογία για τη δημιουργία ενός ευφυούς κόσμου» Ο αξιόπιστος πάροχος υπηρεσιών προϊόντων ΤΠΕ!