Η νέα λειτουργία στοχεύει σε περιπτώσεις χρήσης όπως τιμολόγια, εντολές αγοράς, βιογραφικά, έλεγχο απάτης και συμβάσεις, αντικαθιστώντας τις παραδοσιακές μεθόδους εξαγωγής δεδομένων που βασίζονται σε χειροκίνητη επισήμανση, άκαμπτα templates και κανόνες εξαρτώμενους από τη διάταξη των εγγράφων.
Σύμφωνα με την Oracle, το Generative Extraction επιτρέπει στις επιχειρήσεις να ορίζουν τα πεδία που θέλουν να εξάγουν σε φυσική γλώσσα, χωρίς εκτεταμένη εκπαίδευση μοντέλων ή σύνθετη παραμετροποίηση. Το σύστημα κατανοεί τα πεδία, μαθαίνει το νόημά τους και τα εξάγει με συνέπεια από ημιδομημένα και αδόμητα έγγραφα, ακόμη και όταν οι μορφές και οι διατάξεις διαφέρουν σημαντικά.

Πώς λειτουργεί η νέα τεχνολογία
Η λύση βασίζεται σε state-of-the-art πολυτροπικά μοντέλα όρασης, τα οποία αναλύουν το περιεχόμενο των εγγράφων και επιστρέφουν δομημένα αποτελέσματα σε μορφή JSON.
Παράλληλα, ενσωματώνει ειδικά σχεδιασμένη λογική προ- και μετα-επεξεργασίας, με στόχο τη βελτίωση της ακρίβειας, τη σταθερότητα των αποτελεσμάτων και τη μείωση φαινομένων hallucination που συχνά εμφανίζονται σε γενικά μοντέλα AI.
Μεταξύ των βασικών δυνατοτήτων περιλαμβάνονται:
- κατανόηση πεδίων μέσω περιγραφών σε φυσική γλώσσα,
- εκμάθηση από περιορισμένα παραδείγματα όταν απαιτείται αυξημένη ακρίβεια,
- υποστήριξη πολυσέλιδων, πολυγλωσσικών και μικτής διάταξης εγγράφων,
- κανονικοποίηση τιμών σε ενιαίο σχήμα δεδομένων,
- πλήρης συμβατότητα με υπάρχουσες ροές εργασίας Custom KV, χωρίς αλλαγές στο pipeline.
Γιατί έχει σημασία για τις επιχειρήσεις
Η Oracle επισημαίνει ότι τα γενικά μοντέλα generative AI δεν επαρκούν από μόνα τους για υψηλής ακρίβειας εξαγωγή δεδομένων σε περιβάλλοντα με μεγάλη ποικιλία εγγράφων. Το Generative Extraction έχει σχεδιαστεί ειδικά για παραγωγική χρήση, με ενσωματωμένα “guardrails” που εξασφαλίζουν προβλέψιμη συμπεριφορά και σταθερά αποτελέσματα σε κλίμακα.
Παράλληλα, μειώνει σημαντικά τον χρόνο διάθεσης νέων εφαρμογών στην αγορά, καθώς περιορίζει την ανάγκη για labeling, επανεκπαίδευση μοντέλων και συντήρηση κανόνων. Αυτό επιτρέπει στις επιχειρήσεις να αυτοματοποιούν πιο γρήγορα document-heavy διαδικασίες και να κλιμακώνουν ευκολότερα τις λειτουργίες τους.
