Έρευνα & Ανάπτυξη
Η ομάδα Έρευνας & Ανάπτυξης της Αρχειοθήκης αναπτύσσει μοντέλα Τεχνητής Νοημοσύνης (Artificial Intelligence – AI) και Deep Learning / Machine Learning, χρησιμοποιώντας διάφορες μεθόδους, όπως Computer Vision και Natural Language Processing.
Πάντα σε επαφή με τις τελευταίες εξελίξεις στο χώρο του Machine Learning, η ομάδα είναι σε θέση να σχεδιάσει μοντέρνες λύσεις για τους πελάτες μας, δίνοντας τους ανταγωνιστικό πλεονέκτημα στις αγορές όπου δραστηριοποιούνται. Οι λύσεις μας μπορούν να επεκταθούν, να επαναχρησιμοποιηθούν και να διαμορφωθούν κατάλληλα, σύμφωνα με τις ανάγκες και τις προδιαγραφές του εκάστοτε πελάτη. Επιπρόσθετα, αναπτύσσει λύσεις αυτοματοποίησης διαδικασιών, όπως Ποιοτικός Έλεγχος με χρήση Τεχνητής Νοημοσύνης, αυτόματη ανωνυμοποίηση κειμένων και διορθώσεις σφαλμάτων κατά τη διαδικασία ψηφιοποίησης
H ομάδα εργάζεται πάνω σε λύσεις που βασίζονται σε τεχνολογία Blockchain, καθώς πιστεύουμε στο ανοιχτό διαδίκτυο και τις αποκεντρωμένες υπηρεσίες που μπορεί να προσφέρει. Χρησιμοποιώντας πλατφόρμες Blockchain όπως το Ethereum, είμαστε σε θέση να αναπτύξουμε εφαρμογές που ξεφεύγουν από τα συνηθισμένα, ανοίγοντας νέους ορίζοντες στη διασυνδεσιμότητα και την πληροφορική γενικότερα. Αυτό τον καιρό ασχολούμαστε ιδιαίτερα με νέες λύσεις σχετικές με αυθεντικοποίηση εγγράφων, εμπιστευτικές συναλλαγές και προσβασιμότητα με χρήση τεχνολογίας blockchain, ξεπερνώντας περιορισμούς που συναντούσαμε σε μέχρι τώρα υφιστάμενες τεχνολογίες.
Τέλος, η ομάδα Έρευνας & Ανάπτυξης αναπτύσσει λύσεις αυτοματοποίησης διαδικασιών, όπως Ποιοτικός Έλεγχος με χρήση Τεχνητής Νοημοσύνης, αυτόματη ανωνυμοποίηση κειμένων, διορθώσεις σφαλμάτων κατά τη διαδικασία ψηφιοποίησης, και άλλα.
Όλα τα παραπάνω δημιουργούνται σύμφωνα με τις βέλτιστες πρακτικές Development Operations (DevOps) και Machine Learning Operations (MLOps), κατά τα αντίστοιχα Διεθνή Πρότυπα.
Our AI Suite
Efpalinos – Multi-class Classification
Deep Learning | Language Agnostic | GDPR compliant
Ο Efpalinos είναι ένα εργαλείο Τεχνητής Νοημοσύνης που είναι σε θέση να αναγνωρίσει τύπους εγγράφων σε μορφή pdf σε οποιαδήποτε μορφή (π.χ. τύπους συμβάσεων, διαφόρων ειδών παραστατικά, φόρμες, κλπ), δίνοντας τη δυνατότητα αυτόματης κατηγοριοποίησης των εγγράφων σύμφωνα με ένα πρότυπο σχήμα καταγραφής/οντολογία. Η κατηγοριοποίηση των εγγράφων αποτελεί βασικό στάδιο αρχειοθέτησης, διευκολύνει την ανάκτηση των συγκεκριμένων εγγράφων από το αρχείο, εξοικονομώντας χρόνο, και ελαχιστοποιώντας την πιθανότητα λάθους. Ο Efpalinos έχει ήδη εκπαιδευτεί για την αναγνώριση μιας σειράς από διαφορετικά έγγραφα, αλλά μπορεί να επανεκπαιδευτεί για οποιονδήποτε τύπο εγγράφου και αρχείου, ανάλογα με τις εκάστοτε προδιαγραφές και απαιτήσεις κάθε έργου. Μπορεί να λειτουργήσει σε οποιαδήποτε γλώσσα, και δεν βασίζεται σε προσωπικά δεδομένα για να εκτελέσει την τελική κατηγοριοποίηση κάθε εγγράφου, κάτι που τον καθιστά εξίσου λειτουργικό ακόμα και σε πλήρως ανωνυμοποιημένα έγγραφα, διασφαλίζοντας τη συμμόρφωση κατά GDPR.
Ενδεικτική Εφαρμογή:
Κατηγοριοποίηση αρχείου που περιέχει συμβάσεις, τιμολόγια, extrait, καρτέλες πελατών, και διαχωρισμός σε επιμέρους αναγνωρίσιμα αρχεία.
Leda – Automatic Document Separation
Deep Learning | NLP + Image Processing | GDPR compliant
Η Leda αποτελεί ουσιαστικά μια μετεξέλιξη του Efpalinos, δεδομένου ότι επιτελεί ακριβώς την ίδια εργασία, αλλά με την πρόσθετη δυνατότητα λειτουργίας ακόμα και στην περίπτωση που μέσα σε ένα pdf αρχείο περιέχονται πολλαπλά έγγραφα. Η Leda είναι σε θέση να εντοπίσει από που αρχίζει και που τελειώνει ένα έγγραφο (μιας ή περισσοτέρων σελίδων), ώστε να το διαχωρίσει από το υπόλοιπο pdf και στη συνέχεια να το χαρακτηρίσει, ως ξεχωριστό αρχείο.
Ενδεικτική Εφαρμογή:
Επεξεργασία αρχείου δανειακών Φακέλλων που είχε σκαναριστεί μαζικά (bulk scanning), ώστε να διαχωριστεί στα επιμέρους έγγραφά του (συμβάσεις, διαταγές πληρωμής, εξώδικα, κλπ), επιτρέποντας την εξαγωγή report για την πληρότητα του κάθε φακέλλου.
Androsthenes – Smart Document Preprocessing
Custom OCR | Reorientation | Process Efficiency Improvement
O Androsthenes είναι ένα εργαλείο που ουσιαστικά προηγείται στη ροή επεξεργασίας όλων των υπολοίπων, καθώς βελτιώνει τα αποτελέσματα του Optical Character Recognition (OCR), προετοιμάζοντας ουσιαστικά τα έγγραφα για την όποια περαιτέρω επεξεργασία απαιτείται. Μια από τις βασικές λειτουργίες του Androsthenes είναι η ευθυγράμμιση (re-orientation) των σελίδων, ώστε να διατηρούν ευθύ προσανατολισμό κατά τη γραφή/ανάγνωση, ανεξάρτητα από τον προσανατολισμό τροφοδότησης των σελίδων κατά τη διάρκεια της ψηφιοποίησης. Ο Androsthenes μπορεί να εκπαιδευθεί επίσης στην αναγνώριση κενών ή άνευ ουσιαστικού νοήματος σελίδων, προκειμένου αυτές να μην συμπεριλαμβάνονται στο παραδοτέο αποτέλεσμα, συμφωνα με δεδομένες προδιαγραφές.
Hyperion – Object Detection
Deep Learning | Computer Vision | AI-assisted Οbject Detection
O Hyperion είναι ένα εξελιγμένο εργαλείο Τεχνητής Νοημοσύνης (ΑΙ), βασισμένο σε Computer Vision, δηλαδή αναγνώριση συγκεκριμένων αντικειμένων που θα συναντήσει πάνω σε ένα έγγραφο, ανάλογα με τις ανάγκες του πελάτη. Υπάρχουν πολλές διαφορετικές περιοχές εφαρμογής, καθώς δίνεται η δυνατότητα λεπτομερούς «ανάγνωσης» του εγγράφου, προς εντοπισμό συγκεκριμένων αντικειμένων, που μπορούν να δώσουν πολύτιμες πληροφορίες για τη φύση και το περιεχόμενο του εγγράφου.
Ο Hyperion έχει χρησιμοποιηθεί επιτυχώς για την αναγνώριση πρωτοτύπων συμβάσεων μέσα σε μεγάλο δείγμα που αποτελούταν από πρωτότυπες και φωτοτυπημένες συμβάσεις, καθώς και για την αναγνώριση πρωτότυπων νομικών εγγράφων, όπως εξώδικες επιστολές και διαταγές πληρωμής, αναζητώντας την αυθεντική σφραγίδα και υπογραφή εντός της αντίστοιχης σελίδας της σύμβασης/του νομικού εγγράφου.
Ενδεικτική Εφαρμογή: Έλεγχος Γνησιότητας Εγγράφου, εντοπισμός σφραγίδας / υπογραφής