Autolexis: Αυτόματη κατασκευή δίγλωσσων λεξικών
ΕΡΕΥΝΗΤΙΚΑ ΑΠΟΤΕΛΕΣΜΑΤΑ

Autolexis: Αυτόματη κατασκευή δίγλωσσων λεξικών

Κατηγορία: Υπηρεσίες

Υπάρχουν σήμερα πολλά συμβατικά λεξικά σε ηλεκτρονική μορφή. Συνήθως όμως, το περιεχόμενο αυτών των "ηλεκτρονικών λεξικών" δεν είναι σε κατάλληλη μορφή ώστε να χρησιμοποιηθεί από αυτοματοποιημένες υπολογιστικές εφαρμογές, όπως για παράδειγμα μια μεταφραστική μνήμη ή ένα σύστημα ανάκτησης πολύγλωσσων πληροφοριών. Επιπλέον, τα συμβατικά λεξικά τείνουν να καλύπτουν την γενική γλώσσα, καθιστώντας έτσι δύσκολη την χρήση τους σε εφαρμογές που πραγματεύονται μια συγκεκριμένη θεματική περιοχή. Έχει γίνει λοιπόν φανερή η ανάγκη ύπαρξης εξειδικευμένων λεξικών με ικανοποιητική κάλυψη μιας θεματικής περιοχής ή μιας ειδικής εφαρμογής.

Η κατασκευή τέτοιων λεξικών με τις παραδοσιακές τεχνικές, δηλαδή με το χέρι, έχει αποδειχθεί επίπονη, χρονοβόρα και συνήθως ιδιαίτερα υψηλού κόστους εργασία. Για ένα τέτοιο εγχείρημα απαιτείται όχι μόνον δίγλωσση λεξικογραφική εξειδίκευση, αλλά και ουσιαστική εξοικείωση με την συγκεκριμένη θεματική περιοχή (για παράδειγμα, ιατρική, νομικά, κατασκευές), δεδομένου ότι για να κατασκευαστεί ένα τέτοιο λειτουργικό λεξικό, θα πρέπει να επιλυθούν προβλήματα όπως:

  • Οι πολλαπλές σημασίες των λέξεων
  • Η εκτίμηση της ορθότητας των μεταφράσεων

Το Autolexis είναι ένα εργαλείο για την αυτόματη κατασκευή ενός δίγλωσσου μεταφραστικού λεξικού από παράλληλα, δηλαδή μεταφρασμένα, κείμενα. Το εργαλείο χρησιμοποιεί τεχνικές ανεξάρτητες από την γλώσσα στην οποία έχουν γραφεί και μεταφραστεί τα κείμενα που θα επεξεργαστεί. Προσφέρεται έτσι για χρήση σε κείμενα οποιονδήποτε γλωσσών και βεβαίως οποιασδήποτε θεματικής περιοχής.

Το Autolexis προσδιορίζει λεκτικές αντιστοιχίες σε επίπεδο μίας ή πολλαπλών λέξεων. Λειτουργεί σε παράλληλα κείμενα, τα οποία προηγουμένως έχουν στοιχιστεί σε επίπεδο πρότασης και στη συνέχεια έχουν υποστεί επιφανειακή γλωσσολογική επεξεργασία. Το Autolexis έχει ήδη χρησιμοποιηθεί για την κατασκευή Αγγλο-Ελληνικών λεξικών συστημάτων λογισμικού, και απέδειξε ότι είναι σε θέση να εντοπίσει τις ισοδυναμίες όχι μόνον τύπου "search = αναζήτηση", ή "database file = αρχείο βάσης δεδομένων" αλλά και τύπου "desktop = επιφάνεια χώρου εργασίας".

Το Autolexis προσφέρεται τώρα ως υπηρεσία στους ενδιαφερόμενους από το Ινστιτούτο Επεξεργασίας του Λόγου.

 

Πρόσωπο επικοινωνίας: Πιπερίδης Στέλιος 

 
 

Επιστημονικά τμήματα

Ερευνητικοί άξονες