Ερευνητική περιοχή - Επεξεργασία Πολύγλωσσου Περιεχομένου
ΕΡΓΑ

Επεξεργασία Πολύγλωσσου Περιεχομένου

 

Η πολυγλωσσικότητα, ακρογωνιαίος λίθος της πολυπολιτισμικής μας κοινωνίας, απαιτεί προσιτές τεχνολογίες και εφαρμογές, που επιτρέπουν τη διαγλωσσική επικοινωνία και συνεργασία, διασφαλίζουν στους ομιλητές διαφορετικών γλωσσών ισότιμη πρόσβαση στην κοινωνία της πληροφορίας και παρέχουν προηγμένες λειτουργικότητες διαδικτυακών Τεχνολογιών της Πληροφορίας και των Επικοινωνιών για όλες τις γλώσσες.

Για αυτό το σκοπό η τεχνολογική ανάπτυξη κινείται σε δύο τουλάχιστον άξονες:

  • Μηχανική Μετάφραση (ΜΜ) και
  • Τεχνολογίες διαχείρισης της πληροφορίας και της γνώσης, συμπεριλαμβανομένης της διαγλωσσικής ανάκτησης πληροφορίας.

Εξυπακούεται πως οι τεχνολογίες επεξεργασίας πολυγλωσσικού περιεχομένου δεν μπορούν να ιδωθούν αποκομμένες από άλλες γλωσσικές τεχνολογίες (π.χ. παραγωγή και διαχείριση περιεχομένου, συγγραφικά εργαλεία κ.λπ.) ή από άλλα μέσα και τροπικότητες επικοινωνίας (π.χ. φωνητικές και πολυτροπικές διεπαφές κ.λπ.).

Επιτεύγματα:

  • αυτόματος πολυγλωσσικός υποτιτλισμός
  • συνδυασμός λεξικών προσεγγίσεων (υποκατάσταση βάσει δίγλωσσων λεξικών) και μοντελοποίησης βασισμένης σε μονόγλωσσα σώματα κειμένων
  • μετάφραση τεχνικών κειμένων
  • επεξεργασία μεγάλων παράλληλων σωμάτων κειμένων και αξιοποίησή τους στην αυτόματη δημιουργία δίγλωσσων λεξικών
  • βέλτιστη επιλογή μετάφρασης βάσει του περικείμενου
  • γραμματική μοντελοποίηση της γλώσσας-στόχου για τη βελτίωση της ποιότητας και φυσικότητας της παραγόμενης μετάφρασης
  • Tr·AID: ολοκληρωμένη εφαρμογή μεταφραστικής μνήμης

Ερευνητικοί και αναπτυξιακοί στόχοι:

  • αυτόματες μέθοδοι εντοπισμού και επισημείωσης παράλληλων σωμάτων κειμένων για τη δημιουργία μεταφραστικών μοντέλων
  • αυτόματες μέθοδοι εντοπισμού συγκρίσιμων σωμάτων κειμένων και μετρικές συγκρισιμότητας κειμένων, προκειμένου να μετριαστεί ο περιορισμός της χρήσης παράλληλων σωμάτων κειμένων
  • μέθοδοι αυτόματης θεματικής κατηγοριοποίησης των προς μετάφραση κειμένων και κατάλληλη προσαρμογή της μεταφραστικής μηχανής
  • περαιτέρω εξέλιξη της βασισμένης σε σώματα κειμένων μηχανικής μετάφρασης με τη χρήση παράλληλων σωμάτων κειμένων  περιορισμένου μεγέθους και την εφαρμογή τεχνικών αναγνώρισης προτύπων και τεχνητής νοημοσύνης για γλωσσικές εφαρμογές, όπως η παραλληλοποίηση προτάσεων ή η δημιουργία συμβατών φράσεων σε διαφορετικές γλώσσες και η βελτιστοποίηση των παραμέτρων του συστήματος
  • Ο συνδυασμός των προαναφερθέντων αναμένεται να επιφέρει σημαντική πρόοδο αναφορικά προς την ποιότητα και την ταχύτητα της μετάφρασης, την προσαρμογή των συστημάτων ΜΜ ανάλογα με το θεματικό πεδίο, τη μεταφερσιμότητά τους σε διάφορες γλώσσες καθώς και την ευκολία ανάπτυξης νέων γλωσσικών ζευγών.
 
 

Έργα