Align-it: Στοίχιση κειμένων
ΕΡΕΥΝΗΤΙΚΑ ΑΠΟΤΕΛΕΣΜΑΤΑ

Align-it: Στοίχιση κειμένων

Κατηγορία: Υπηρεσίες

Δύο γλώσσες μπορούν να δώσουν περισσότερες πληροφορίες από αυτές που παρέχει μία. Προφανώς, ένα σώμα κατάλληλα παραλληλοποιημένων κειμένων αποτελεί μια πολύτιμη πηγή πληροφοριών, όχι μόνο για ερευνητές της λεξικογραφίας και της ορολογίας, αλλά και για μια πληθώρα εφαρμογών, όπως οι μεταφραστικές μνήμες, τα δίγλωσσα λεξικά, κλπ.

Στοίχιση ονομάζεται η διαδικασία καθιέρωσης αντιστοιχίσεων ανάμεσα σε μονάδες κειμένων και η επακόλουθη κατασκευή σωμάτων παράλληλων κειμένων. Το επίπεδο ακρίβειας της στοίχισης εξαρτάται από τη φύση της συγκεκριμένης εφαρμογής. Για παράδειγμα, μια χονδρική στοίχιση θα ήταν η αντιστοίχιση παραγράφων δύο κειμένων, ενώ ένα πολύ λεπτομερές επίπεδο στοίχισης θα ήταν σε επίπεδο λέξης. Το συνηθέστερο επίπεδο στοίχισης είναι η πρόταση.

Η στοίχιση προτάσεων με το χέρι δεν είναι μόνο χρονοβόρα και δαπανηρή, αλλά επίσης προϋποθέτει και συγκεκριμένες, ειδικές δεξιότητες καθώς και καλή γλώση όλων των γλωσσικών ζευγών. Για να αντιμετωπισθεί αυτό, έχουν αναπτυχθεί εφαρμογές λογισμικού που επιτυγχάνουν αξιόπιστες στοιχίσεις με το ελάχιστο κόστος.

Το Align-it έχει τη δυνατότητα να παράγει στοιχίσεις προτάσεων για ένα ολόκληρο τμήμα δίγλωσσων κειμένων. Αυτό είναι ιδιαίτερα χρήσιμο, τόσο σε επίπεδο προ-επεξεργασίας κειμένων, για τη μετέπειτα υλοποίηση άλλων ειδικευμένων εργαλείων (όπως μιας μεταφραστικής μνήμης), όσο και ως ένα εργαλείο αναθεώρησης και αξιολόγησης της μεταφραστικής εργασίας.

Το Align-it παρέχει στο χρήστη τη δυνατότητα να βλέπει ένα κείμενο και τη μετάφρασή του δίπλα δίπλα, με σαφείς διασυνδέσεις ανάμεσα στα στοιχεία των κειμένων. Μπορεί επίσης να διευκολύνει την αυτόματη ανάλυση των μεταφράσεων σε βαθύτερο επίπεδο, για παράδειγμα, μπορεί να χρησιμοποιηθεί για να εντοπίσει πιθανές παραλείψεις σε μια μετάφραση ή να επισημάνει συνήθη μεταφραστικά λάθη, όπως οι ορολογικές ασυνέπειες.

Το εργαλείο αντιμετωπίζει έξι περιπτώσεις μετάφρασης:

  • μετάφραση μίας πρότασης προς μία άλλη
  • μετάφραση μίας πρότασης προς καμμία άλλη (δεν μεταφράζεται καθόλου)
  • εισαγωγή νέας πρότασης από το μεταφραστή η οποία δεν έχει αντίστοιχη στο κείμενο-πηγή
  • μετάφραση δύο διαδοχικών προτάσεων προς μία πρόταση
  • μετάφραση μίας πρότασης-πηγής προς δύο προτάσεις
  • μετάφραση δύο προτάσεων προς μία πρόταση

Για τις ευρωπαϊκές γλώσσες, στις περισσότερες περιπτώσεις, μια πρόταση μίας γλώσσας συνήθως αντιστοιχεί σε μία ακριβώς πρόταση στην άλλη γλώσσα.

Η είσοδος στο εργαλείο στοίχισης είναι ένα ζεύγος κειμένων όπως αυτό στο ακόλουθο παράδειγμα (Γένεσις, Βίβλος):

In the beginning God created the heaven and the earth. And the earth was without form, and void: and darkness was upon the face of the deep. And the spirit of God moved upon the face of the waters.

Au commencement, Dieu crea les cieux et la terre. La terre etait informe et vide: il y avait des tenebres a la surface de l'abime, et l'esprit de Dieu se mouvait au-dessus des eaux.

Στην έξοδο, το εργαλείο παρέχει στοιχισμένες προτάσεις. Οι πρώτες δύο στοιχίσεις στο επόμενο σχήμα αποτελούν την τυπική περίπτωση όπου μία πρόταση μεταφράζεται σε μία. Στην τρίτη στοίχιση, μία πρόταση μεταφράζεται σε δύο.

Pair 1 In the beginning God created the heaven and the earth. Au commencement, Dieu crea les cieux et la terre.
Pair 2 And the earth was without form, and void; La terre etait informe et vide:
Pair 3 and darkness was upon the face of the deep.

And the spirit of God moved upon the face of the waters.
il y avait des tenebres a la sufrace de l'abime, et l'esprit de Dieu se mouvait au-dessus des eaux.

Το Align-it παρέχει επιπλέον τα εξής:

  • Αναγνώριση εξωγλωσσικών στοιχείων (συντμήσεων και ακρωνυμίων, ημερομηνιών και αριθμών)
  • Επίλυση της αμφισημίας των σημείων στίξης
  • Βοήθημα για τη διόρθωση εσφαλμένων στοιχίσεων

Το Align-it λειτουργεί σε περιβάλλον Windows με GUI και μπορεί να χρησιμοποιηθεί τόσο με ποντίκι όσο και με πληκτρολόγιο. Η εφαρμογή παρέχει στο χρήστη έναν επεξεργαστή κειμένου που υποστηρίζει βασικές λειτουργίες, όπως δημιουργία νέου κειμένου ή άνοιγμα υπάρχοντος εγγράφου, αποκοπή και επικόλληση, αποθήκευση και εκτύπωση. Ο επεξεργαστής κειμένου υποστηρίζει επίσης το άνοιγμα ενός αρχείου που περιέχει μια λίστα παράλληλων κειμένων, την επιλογή ενός ζεύγους από αυτή τη λίστα και την στοίχισή τους. Το αρχείο αυτό περιέχει και τα προσδιοριστικά τα οποία επισημαίνουν τα όρια των παραγράφων και των προτάσεων μέσα στο σώμα κειμένων. Στην περίπτωση της στοίχισης δύο ξεχωριστών αρχείων, αυτά τα προσδιοριστικά μπορούν να εισαχθούν από το χρήστη σε ένα ειδικό πλαίσιο που εμφανίζεται στην οθόνη.

Το αποτέλεσμα του εργαλείου μπορεί να παρουσιαστεί στην οθόνη με πολλούς τρόπους. Ο χρήστης μπορεί να παρεμβαίνει στην περίπτωση τυχόν εσφαλμένης στοίχισης και να τη διορθώνει με το χέρι. Το τελικό προϊόν της διαδικασίας στοίχισης μπορεί να αποθηκευτεί σε ένα αρχείο το οποίο θα περιλαμβάνει είτε τα ίδια τα κείμενα είτε τις αποστάσεις τους από συγκεκριμένα σημεία κλειδιά.

Τέλος, στο περιβάλλον του Align-it περιλαμβάνεται και ένα εργαλείο χαρακτηρισμού το οποίο χρησιμοποιείται για την αυτόματη αναγνώριση και επισήμανση των ορίων της πρότασης.

 

Πρόσωπο επικοινωνίας: Πιπερίδης Στέλιος

 
 

Επιστημονικά τμήματα

Ερευνητικοί άξονες