To έργο PARSEME έχει στόχο να ενισχύσει και να αναβαθμίσει την υποστήριξη της Ευρωπαϊκής πολυγλωσσικής κληρονομιάς από την άποψη των Τεχνολογιών των Πληροφοριών και της Επικοινωνίας (ICT). Ο γενικός αυτός σκοπός εξυπηρετείται με τη βελτίωση των εφαρμογών Επεξεργασίας της Φυσικής Γλώσσας (NLP) όσον αφορά την αντιπροσωπευτικότητα, την ακρίβεια και την υπολογιστική αποτελεσματικότητα. Το έργο έχει ως αντικείμενό του ένα από τα σοβαρότερα προβλήματα που αντιμετωπίζουν οι εφαρμογές NLP: πρόκειται για τις Πολυλεκτικές Εκφράσεις (MWEs), δηλαδή ακολουθίες λέξεων με απρόβλεπτες ιδιότητες όπως "το παίρνω πάνω μου" ή "νίπτω τας χείρας μου". Πραγματική πρόοδος όσον αφορά τον τρόπο μοντελοποίησης και επεξεργασίας τους θα υπάρξει μόνον με την συντονισμένη διαθεματική και πολυγλωσσική προσπάθεια ειδικών. Το πρόγραμμα COST παρέχει το καταλληλότερο περιβάλλον για αυτού του τύπου την προσπάθεια. Θα μελετηθούν 14 Ευρωπαϊκές γλώσσες υιοθετώντας μια ευρεία γκάμα θεωρητικών και μεθοδολογικών προσεγγίσεων, πράγμα που είναι αναγκαίο για να αντιμετωπιστεί ο υφιστάμενος κατακερματισμός. Στα αναμενόμενα παραδοτέα περιλαμβάνονται αναβαθμισμένοι γλωσσικοί πόροι και εργαλεία καθώς και οδηγίες για βέλτιστες πρακτικές όσον αφορά γλωσσικά μοντέλα αιχμής που λαμβάνουν υπόψιν τους τις Πολυλεκτικές Εκφράσεις.
Το έργο:
-Θα έχει ως αποτέλεσμα την καλύτερη κατανόηση της φύσης των Πολυλεκτικών Εκφράσεων
-Θα εγκαθιδρύσει μακροχρόνιες συνεργασίες στο πλαίσιο ενός πολυγλωσσικού δικτύου ειδικών στις Πολυλεκτικές Εκφράσεις
- Θα ανοίξει τον δρόμο για ανταγωνιστικά εργαλεία επεξεργασίας κειμένου νέας γενιάς εργαλεία τα οποία θα είναι πιο ευαίσθητα στα γλωσσικά φαινόμενα.
|