Το έργο PANACEA (ICT-248064) αποβλέπει στην ανάπτυξη υποδομών για τον συνδυασμό γλωσσικών τεχνολογιών με στόχο την αυτόματη παραγωγή των τεράστιων γλωσσικών πόρων που απαιτούν τα σύγχρονα συστήματα Μηχανικής Μετάφρασης και Επεξεργασίας Φυσικής Γλώσσας. Πιο συγκεκριμένα, ο στόχος του PANACEA είναι η δημιουργία ενός “εργοστασίου” κατασκευής γλωσσικών πόρων το οποίο θα αυτοματοποιεί όλα τα στάδια που περιλαμβάνονται στην απόκτηση, παραγωγή, ενημέρωση και συντήρηση των απαιτούμενων γλωσσικών πόρων ώστε αυτοί οι πόροι να μπορούν να χρησιμοποιηθούν αποδοτικά σε διαφορετικά ζεύγη γλωσσών, κειμενικά είδη και γνωστικά πεδία. Οι γλωσσικοί πόροι που θα παραχθούν περιλαμβάνουν μονόγλωσσα και δίγλωσσα σώματα κειμένων και λεξικά. Η εξοικονόμηση χρόνου και χρήματος που θα επιφέρει αυτή η αυτοματοποίηση αναμένεται να συμβάλει ουσιαστικά στην υπερπήδηση των γλωσσικών εμποδίων που αντιμετωπίζει η Ευρώπη σήμερα.
Κύριοι στόχοι
- Κατασκευή μιας ανοιχτής πλατφόρμας ενσωμάτωσης διαδικτυακών υπηρεσιών που θα επιτρέπει την εύκολη κατασκευή ροών εργασίας για την δημιουργία γλωσσικών πόρων
- Ανάπτυξη τεχνικών για την αυτόματη και εύρωστη απόκτηση και επεξεργασία μονόγλωσσων και παράλληλων σωμάτων κειμένων
- Χρήση προτασιακής και υπο-προτασιακής στοίχισης για την παραγωγή δίγλωσσων λεξικών και γραμματικών μεταφοράς
- Ανάπτυξη τεχνικών για την εξαγωγή πλαισίων υποκατηγοριοποίησης, προτιμήσεων επιλογής (selectional preferences), πολυλεκτικών εκφράσεων και λεξικοσημασιολογικών κλάσεων από μεγάλα σώματα κειμένων
|
|
Ερευνητικές περιοχές
Δημοσιεύσεις
|
|