ΤΑΥΤΟΤΗΤΑ
Αυτόματη εξαγωγή όρων με χρήση γραμματικής προτύπων
Έτος: | 1997 | ||||
---|---|---|---|---|---|
Συγγραφείς: | Βύρων Γεωργαντόπουλος; Στέλιος Πιπερίδης | ||||
Τίτλος βιβλίου: | 1ο Συνέδριο για την ελληνική γλώσσα και ορολογία | ||||
Διεύθυνση: | Αθήνα | ||||
Οργανισμός: | ΕΛΕΤΟ | ||||
Ημερομηνία: | 30 Οκτωβρίου - 1 Νοε | ||||
Περίληψη: | Στο άρθρο αυτό παρουσιάζονται τα πρώτα αποτελέσματα μιας μεθόδου αυτόματης εξαγωγής όρων από σώματα κειμένων. H μέθοδος στηρίζεται στην εφαρμογή μιας γραμματικής προτύπων που χρησιμοποιεί το φορμαλισμό ενοποίησης (feature-structure unification) και τελεστές κανονικών εκφράσεων-γραμματικών (regular expressions). Το σώμα κειμένων που χρησιμοποιήθηκε είναι ένα εγχειρίδιο οδηγιών της Hewlett-Packard μεγέθους περίπου 90000 λέξεων που περιελάμβανε έναν κατάλογο όρων έναντι του οποίου αξιολογήθηκαν τα αποτελέσματα της μεθόδου. Η μέθοδος εξήγαγε 124 από τους 214 όρους που είχαν εξαχθεί χειρωνακτικά, παρουσιάζοντας ποσοστό ανάκτησης (recall) 58%. |
||||
[Bibtex] |