Υπολογιστικό λεξικό PAROLE
Το Υπολογιστικό λεξικό PAROLE διατίθεται μέσω της ELRA, ενός μη κερδοσκοπικού που αποτελεί τον Ευρωπαϊκό Σύνδεσμο Γλωσσικών Πόρων. Το λεξικό αποτελείται από δύο επίπεδα: μορφολογικό και συντακτικό, και περιέχει τις συχνότερες λέξεις που εντοπίστηκαν σε ένα σώμα κειμένων 9.000.000 λέξεων, το οποίο κωδικοποιήθηκε σύμφωνα με το διεθνές πρότυπο PAROLE. Το μορφολογικό επίπεδο περιέχει 20.149 μορφολογικές μονάδες, από τις οποίες 12.042 ουσιαστικά (κοινά και κύρια), 3.014 ρήματα, 3.405 επίθετα, 106 αριθμητικά, 45 αντωνυμίες, 2 άρθρα, 1.396 επιρρήματα, 48 προθέσεις, 51 σύνδεσμοι, 21 επιφωνήματα και 19 μονάδες “μοναδικών” κατηγοριών. Το συντακτικό επίπεδο περιέχει 25.092 συντακτικές μονάδες, από τις οποίες 14.548 ουσιαστικά 5.397 ρήματα, 3.558 επίθετα, 1.410 επιρρήματα, 73 προθέσεις και 106 εριθμητικά. Το λεξικό δημιουργήθηκε με βάση τις ακόλουθες πηγές:
|
|