ΕΘΕΓ: Εθνικός Θησαυρός Ελληνικής Γλώσσας
ΕΡΕΥΝΗΤΙΚΑ ΑΠΟΤΕΛΕΣΜΑΤΑ
ΕΘΕΓ: Εθνικός Θησαυρός Ελληνικής Γλώσσας

ΕΘΕΓ: Εθνικός Θησαυρός Ελληνικής Γλώσσας

Κατηγορία: Γλωσσικοί Πόροι

Το σώμα κειμένων του Ινστιτούτου Επεξεργασίας του Λόγου αναπτύσσεται επί σειρά ετών και σήμερα περιλαμβάνει περισσότερες από 47.000.000 λέξεις, οι οποίες αυξάνονται σε τακτά χρονικά διαστήματα. Οι χρήστες έχουν τη δυνατότητα να εμφανίζουν προτάσεις του ΕΘΕΓ χρησιμοποιώντας από ένα μέχρι τρία κριτήρια. Αναζητήσεις γίνονται με βάση λέξεις, λήμματα ή μέρη του λόγου.

Μεταξύ άλλων, οι χρήστες μπορούν να καθορίσουν:

  • τη μέγιστη απόσταση ανάμεσα στα αντικείμενα αναζήτησης,
  • τον τρόπο εμφάνισης (σε ολόκληρες προτάσεις ή σε συμφραστικούς πίνακες)
  • τον αριθμό χαρακτήρων πριν και μετά το αντικείμενο αναζήτησης,
  • τον τρόπο ταξινόμησης των αποτελεσμάτων,
  • το υποσύνολο κειμένων στο οποίο θα γίνει η αναζήτηση.

Τέλος, δίνονται κάποια στατιστικά στοιχεία, τόσο για το γλωσσικό περιεχόμενο του ΕΘΕΓ, όσο και για τη δραστηριότητα κάθε χρήστη.

Ο ΕΘΕΓ αποτελεί πολύτιμο εργαλείο για ποικίλες μελέτες πάνω στην ελληνική γλώσσα και μπορεί να χρησιμοποιηθεί - μεταξύ άλλων - για:

  • γλωσσολογική έρευνα,
  • λεξικογραφία,
  • ποσοτικές μετρήσεις της γλώσσας,
  • επεξεργασία φυσικής γλώσσας.
 
 

Ερευνητικοί άξονες

Έργα

Υπηρεσίες

Δημοσιεύσεις