Προφορικό σώμα κειμένων “Λογοτυπογραφία”
ΕΡΕΥΝΗΤΙΚΑ ΑΠΟΤΕΛΕΣΜΑΤΑ

Προφορικό σώμα κειμένων “Λογοτυπογραφία”

Κατηγορία: Γλωσσικοί Πόροι

Το Προφορικό σώμα κειμένων “Λογοτυπογραφία” διατίθεται μέσω της ELRA, ενός μη κερδοσκοπικού που αποτελεί τον Ευρωπαϊκό Σύνδεσμο Γλωσσικών Πόρων. Αποτελείται από αναγνώσεις που συλλέχθηκαν για να εξυπηρετήσουν την ανάπτυξη τεχνολογίας αναγνώρισης φωνής για τα ελληνικά.

Όλες οι προτάσεις επιλέχθηκαν από αποσπάσματα του γραπτού σώματος κειμένων της Ελευθεροτυπίας και περιέχουν λεξιλόγιο περίπου 40.000 λέξεων. Ο συνολικός αριθμός εκφωνημάτων ξεπερνά τα 32.000, με σχεδόν 72 ώρες ηχητικό υλικό από 120 διαφορετικούς ομιλητές και των δύο φύλων.

 
 

 Ερευνητικές περιοχές