Σάββατο, 29 Σεπτεμβρίου 2012

Κίνδυνος ψηφιακής εξαφάνισης για 21 γλώσσες

Τον κίνδυνο της ψηφιακής εξαφάνισης αντιμετωπίζουν τουλάχιστον 21 ευρωπαϊκές γλώσσες, μεταξύ των οποίων και η ελληνική, σύμφωνα με πρόσφατη μελέτη. Πρόκειται για τις γλώσσες που δεν υποστηρίζονται επαρκώς από τη γλωσσική τεχνολογία, δηλαδή δεν ενσωματώνονται σε υπολογιστικές εφαρμογές, συστήματα πληροφορικής και επικοινωνιακής τεχνολογίας. Με άλλα λόγια, γλώσσες που δεν χρησιμοποιούμε στην ψηφιακή μας ζωή.
Η μελέτη καταρτίστηκε από περισσότερους από 200 ειδικούς του δικτύου ευρωπαϊκών ερευνητικών κέντρων ΜΕΤΑ-ΝΕΤ. Αξιολογώντας το επίπεδο της υποστήριξης που παρέχει η γλωσσική τεχνολογία όσον αφορά την αυτόματη μετάφραση, τη φωνητική αλληλεπίδραση, την ανάλυση κειμένου και τη διαθεσιμότητα γλωσσικών πόρων σε 30 ευρωπαϊκές γλώσσες, οι ειδικοί κατέληξαν ότι η ψηφιακή υποστήριξη σε 21 από αυτές είναι από ανεπαρκής έως ανύπαρκτη.
Τη χαμηλότερη βαθμολογία στις περισσότερες «περιοχές» συγκέντρωσαν τα ισλανδικά, τα λεττονικά, τα λιθουανικά και τα μαλτέζικα. Στο άλλο άκρο της κατάταξης, μόνο η αγγλική αξιολογήθηκε ότι έχει «καλή υποστήριξη», ενώ δεν υπάρχει καμία γλώσσα με «άριστη υποστήριξη». Ακολουθούν τα γαλλικά, τα γερμανικά, τα ιταλικά, τα ισπανικά και τα ολλανδικά με «μέτρια υποστήριξη», ενώ γλώσσες όπως τα ελληνικά, τα βασκικά, τα βουλγαρικά, τα καταλανικά, τα ουγγρικά και τα πολωνικά έχουν «αποσπασματική υποστήριξη» και ως εκ τούτου ανήκουν στις γλώσσες υψηλού κινδύνου.
Το χάσμα διευρύνεται
Από την έρευνα αποκαλύφθηκε ότι το χάσμα μεταξύ των λεγόμενων «μικρών» και «μεγάλων» γλωσσών ολοένα διευρύνεται αντί να συρρικνώνεται. Οπως τονίζουν οι επιμελητές της μελέτης, οι περισσότερες ευρωπαϊκές γλώσσες παρουσιάζουν μεγάλες ελλείψεις σε γλωσσικούς πόρους ενώ κάποιες από αυτές είναι τελείως παραμελημένες και είναι δύσκολο να διασφαλιστεί το ψηφιακό τους μέλλον. «Τα αποτελέσματα της μελέτης μας είναι πολύ ανησυχητικά. Υπάρχουν δραματικές διαφορές στην υποστήριξη της γλωσσικής τεχνολογίας ανάμεσα στις διάφορες ευρωπαϊκές γλώσσες και τεχνολογικές περιοχές. Πρέπει να εξασφαλίσουμε τον εφοδιασμό των μικρότερων και λιγότερο πλούσιων σε ψηφιακούς πόρους γλωσσών με τις απαραίτητες βασικές τεχνολογίες, αλλιώς οι γλώσσες αυτές είναι καταδικασμένες σε ψηφιακή εξαφάνιση».
Η ελληνική μελέτη
Τι συμβαίνει όμως ειδικά με τα ελληνικά; «Τα ελληνικά είναι μία από τις γλώσσες με μικρό
αριθμό ομιλητών και μικρό όγκο ψηφιακών γλωσσικών πόρων και τεχνολογιών», σημειώνουν οι συγγραφείς της αντίστοιχης ελληνικής μελέτης. «Η κρισιμότητα της ανάπτυξης της γλωσσικής τεχνολογίας για τα ελληνικά προβάλλει έντονα μόλις κανείς εξετάσει τι ακριβώς είναι και τι προσφέρει η γλωσσική τεχνολογία, τους τρέχοντες περιορισμούς της αλλά και τις τεράστιες δυνατότητες καινοτομίας». Η γλωσσική τεχνολογία παράγει λογισμικό που επεξεργάζεται τον προφορικό και τον γραπτό λόγο. Χαρακτηριστικά παραδείγματα λογισμικού είναι οι ορθογραφικοί και συντακτικοί διορθωτές, οι διαδραστικοί προσωπικοί βοηθοί στα έξυπνα τηλέφωνα (όπως η Siri στο iPhone), τα διαλογικά συστήματα μέσω τηλεφώνου, τα συστήματα αυτόματης μετάφρασης, οι μηχανές αναζήτησης στο Διαδίκτυο και η συνθετική φωνή σε συστήματα πλοήγησης στα αυτοκίνητα.
Το πρόβλημα είναι ότι τα σύγχρονα συστήματα γλωσσικής τεχνολογίας βασίζονται κυρίως σε στατιστικές μεθόδους που απαιτούν πολύ μεγάλες ποσότητες προφορικών και γραπτών δεδομένων. Οταν λοιπόν πρόκειται για γλώσσες με σχετικά λίγους ομιλητές, ο απαραίτητος όγκος δεδομένων είναι πολύ δύσκολο να βρεθεί.

Δεν υπάρχουν σχόλια:

Δημοσίευση σχολίου