Αναμένεται να απαλλάξει τους γλωσσολόγους από τους χρονοβόρους υπολογισμούς της εξελικτικής γλωσσολογίας.
H γλώσσα των κατοίκων των Φίτζι έχει κοινή ρίζα με εκατοντάδες άλλες γλώσσες της Ασίας και του Ειρηνικού
Ουάσινγκτον
Ένας αλγόριθμος που ανέπτυξαν μαθηματικοί στις ΗΠΑ και στον Καναδά φαίνεται ότι μπορεί να βρίσκει τις κοινές ρίζες των σημερινών γλωσσών.
Οι ερευνητές αναφέρουν ότι το λογισμικό επιβεβαίωσε τις θεωρίες των γλωσσολόγων για την «πρωτο-γλώσσα» από την οποία προήλθαν 637 σύγχρονες γλώσσες στην περιοχή της Νοτιοανατολικής Ασίας και του Ειρηνικού.
Ο αλγόριθμος, για παράδειγμα, βρήκε ότι η αρχαία λέξη «bituqen» πρέπει να ήταν η κοινή ρίζα της λέξης «αστέρι» σε όλες αυτές τις γλώσσες, από το «kalokalo» των νησιών Φίτζι μέχρι το «mintol» της Ταϊβάν και το «biten» της Βόρνεο.
Ωθηση στη μελέτη της γενεαλογίας των γλωσσών
Λεπτομέρειες για τον αλγόριθμο, ο οποίος αναμένεται να επιταχύνει σημαντικά τη μελέτη της γενεαλογίας των γλωσσών, δημοσιεύονται στην αμερικανική επιθεώρηση «PNAS».
Οι ερευνητές, με επικεφαλής τον στατιστικό Αλεξάντρ Μπουσάρ-Κοτέ του Πανεπιστημίου του Βανκούβερ, αξιοποίησαν τους κανόνες που έχουν διατυπώσει οι γλωσσολόγοι σχετικά με το πώς οι ήχοι των λέξεων εξελίσσονται στην πορεία των αιώνων.
Το λογισμικό ανέλυσε μια βάση δεδομένων με 120.000 λέξεις από διάφορες γλώσσες του Ειρηνικού, μαζί με τις προφορές και τους ορισμούς τους. Ο αλγόριθμος αναλαμβάνει στη συνέχεια να σχεδιάσει το εξελικτικό δέντρο όλων αυτών των γλωσσών, από την κοινή τους ρίζα μέχρι σήμερα, υπολογίζοντας την πιθανότητα ο ήχος μιας λέξης με συγκεκριμένο νόημα να έχει αλλάξει σύμφωνα με έναν συγκεκριμένο κανόνα.
Προκειμένου να βεβαιωθούν ότι το πρόγραμμα δίνει σωστά, ή τουλάχιστον αρκετά πιθανά αποτελέσματα, οι ερευνητές συνέκριναν το γενεαλογικό δέντρο που προέκυψε με το αντίστοιχο φυλογενετικό δέντρο που είχαν δημιουργήσει «με το χέρι» οι γλωσσολόγοι έπειτα από χρόνια προσπαθειών.
Ταύτιση στο 85% των περιπτώσεων
Πράγματι, τα αποτελέσματα συμφωνούσαν στο 85% των περιπτώσεων. Στις υπόλοιπες περιπτώσεις, οι ερευνητές υποψιάζονται ότι ο αλγόριθμος έπεσε έξω επειδή έλαβε υπόψη λιγότερους κανόνες από ό,τι οι γλωσσολόγοι. Διαβεβαιώνουν πάντως ότι υπάρχει σημαντικό περιθώριο βελτίωσης.
Εφόσον αποδειχθεί αξιόπιστο, το λογισμικό θα μπορούσε να απαλλάξει τους γλωσσολόγους από τους χρονοβόρους και κοπιαστικούς υπολογισμούς της εξελικτικής γλωσσολογίας.
Ήδη, το πρόγραμμα δείχνει να επιβεβαιώνει μια θεωρία του 1955, η οποία μέχρι σήμερα ήταν πρακτικά αδύνατο να εξεταστεί. Η ανάλυση των δεδομένων για τις 637 γλώσσες έδειξε ότι, πράγματι, οι ήχοι που έχουν ιδιαίτερη σημασία προκειμένου να ξεχωρίζουμε μια λέξη από μια άλλη είναι πιθανότερο να παραμείνουν αναλλοίωτοι στην πορεία του χρόνου.
ΤΟ ΒΗΜΑ
Οι ερευνητές αναφέρουν ότι το λογισμικό επιβεβαίωσε τις θεωρίες των γλωσσολόγων για την «πρωτο-γλώσσα» από την οποία προήλθαν 637 σύγχρονες γλώσσες στην περιοχή της Νοτιοανατολικής Ασίας και του Ειρηνικού.
Ο αλγόριθμος, για παράδειγμα, βρήκε ότι η αρχαία λέξη «bituqen» πρέπει να ήταν η κοινή ρίζα της λέξης «αστέρι» σε όλες αυτές τις γλώσσες, από το «kalokalo» των νησιών Φίτζι μέχρι το «mintol» της Ταϊβάν και το «biten» της Βόρνεο.
Ωθηση στη μελέτη της γενεαλογίας των γλωσσών
Λεπτομέρειες για τον αλγόριθμο, ο οποίος αναμένεται να επιταχύνει σημαντικά τη μελέτη της γενεαλογίας των γλωσσών, δημοσιεύονται στην αμερικανική επιθεώρηση «PNAS».
Οι ερευνητές, με επικεφαλής τον στατιστικό Αλεξάντρ Μπουσάρ-Κοτέ του Πανεπιστημίου του Βανκούβερ, αξιοποίησαν τους κανόνες που έχουν διατυπώσει οι γλωσσολόγοι σχετικά με το πώς οι ήχοι των λέξεων εξελίσσονται στην πορεία των αιώνων.
Το λογισμικό ανέλυσε μια βάση δεδομένων με 120.000 λέξεις από διάφορες γλώσσες του Ειρηνικού, μαζί με τις προφορές και τους ορισμούς τους. Ο αλγόριθμος αναλαμβάνει στη συνέχεια να σχεδιάσει το εξελικτικό δέντρο όλων αυτών των γλωσσών, από την κοινή τους ρίζα μέχρι σήμερα, υπολογίζοντας την πιθανότητα ο ήχος μιας λέξης με συγκεκριμένο νόημα να έχει αλλάξει σύμφωνα με έναν συγκεκριμένο κανόνα.
Προκειμένου να βεβαιωθούν ότι το πρόγραμμα δίνει σωστά, ή τουλάχιστον αρκετά πιθανά αποτελέσματα, οι ερευνητές συνέκριναν το γενεαλογικό δέντρο που προέκυψε με το αντίστοιχο φυλογενετικό δέντρο που είχαν δημιουργήσει «με το χέρι» οι γλωσσολόγοι έπειτα από χρόνια προσπαθειών.
Ταύτιση στο 85% των περιπτώσεων
Πράγματι, τα αποτελέσματα συμφωνούσαν στο 85% των περιπτώσεων. Στις υπόλοιπες περιπτώσεις, οι ερευνητές υποψιάζονται ότι ο αλγόριθμος έπεσε έξω επειδή έλαβε υπόψη λιγότερους κανόνες από ό,τι οι γλωσσολόγοι. Διαβεβαιώνουν πάντως ότι υπάρχει σημαντικό περιθώριο βελτίωσης.
Εφόσον αποδειχθεί αξιόπιστο, το λογισμικό θα μπορούσε να απαλλάξει τους γλωσσολόγους από τους χρονοβόρους και κοπιαστικούς υπολογισμούς της εξελικτικής γλωσσολογίας.
Ήδη, το πρόγραμμα δείχνει να επιβεβαιώνει μια θεωρία του 1955, η οποία μέχρι σήμερα ήταν πρακτικά αδύνατο να εξεταστεί. Η ανάλυση των δεδομένων για τις 637 γλώσσες έδειξε ότι, πράγματι, οι ήχοι που έχουν ιδιαίτερη σημασία προκειμένου να ξεχωρίζουμε μια λέξη από μια άλλη είναι πιθανότερο να παραμείνουν αναλλοίωτοι στην πορεία του χρόνου.
ΤΟ ΒΗΜΑ