Acest algoritm decodează automat orice limbă necunoscută
Oamenii de știință de la Laboratorul de Informatică și Inteligență Artificială din Massachusetts Institute of Technology (MIT CSAIL) au dezvoltat un algoritm care poate decoda automat un limbaj pierdut care nu mai este înțeles, fără a ști relația acestuia cu alte limbi.
Cercetătorii au dezvoltat algoritmul ca răspuns la dispariția rapidă a limbilor umane, întrucât majoritatea limbilor care au existat cândva nu mai sunt vorbite, iar jumătate din limbile rămase vor pieri în următorii 100 de ani.
Noul sistem ar putea ajuta la restaurarea limbilor pierdute
Algoritmul funcționează prin valorificarea principiilor de bază din lingvistica istorică, cum ar fi modalitățile prevăzute în care limbile folosesc alternative fonemice.
Aceste tipuri de tipare sunt apoi convertite în determinanți matematici, iar acest lucru permite modelului să segmenteze cuvintele dintr-o limbă veche și să le mapeze la o limbă asemănătoare.
Algoritmul poate identifica, de asemenea, diferite familii de limbi. De exemplu, metoda lor a sugerat că limbile din zona Iberică, spre exemplu spaniola, nu au nimic de-a face cu limba bască, susținând astfel studiile academice moderne.
Proiectul a fost condus de Regina Barzilay, profesorul MIT care a câștigat luna trecută un premiu de 1 milion de dolari de la cea mai mare asociație din lume pentru AI pentru munca sa de pionierat în dezvoltarea medicamentelor și screeningul pentru cancerul la sân.
Cercetătorul dorește acum să extindă domeniul de activitate pentru a determina semnificația semantică a cuvintelor chiar dacă nu știm cum să le citim.
“De exemplu, putem identifica toate referințele la persoane sau locații din document care pot fi apoi investigate în continuare în lumina dovezilor istorice cunoscute”, a spus Barzilay într-un comunicat.
“Aceste metode de identificare a entităților sunt utilizate în mod obișnuit în multe aplicații de procesare a textelor de astăzi și sunt foarte exacte, dar principala întrebare de cercetare este dacă sarcina este fezabilă fără date de instruire pentru limba veche”.