17.03.2022-03-17 Źrodło: Xinhua

 

Mieszkańcy wioski zbierają jabłka w miejscowości Qingde w okręgu Xiangcheng, w Tybetańskiej Prefekturze Autonomicznej Garze, w prowincji Syczuan, 20 października 2021 r. (Xinhua/Liu Kun)

Kiedy był poza domem, Gerong, który mówi tylko tybetańskim dialektem Kamba, często bywał w niezręcznych sytuacjach, w których niewiele osób mogło go zrozumieć.

Jednak w tym miesiącu, kiedy 50-letni Tybetańczyk z prefektury Garze w prowincji Syczuan odwiedził szpital w stolicy prowincji Chengdu, w sprawie swojej choroby bez problemów porozumiewał się z lekarzem mówiącym po mandaryńsku.

W pokonaniu bariery językowej pomogła im aplikacja do rozpoznawania mowy na smartfonie, która może konwertować trzy główne tybetańskie dialekty – U-Tsang, Amdo i Kamba – na teksty oraz tłumaczyć je na język chiński.

Oprogramowanie, nazwane Dungkar Tibetan Keyboard, jest dziełem grupy młodych inżynierów z firmy iFLYTEK, giganta w dziedzinie zastosowań sztucznej inteligencji i technologii mowy.

„Dzięki nowej zdolności rozpoznawania dialektów tybetańskich oprogramowanie może teraz zaspokoić potrzeby około dwóch trzecich wszystkich Tybetańczyków w Chinach” — powiedział Nyima Wangdu, menedżer produktu firmy Dungkar.

Klawiatura tybetańska została wprowadzona na rynek w 2017 roku, ale zaczęła obsługiwać rozpoznawanie mowy dopiero na początku tego miesiąca. Po zbudowaniu podstawowego słownika tybetańskiego tzw. korpusu dialektu Kamba inżynierowie potrzebowali prawie pięciu lat, aby włączyć tę funkcję.

„Głównymi przeszkodami w rozwoju oprogramowania był brak korpusu i brak wsparcia ze strony językoznawców dialektów tybetańskich” – powiedział Nyima Wangdu.

Aby rozwiązać ten problem, grupa z iFLYTEK rozszerzyła poszukiwania osób mówiących dialektami tybetańskimi. Do projektu zwerbowali prawie 60 tybetańskich studentów z Uniwersytetu Południowo-Zachodniego Minzu, którzy pomogli zespołowi wzbogacić korpus tybetańskiego dialektu Kamba.

By rozwiązać problemy techniczne grupa powołała zespół zajmujący się opracowywaniem nowej generacji wszechstronnych wielojęzycznych systemów syntezy mowy.

Cao Bin, jeden z inżynierów, ukończył na studiach lingwistykę. Jego praca skupiała się na rozwiązywaniu różnic składniowych między tybetańskim a chińskim. Powiedział na przykład, że „13 marca” po mandaryńsku to po tybetańsku „13 marca”.

Deng Qi, projektant interfejsu użytkownika, musiał uporać się z problemem estetycznym wynikającym z różnicy długości zdań w obu językach.

„Chociaż staraliśmy się dopasować długość wyrażeń w obu językach, martwiliśmy się również dokładnością tłumaczeń” – powiedział Deng. „Włożyliśmy ogromny wysiłek, aby osiągnąć idealny wynik”.

Obecnie aplikacja Dungkar ma ponad 4,8 miliona użytkowników w regionach tybetańskojęzycznych, takich jak Tybetański Region Autonomiczny oraz prowincje Syczuan i Qinghai.

„Wierzę, że język to nie tylko narzędzie do komunikowania się, ale także pomost, który zbliża do siebie ludzi w różnych miejscach” – powiedział Nyima Wangdu.