Adaptive Languages : An Information-Theoretic Account of Linguistic Diversity
Christian Bentz

Languages carry information. To fulfil this purpose, they employ a multitude of coding strategies. This book explores a core property of linguistic coding – called lexical diversity. Parallel text corpora of overall more than 1800 texts written in more than 1200 languages are the basis for computational analyses. Different measures of lexical diversity are discussed and tested, and Shannon's measure of uncertainty – the entropy – is chosen to assess differences in the distributions of words. To further explain this variation, a range of descriptive, explanatory, and grouping factors are considered in a series of statistical models. The first category includes writing systems, word-formation patterns, registers and styles. The second category includes population size, non-native speaker proportions and language status. Grouping factors further elicit whether the results extrapolate across – or are limited to – specific language families and areas. This account marries information-theoretic methods with a complex systems framework, illustrating how languages adapt to the varying needs of their users. It sheds light on the puzzling diversity of human languages in a quantitative, data driven and reproducible manner.

Издательство:
De Gruyter Mouton
Год издания:
2018
ISBN:
978-3-1105-5758-9
ISBN:
978-3-1105-5777-0
ISBN:
978-3-1105-6010-7
Нельзя скачать PDF (6.4 MB)
Вы находитесь на официальном сайте библиотеки МФТИ, здесь представлен каталог электронных книг, доступных для скачивания и чтения студентам и сотрудникам МФТИ, а также посетителям сайта, находящимся в локальной сети МФТИ. Для доступа к полным текстам необходимо пройти авторизацию на портале https://profile.mipt.ru, после чего вернуться на сайт библиотеки https://books.mipt.ru. В случае возникновения затруднений при выполнении указанных действий, пожалуйста, свяжитесь с нами.
Если Вы считаете нужным сообщить об опечатке, ошибке или о другой проблеме, Вы можете это сделать.