Æ — всему голова: эксперты назвали самую популярную букву осетинских текстов В День осетинского АНО «Фонд цифрового развития осетинского языка» опубли…
В День осетинского АНО «Фонд цифрового развития осетинского языка» опубликовал материал о частотности алфавитных единиц. Эти данные важны для развития цифровых инструментов — клавиатур, поиска и распознавания текста.
Для анализа использовались два больших массива текстов: верифицированные переводы на платформе фонда и книжный массив из 172 оцифрованных изданий. По результатам исследования, в десятку букв первого вошли ӕ, ы, а, н, т, р, д, с, у, м. Во втором случае состав группы остался тем же, изменился только порядок нескольких позиций. В обоих случаях первые четыре места остались за ӕ, ы, а, н.
«Это важный результат. Он показывает, что у осетинского письменного текста есть устойчивое частотное ядро, которое уже можно описывать на основе больших данных», — считают в фонде.
Подписывайся на «Сапа 15»в МАХ