Университетът
Шуменският университет част от КЛаДА-БГ

Екип от Шуменския университет „Епископ Константин Преславски” участва в Националната интердисциплинарна изследователска Е-инфраструктура за ресурси и технологии за българското езиково и културно наследство, интегрирана в рамките на европейската инфраструктура CLARIN (Common Language Resources and Technology Infrastructure) – КЛаДА-БГ. „КЛаДА е българска, виртуална, научна инфраструктура”, уточни за UniMedia проф. Велка Попова.
Мисията на инфраструктурата е да изгради научна екосистема за подпомагане на научните изследвания в областта на социалните изследвания и цифровите хуманитарни науки. Основната цел е да се изгради графика на знания за България – хранилище, където да се съхраняват и свързват всички видове езикови и енциклопедични знания. По този начин те ще бъдат използвани за извличане на съдържание по отношение на конкретни задачи.
Един от основните ресурси на КЛаДА-БГ е корпусът на детската реч, създаден от шуменския екип, резултат от десетки часове записи и стотици страници с преписи. „Целта е да могат да се ползват на свободен достъп от всякакъв тип специалисти – педагози, логопеди, социолози и др. В момента по проекта работи нашият екип към Лабораторията по приложна лингвистика, който освен мен включва още проф. Димитър Попов, доц. Красимир Кордов, доц. Станимир Железов, д-р Васил Василев. Доц. Кордов, доц. Железов и д-р Василев се занимават с дигитализацията и синхронизацията, защото те създават мултимодални интерфейси на данните. Например – паралелно с видеото да върви и транскрипцията, което е страшно удобно и полезно и за изследователя, и за преподавателя. В този смисъл тези ресурси имат широк потребител, защото това е философията на CLARIN – да се създаде интердисциплинарна мрежа, която да излъчва такива данни”, допълва проф. Попова.
„Наша амбиция е да направим речник на 1000 българи, защото тази база данни ще може да се използва в различен тип изследвания – и за диагностика, и за преподаване. В рамките на проекта са обобщени материали, събирани 10 години от студенти от различни специалности – Логопедия, Социална педагогика, Английска филология, Българска филология. Така ще бъде създаден един учебен асоциативен речник. Координаторът на европейската инициатива CLARIN за България проф. Кирил Симов от Института за високи технологии към БАН, много хареса идеята за асоциациите и паралелно с нас в БАН започнаха да създават нещо подобно. В един момент ще се получи синхрон между нас. Доц. Кордов и доц. Железов направиха много динамична платформа за създаване на асоциативни речници и за работа с тях. Така че и тези неща също ще влязат в създаването на база данни за събиране на свободни словесни асоциации на съвременния българин. Защото те са много важни за изследването на менталния лексикон”, уточни още проф. Попова.
През следващата година екипът, който работи по проекта, ще се увеличи.
В Европа такива модели вече са се доказали като успешни в Холандия, Австрия и Гърция. Консорциумът CLaDA-BG е много разнороден; нейните членове идват от университети, други академични институции, музеи, библиотеки, неправителствени организации и компании. Тя включва група от партньори, ориентирани към езика и семантичните технологии, от една страна, и експерти, ориентирани към съдържанието, от друга.
UniMedia