Научные проекты

КРАТКИЙ  ЗАКЛЮЧИТЕЛЬНЫЙ ОТЧЕТ НАУЧНОГО ПРОЕКТА

ПО ГРАНТОВОМУ ФИНАНСИРОВАНИЮ

Название Проекта: Автоматизация распознавания  и порождения письменной и устной  речи казахского языка

Сроки выполнения Проекта: 2012-2014 гг.

Место исполнения Проекта: ЕНУ им. Л.Н.Гумилева, НИИ «Искусственный интеллект»

Объем финансироания: 43 500 тыс. тг.

Руководитель Проекта: А.Ә. Шәріпбай

Глоссарий

Автоматический транскриптор – программный модуль, осуществляющий фонетическую транскрипцию текста в автоматическом режиме.

Артикуляция – совокупность работ отдельных произносительных органов при образовании звуков речи. В произношении любого звука речи принимают то или иное участие все активные произносительные органы. Положение этих органов, необходимое для образования данного звука, образуют его артикуляцию, отделимость звуков, чёткость их звучания.

База знаний – это особого рода база данных, разработанная для оперирования знаниями(метаданными).

Единица речи - единица языка, наделенная производной комбинацией значения и способная выполнять коммуникативные функции.

Математическая модель – это математическое представление реальности.

Моделирование – исследование объектов познания на их моделях; построение и изучение моделей  реально существующих объектов, процессов или явлений с целью получения объяснений этих явлений, а также для предсказания явлений, интересующих исследователя.

Морфология – раздел грамматики, изучающий части речи, их категории и формы слов.

Начальная форма слова – это та форма изменяемых частей речи, которая фиксируется в словарях.

Обработка сигналов - процесс преобразования аналоговых и/или дискретных сигналов. Обработка сигналов может осуществляться аналоговыми и дискретными методами.

Обработка речи - процессы анализа, преобразования и синтеза речи.

Распознавание речи – преобразование речевого сигнала в текст.

Речь - исторически сложившийся вид коммуникативной деятельности человека, посредством использования возможностей языка для общения с другими членами языкового коллектива. Различают экспрессивную и импрессивную речь.

Семантика – раздел языкознания, изучающий значение единиц языка.

Синтез речи – формирование речевого сигнала по печатному тексту.

Слитная речь – естественно произнесенные предложения, без специального разделения отдельных слов участками пауз.

Словоизменение – образование словоформ той же лексемы, имеющих разные грамматические значения.

Словообразование – образование новых слов (дериватов) от однокорневых слов и возникшее в результате этого формально-семантическое соотношение между дериватом и его производящим словом.

Словоформа – слово в узком смысле, то есть обладающая признаками слова цепочка фонем, формально отличающаяся от другой.

Транскрипция, фонетическая транскрипция –  графическая запись звучания слова с использованием символов некоторого фонетического алфавита. Каждый отдельный звук должен быть отдельно зафиксирован в записи.

Устная речь - речь, порождаемая в процессе говорения. Обычно устная речь творится в процессе беседы, для нее характерна неподготовленность.

Фонема – единица языка, с помощью которой различаются и отождествляются морфемы и тем самым слова. Фонема как абстрактная единица языка соответствует звуку речи как конкретной единице, в которой фонема материально реализуется.

Фонетика – раздел языкознания, изучающий способы образования звуков речи и их акустические характеристики.

Фонология – раздел языкознания, изучающий структуру звукового строя языка и функционирование звуков в языковой системе. Основной единицей фонологии является фонема, основным объектом исследования –  противопоставления (оппозиции) фонем, образующие в совокупности фонологическую систему языка.

ОТЧЕТНЫЕ ПУБЛИКАЦИИ ПРОЕКТА В  НЕПЛАТНЯХ РЕЙТИНГОВЫХ ЖУРНАЛАХ, ЦЕЛИ ИЗАДАЧИ ПРОЕКТА С ГРАНТОЗАКРЫВАЮЩИМИ РЕЗУЛЬТАТАМИ

1.   1. Отчетные публикации (в неплатных рейтинговых журналах и другие)

Количество публикаций за 3 года – 59, из них:

–      В журналах с импакт-фактором – 1;

–      В журналах базы Scopus – 1;

–      Журналы, рекомендованные ККСОН – 14;

–      В сборниках международных конференций – 38;

–      В других изданиях – 5.

Список публикаций за 2012-2015 гг.:

1.   А.А.Шарипбаев, Г.Т. Бекманова, Б.Ж. Ергеш, А.К. Бурибаева, М.Х. Карабалаева. Интеллектуальный морфологический анализатор, основанный на семантических сетях // II Международная научно-техническая конференция «Открытые семантические технологии проектирования интеллектуальных систем» (Open Semantic Technologies for Intelligent Systems – OSTIS-2012). – БГУИР, Минск, Белоруссия, 2012. – С. 397-400.

2.   B.Zh.Yergesh, A.A.Sharipbayev, G.T. Bekmanova, A.K.Buribayeva,  A.S. Mukanova. Semantic retrieval of information in the kazakh language in e-libraries // Journal of International Scientific Publications: Educational Alternatives, Volume 10, part 1, P.108-115. ISSN: 1313–2571, published at: http://www.scientific-publications.net

3.   A.K.Buribayeva,  A.B. Barlybayev, A.A.Sharipbayev, B.Zh.Yergesh. Speech user interfaces and contents for e-learning // Journal of International Scientific Publications: Educational Alternatives, Volume 10, part 4, p.244-251. ISSN: 1313–2571, published at: http://www.scientific-publications.net

4.   Zh. Yessenbayev, M. Karabalayeva, A. Sharipbayev. Formant Analysis and Mathematical Model of Kazakh Vowels // UKSim2012: UKSim 14th International Conference on Computer Modelling and Simlulation. – Cambridge, United Kingdom, 28-30 March 2012. – P. 427-431.

5.   Ж. Есенбаев, М. Карабалаева, А. Шарипбаев. Математическое моделирование. Геометрия казахских гласных // Қазақстан Республикасы Ұлттық ғылым академиясының баяндамалары. – Алматы, 2012. – №1. – С. 24-32.

6.   G.T.Bekmanova, A.A.Sharipbaeyv, A.K.Buribayeva. Formalization of morphological rules of inflection in the Kazakh language // Вестник. Астана: Евразийский национальный университет им. Л.Н.Гумилева, 2012. - Специальный выпуск. - С. 18-26.

7.   A.A.Sharipbaeyv, G.T.Bekmanova, B.Zh.Yergesh, A.S.Mukanova. Generation of Kazakh words // Вестник. Астана: Евразийский национальный университет им. Л.Н.Гумилева, 2012. – Специальный выпуск.– С. 27-35.

8.   B.Sh. Razakhova, A.А. Sharipbaev. Formalization of syntactic rules of the Kazakh language // Вестник. Астана: Евразийский национальный университет им. Л.Н.Гумилева, 2012. – Специальный выпуск.– С. 42-50.

9.   G.T.Bekmanova, V.U.Shelepov, A.A.Sharipbaeyv. Formalization of phonologic rules of the Kazakh language // Вестник. Астана: Евразийский национальный университет им. Л.Н.Гумилева, 2012. - Специальный выпуск. - С. 51-59.

10.   А.К. Бурибаева, Б.Ж. Ергеш., А.А. Шарипбаев, Г.Т. Бекманова, 
М.Х. Карабалаева. Аппаратная реализация синтеза словоформ казахского языка с помощью ассоциативной памяти // Вестник. Астана: Евразийский национальный университет им. Л.Н.Гумилева, 2012. – Специальный выпуск.– С.180-183.

11.  Б.Ш. Разахова, Ф.М. Туледиярова. Семантика желі көмегімен қазақ тілінің жай сөйлемдерін формалдау // Вестник. Астана: Евразийский национальный университет им. Л.Н.Гумилева, 2012. – Специальный выпуск.– С.403-409.

12.  В. Ю. Шелепов, А.В. Ниценко, Г.В. Дорохина, М.Х. Карабалаева, А.К.Бурибаева. О распознавании речи на основе межфонемных переходов  // Вестник. Астана: Евразийский национальный университет им. Л.Н.Гумилева, 2012. - Специальный выпуск. – С.416-4.

13.  А.К. Бурибаева, А.А. Шарипбаев. Речевые технологии для e-learning // Л.Н.Гумилев 100 жылдығына арналған Қоғамды ақпараттандыру ІІІ Халықаралық ғылыми-практикалық конференция еңбектері. - Астана, 2012. - Б. 516-519.

14.  Б.Ш. Разахова,  М. Мусайф, Г. Жабаева. Қазақ тіліндегі сөз тіркестерінің онтологиясы // Қоғамды ақпараттандыру: ІІІ халықаралық ғылыми-практикалық конференция еңбектері. –Астана, 2012. –Б. 577-580.

15.  Б.Ж. Ергеш, А.С. Муканова. Қазақ тіліндегі мәтіндерді ақпараттық іздеу жүйесіне қажетті сөздіктерді құру // Л.Н.Гумилев 100 жылдығына арналған Қоғамды ақпараттандыру ІІІ Халықаралық ғылыми-практикалық конференция еңбектері. – Астана, 2012. – Б. 524-526.

16.  А.С. Муканова, Г.Т. Бекманова. Қазақ тілі етістіктері сөзжасамдарының формалды моделі // Л.Н.Гумилев 100 жылдығына арналған Қоғамды ақпараттандыру ІІІ Халықаралық ғылыми-практикалық конференция еңбектері. – Астана, 2012. – Б.555-559.

17.  А.С. Муканова, Г. Қалман, Б.Ж. Ергеш. Қазақ тілінде сандық ақпараттарды түрлендіру конверторы // Л.Н.Гумилев 100 жылдығына арналған Қоғамды ақпараттандыру ІІІ Халықаралық ғылыми-практикалық конференция еңбектері. – Астана, 2012. – Б.559-561.

18.  А.С. Муканова, Г. Шынатай, Б.Ж. Ергеш. Қазақ тілінде жұрнақтар арқылы сын есім тудыруды автоматтандыру // Л.Н.Гумилев 100 жылдығына арналған Қоғамды ақпараттандыру ІІІ Халықаралық ғылыми-практикалық конференция еңбектері. – Астана, 2012. – Б.562-564.

19.  Г.Т. Бекманова, Махимов А.К. Графематический анализ казахского неструктурированного текста // III Международную научно-практическую конференцию «Информатизация общества», посвященную 100-летию Л.Н.Гумилева: труды конференции. – Астана, 2012. – С.509-510.

20.  Г.Т. Бекманова, Махимов А.К., Калиев А.К. Транслятор казахского неструктурированного текста в морфологическую скобочную запись // III Международную научно-практическую конференцию «Информатизация общества», посвященную 100-летию Л.Н.Гумилева: труды конференции. – Астана, 2012. – С.511-513.

  2. Цели и задачи проекта

Целью проекта является создание программных средств автоматизации распознавания  и порождения письменной и устной  речи казахского языка.

Основными задачами проекта являются:

(1) построение математических моделей фонетических, морфологических и синтаксических правил казахского языка;

(2) автоматизация анализа и синтеза письменной речи казахского языка:

-   разработка и реализация алгоритмов анализа  и синтеза письменных слов казахского языка;

-   разработка генератора словоформ и их  транскрипции с полной фонетической и семантической информацией;

-   разработка и реализация алгоритмов анализа письменных предложений казахского языка;

-   разработка и реализация алгоритмов синтеза письменных предложений казахского языка;

(3) автоматизация распознавания и синтеза устной речи казахского языка:

-   разработка и реализация алгоритмов синтеза отдельных устных слов казахского языка;

-   разработка и реализация алгоритмов синтеза слитной устной речи казахского языка;

-   разработка и реализация алгоритмов распознавания отдельных устных слов казахского языка;

-   разработка и реализация алгоритмов пофонемного распознавания слитной речи казахского языка.

1.   3. Грантозакрывающие результаты

Грантозакрывающими результатами являются:

(1) математические модели фонетических, морфологических и синтаксических правил казахского языка;

(2) программы автоматизации анализа и синтеза письменной речи казахского языка:

-   алгоритмы и программы анализа и синтеза письменных слов казахского языка;

-   программа генератора словоформ и их транскрипции с полной фонетической и семантической информацией;

-   алгоритмы и программы анализа письменных предложений казахского языка;

-   алгоритмы и программы синтеза письменных предложений казахского языка;

(3) программы автоматизации распознавания и синтеза устной речи казахского языка:

-   алгоритмы и программы синтеза отдельных устных слов казахского языка;

-   алгоритмы и программы синтеза слитной устной речи казахского языка;

-   алгоритмы и программы распознавания отдельных устных слов казахского языка;

-   алгоритмы и программы пофонемного распознавания слитной речи казахского языка.

1.   4. Выводы проекта

Исследования в проекте относятся к новому научному направлению. Действующих речевых технологий для казахского языка фактически не существует. В рамках выполнения этого проекта в предыдущих этапах (2012, 2013 гг.) разработаны математические модели фонетики и грамматики казахского языка, построены уникальные онтологические модели словоформ казахского языка. А также программно реализованы алгоритмы морфологического и синтаксического анализа и синтеза казахской письменности. Выполненные задачи были необходимы для разработки методов и алгоритмов анализа и синтеза казахской речи, которые программно реализованы на последнем этапе, что обосновывает научную и прикладную новизну проекта.

В результате исследования на последнем этапе (2014 г.) были получены алгоритмы и программы синтеза и распознавания отдельной и слитной речи казахского языка с использованием скрытых марковских моделей (СММ) и динамического программирования.

Полученные результаты в данной НИР являются уникальными для казахского языка.

Внедрение результатов на данном проекте не предусмотрено.