При написании научных работ, что является научным фундаментом в образовании, возникают ошибки, связанные с выбором подходящего термина или определения. В этом исследовании обсуждается решение данной проблемы с помощью word embedding – форма представления слова, где слово имеет вектор и координаты. Данный метод может быть использован при преподавании дисциплины написания научных статей. Слова с близким значением имеют сходное направление, показывая лексическую совместимость. Для расчета лексических отношений учитывается косинус угла между векторами двух слов. Значение высокосовместимых словосочетаний равно 1. При этом лексически несовместимые слова должны приблизительно иметь значение -1. Для проверки системы использовался текст Конституции Республики Казахстан. В частности, были вставлены слова, которые не имеют отношения к смыслу статьи Конституции, и система должна была идентифицировать данные слова. Для некоторых слов система показала высокую точность, с другими – низкую. Такой фактор объясняется тем, что даже если вставленные слова не имеют значения по смыслу, они могут быть лексически совместимыми с соседними словами.
Данное исследование проводится в рамках грантового проекта Министерства образования и науки Республики Казахстан «Разработка и внедрение инновационной компетентностной модели полиязычного IT- специалиста в условиях модернизации отечественного образования».