Научная
деятельность
Университет ИТМО

Меню

Яркеев Александр Сергеевич

Выпускник факультета программной инженерии и компьютерной техники

Научный руководитель: Клименков Сергей Викторович, ассистент

Выпускная квалификационная работа выполнена на тему: "Использование семантической сети для автодополнения и валидации информации".

Аннотация к работе:

Современные информационные системы — сложный комплексный продукт, зачастую обрабатывающий большие объёмы неструктурированных данных. Валидация этих данных — задача, которая на данный момент в большинстве случаев так и не решена. Существующие подходы по автоматической валидации таких данных несовершенны и обладают рядом существенных недостатков. Обычно они базируются на алгоритмическом парсинге вводимых значений, вследствие чего валидация осуществляется на основе «формы», а не «содержания».

В этой работе автором предлагается новый подход к валидации вводимых значений, использующий в качестве основы семантическую сеть. Семантическая сеть — это граф смыслов, связанных друг с другом семантическими отношениями.

Использование такой сети в теории позволяет добиться более эффективной валидации вводимых пользователем значений, но, к сожалению, «готовые решения» для этой задачи отсутствуют — не существует русскоязычных семантических сетей подходящего масштаба. Поэтому на первом этапе автором была разработана собственная семантическая сеть.

Так как семантическая сеть хранит только обобщённые понятия («кот»), то для хранения конкретных значений этих понятий (экземпляров — «кот Барсик») автором была разработана модель, позволяющая сохранять эти экземпляры в привязке к исходному понятию.

В работе представлен алгоритм поиска и автодополнения экземпляров понятия содержащихся в семантической сети. Это позволило создать инструмент для обеспечения валидации, независящий от предметной области, базирующийся на топологии и структуре семантической сети.

В рамках работы был реализован рограммный модуль, реализующий функции автодополнения адресной информации и проведена интеграция с сетью и заполнение сети данными соотвествующей предметной области.

 

Вернуться к списку победителей