Дизамбигуация

Интернеты

Термином дизамбигуация называется один из инструментов, который входит в состав поисковых алгоритмов. Он создан с целью толкования неоднозначных слов, что задаёт пользователь во время поиска нужной ему информации. Применяя во время поиска дизамбигуацию, поисковая система получает возможность повышать релевантность своих результатов.

В русскоязычном сегменте инструмент снимает со слов все омонимы и проводит дополнительный анализ заданных словоформ. Таким образом, поисковые системы, используя дизамбигуацию, ориентируются в контексте заданной им фразы.

Пример для объяснения:

В поисковой строке пользователь может набрать фразу «новый кран». Поисковая система незамедлительно пропускает запрос через часть алгоритма, которая упрощает заданную фразу, учитывая её контекст и применяя это во время поиска. Таким образом, система отсекает информацию, которая, возможно, не соответствует контексту фразы целиком. На приведённом примере система откинет все запросы по поводу нового строительного крана, разделяя технику, применяемую во время строительства новых сооружений и обычную сантехнику.

Благодаря устранению неоднозначности словоформ, поисковый алгоритм уменьшает нагрузку на сервер системы, предоставляя пользователю ту информацию, которую он, скорее всего, хотел изначально увидеть. Сложности для алгоритма возникают только в тот момент, когда пользователь вводит только одно слово, которое может иметь много значений. В случае, когда контекст отсутствует, эффективность дизамбигуации снижается сразу в несколько раз. При таком запросе система начинает использовать совершенно другие механизмы, которые уже ориентируется на частоту выдачи данных для других пользователей с подобным обращением к поисковой системе.

Как пример можно привести поисковую систему Google. В некоторых случаях при запросе о «вилках» она, в качестве результата, выдаёт не кухонные приспособления, а букмекерские конторы, в которых применяют понятие о «букмекерских вилках».

Интернет уже занимает большую нишу в жизни многих людей, именно поэтому для более эффективной работы механизмов дизамбигуации к её развитию привлекают лучших специалистов в области математического моделирования и языкознания.

Все научно-исследовательские работы, которые были проведены ради разметки отдельных словоформ, ради особых омонимических кластеров, нацелены на «обучение» поисковых систем. Это обучение помогает поисковым системам ориентироваться в контексте каждой словоформы, которую они ранее не встречали. Поэтому все специалисты для улучшения работы алгоритма применяют всевозможные способы математической обработки и лексического анализа.

Поэтому не удивительно, что для улучшения поисковых возможностей применяют технологии, которые были использованы при создании семантических сетей на английском языке, таких как FrameNet и WordNet.

Оцените статью