Dialogue Evaluation 2024

CoBaLD Parsing

Competitions

Соревнование по автоматической лингвистической разметке

Ссылки

Описание и постановка задачи

Участникам предлагается два трека:

  • CoBaLD Parse: задача разработки парсера лингвистической разметки для английского и русского языков в формате Enhanced CoBaLD, включающем морфологический, синтаксический и семантический уровни.
    Формат базируется на Enhanced Universal Dependencies, предполагает восстановление эллипсиса для ряда вершин. Семантическая разметка основана на упрощенной версии семантики Compreno и включает разметку значений слов и отношений между словами. Для обучения предлагаются два датасета — русский и английский.
  • CoBaLD CLT: задача создания парсера лингвистической разметки формата CoBaLD для венгерского или сербского языка с помощью языкового переноса (Cross Lingual Transfer).
    В данной задаче морфосинтаксическая разметка основана на базовой версии Universal Dependencies (UD) и не предполагает восстановления эллиптированных вершин. Семантическая часть, как и в первой задаче, представляет собой упрощенный вариант семантической разметки Compreno. Предлагаются два небольших датасета для сербского и венгерского, содержащих разметку, выверенную вручную.

График проведения

01.06.2024 — финальная публикация датасетов для трека CoBaLD Parse

16.06.2024 — публикация датасетов для трека CoBaLD CLT

31.01.2025 — окончание соревнования, подведение итогов

01.02.2025 — дедлайн подачи статей

Competitions