Описание и постановка задачи
Участникам предлагается два трека:
- CoBaLD Parse: задача разработки парсера лингвистической разметки для английского и русского языков в формате Enhanced CoBaLD, включающем морфологический, синтаксический и семантический уровни.
Формат базируется на Enhanced Universal Dependencies, предполагает восстановление эллипсиса для ряда вершин. Семантическая разметка основана на упрощенной версии семантики Compreno и включает разметку значений слов и отношений между словами. Для обучения предлагаются два датасета — русский и английский. - CoBaLD CLT: задача создания парсера лингвистической разметки формата CoBaLD для венгерского или сербского языка с помощью языкового переноса (Cross Lingual Transfer).
В данной задаче морфосинтаксическая разметка основана на базовой версии Universal Dependencies (UD) и не предполагает восстановления эллиптированных вершин. Семантическая часть, как и в первой задаче, представляет собой упрощенный вариант семантической разметки Compreno. Предлагаются два небольших датасета для сербского и венгерского, содержащих разметку, выверенную вручную.
График проведения
01.06.2024 — финальная публикация датасетов для трека CoBaLD Parse
16.06.2024 — публикация датасетов для трека CoBaLD CLT
31.01.2025 — окончание соревнования, подведение итогов
01.02.2025 — дедлайн подачи статей