Key points are not available for this paper at this time.
Apresentamos diretrizes de anotação e uma estrutura de anotação baseada na web desenvolvida como parte de um esforço para criar um corpus árabe de erros e correções anotados manualmente para vários tipos de texto. Tal corpus será inestimável para o desenvolvimento de ferramentas de correção de erros em árabe, tanto para treinar modelos quanto como um padrão de referência para avaliar algoritmos de correção de erros. Resumimos as diretrizes que criamos. Também descrevemos os problemas encontrados durante o treinamento dos anotadores, bem como problemas que são específicos da língua árabe que surgiram durante o processo de anotação. Finalmente, apresentamos a ferramenta de anotação que foi desenvolvida como parte deste projeto, o pipeline de anotação e a qualidade das anotações resultantes.
Zaghouani et al. (Qui,) estudaram esta questão.