Los puntos clave no están disponibles para este artículo en este momento.
Las últimas décadas han presenciado el rápido desarrollo de estudios literarios sobre género y estilo de escritura. Una de las limitaciones comunes de estudios anteriores es que analizan solo unos pocos textos, como ya han señalado algunos investigadores. En este estudio, intentamos encontrar las características que mejor facilitan la clasificación de textos por género autoral. Basado en un corpus de 1113 ficciones clásicas desde principios del siglo XIX hasta principios del siglo XX. Ocho algoritmos, que incluyen SVM, bosque aleatorio, árbol de decisión, AdaBoost, regresión logística, K-vecinos más cercanos, aumento de gradiente y XGBoost, se utilizan para seleccionar automáticamente las características que son más útiles para categorizar correctamente un texto. Encontramos que la frecuencia de palabras es el predictor más importante para identificar el género autoral en ficciones clásicas, alcanzando una tasa de precisión del 92%. También encontramos que la nacionalidad no tiene un impacto particular al tratar con diferencias de género autoral en ficciones clásicas, ya que la variación de génerolecto es 'universal' en el mundo de habla inglesa.
Zhu et al. (Sáb,) estudiaron esta cuestión.