ZelaiHandi
El mayor corpus público en euskera de textos bajo licencia libre (521,5 M de palabras). Los textos han sido recopilados de un conjunto seleccionado de sitios web para asegurar su calidad y variedad temática. El corpus se ha creado con el propósito de facilitar el desarrollo e investigación de modelos de lenguaje neuronales con capacidades de comprensión y generación del euskera.