corpus

6 de novembre de 2019

Corpus textuals del castellà

Els corpus són conjunts extensos de textos de tipologia diversa, convenientment tractats, que poden ser consultats per obtenir informació lingüística.  La Reial Acadèmia de la Llengua Espanyola ofereix tres corpus que corresponen a textos de tres períodes diferents i de procedència geogràfica diversa: CORPES XXI, CREA i CORDE. CORPES XXI El Corpus del español del siglo XXI (CORPES XXI) conté més de 225 milions de paraules i 237.678 textos (escrits i orals), procedents de documents del 2001 ençà, a la darrera versió del 2016. […]
cica
22 d'abril de 2015

Corpus informatitzat del català antic

El Corpus informatitzat del català antic (CICA) és un recurs força desconegut fora de l’àmbit acadèmic especialitzat, però molt útil per a la lingüística històrica. El projecte està dirigit per Joan Torruella (ICREA-UAB), Manuel Pérez Saldanya (UV-IEC) i Josep Martines (UA-IEC). Es tracta d’un corpus de textos escrits en llengua catalana que conté obres des del segle XI fins al segle XVIII. […]