Contextos de Educación

Construcción de un corpus de artículos de semi-divulgación: aspectos teóricos y metodológicos
Building a corpus of semi-popularization articles: theoretical and methodological aspects

Verónica Muñoz

La lingüística de corpus es una metodología de investigación que ha ganado protagonismo en el área de la enseñanza de lenguas extranjeras. Este marco metodológico permite el estudio empírico de grandes bases de datos lingüísticos fundados en el uso real de la lengua, y la cuantificación del uso de la lengua utilizando métodos estadísticos. En este trabajo se introducen aspectos básicos de la lingüística de corpus como metodología de investigación, se describen lineamientos para la construcción de un corpus y se presentan los pasos seguidos para la compilación de un corpus especializado (Corpus of English Popularization Articles in Agriculture - CEPAA). El corpus fue construido para responder a las necesidades de un curso de lectura en inglés destinado a alumnos de Ingeniería Agronómica de la UNRC. La construcción del CEPAA se sustentó en los criterios de diseño y compilación especificados por la lingüística de corpus. Dichos criterios son representatividad, balance, diversidad de fuentes de publicación, disponibilidad de textos en formato electrónico, período, tamaño, uso de textos completos, variedad de escritores, y dialecto. El CEPAA es representativo de un género (artículos de semi-divulgación), un registro (científico), una disciplina (ciencias agrarias), un tema específico (producción de granos), y un idioma (inglés). Los artículos fueron recolectados de las ediciones correspondientes a los períodos 2008 y 2009 de doce revistas de divulgación publicadas online por once universidades de los Estados Unidos. Se recolectaron 700 artículos de diferentes extensiones, sumando un total de 455.366 palabras. El corpus representa una totalidad de 292 escritores.

Palabras clave: lingüística de corpus - construcción de corpus - enseñanza de inglés con fines específicos

Descargar artículo en PDF

Abstract

Corpus linguistics has gained impetus as a research methodology in the area of foreign language teaching. This approach involves the empirical study of large linguistic databases based on real language, as well as the quantification of language use using statistical procedures. The purpose of this paper is to introduce basic aspects underlying corpus linguistics as an approach to language research, to describe the criteria used for corpus construction, and to describe the procedures followed to build a specialized corpus (Corpus of English Popularization Articles in Agriculture - CEPAA). This corpus was built in the context of an English reading course addressed to agriculture students at UNRC. The compilation of the CEPAA was based on the design criteria specified by corpus linguistics. The criteria are representativeness, balance, diversity of publication sources, availability of texts in electronic form, period, size, use of complete texts, variety of writers, and dialect. The CEPAA is representative of a genre (semi-popularization articles), a register (science), a discipline (agriculture), a specific domain (corn production), and a language (English). The articles were collected from the 2008-2009 issues of twelve popularization magazines published online by eleven American universities. A total number of 700 full texts of different lengths were assembled from the twelve publications, totaling 455,366 words. The corpus represents 292 writers.

Key words: corpus linguistics - corpus construction - English for Specific Purposes teaching.

Download full text (PDF)