-
Créditos ECTS
Créditos ECTS: 5Horas ECTS Criterios/Memorias
Horas de Tutorías: 5
Clase Expositiva: 15
Clase Interactiva: 20
Total: 40Lenguas de uso
Alemán, InglésTipo:
Materia Ordinaria Máster RD 1393/2007 - 822/2021Departamentos:
Departamento externo vinculado a las titulacionesÁreas:
Área externa M.U Erasmus Mundus en Lexicografía (2ªed)Centro
Facultad de FilologíaConvocatoria:
Segundo semestreDocencia:
Con docenciaMatrícula:
Matriculable | 1ro curso (Si) -
El alumnado debería ser capaz de:
• Formular los requisitos del corpus para un proyecto lexicográfico y especificar el diseño de un corpus representativo;
• Compilar un corpus desde páginas web u otras fuentes;
• Anotar el corpus con información lingüística mediante herramientas automáticas de procesamento del lenguaje natural;
• Hacer búsquedas en el corpus con expresiones regulares y con consultas más complejas basadas en patrones léxico-gramaticales;
• Aplicar técnicas cuantitativas tales como el análisis de colocaciones y palabras-clave e interpretar los resultados apropiadamente;
• Comunicar los resultados de su trabajo a los/las compañeros/as;
• Llevar a cabo discusiones académicas sobre aspectos técnicos y metodológicos de la investigación basada en corpus;
• Documentar y archivar datos de corpus y analizar resultados.Fundamentos de lingüística de corpus
• Principios y métodos de análisis de corpus
• Aplicaciones de datos de corpus en lexicografía
• Tipos de corpus, visión general de los corpus existentes
• Diseño de corpus, representatividad, fuentes de datos, metadatos
Compilación de corpus
• Construcción de corpus a partir de datos online: scraping de la Web, etc.
• Limpieza de código de formato (boilerplate), normalización, extracción de metadatos
• Representación e intercambio de formatos
• Herramientas online y autónomas para la compilación de corpus de la Web
• Anotación automática lingüística (POLVOS, léemela, NER, parsing, ...)
• Herramientas online y autónomas para la anotación lingüística
Búsqueda en corpus
• Expresiones regulares
• Codificación de caracteres y estándar Unicode
• Consultas en lenguaje CQP para patrones léxico-gramatical
• Ejercicios prácticos con SketchEngine y CQPweb
Análisis cuantitativo
• Listas de frecuencia y distribución de metadatos
• Colocaciones y sketches de palabras
• Análisis de palabras-llave
• Interpretación lexicográfica de los resultados
• Fundamentos de la inferencia estadística
Reproducibilidad
• Metodología de investigación y documentación
• Gestión de datos, sostenibilidad de fuentes de corpusHSK 5.4, Ch. XVIII + XIX
Conocimientos o contenidos: Con05, Con06, Con07, Con10
Habilidades o destrezas: H/D01, H/D05, H/D07, H/D03
Competencias: Comp04, Comp03, Comp09Seminario en bloque (fecha y duración a determinar)
1. Primera oportunidad:
El/la profesor/a escoge uno de estos (recomendada la opción b):
la) Examen final de 90 minutos sobre los contenidos del seminario
b) Presentación de un proyecto y un pequeño artículo (apr. 10 páginas)
c) Artículo más largo (15-20 páginas)
2. Segunda oportunidad:
Se aplicarán los mismos criterios que en la primera convocatoria.
El alumnado con dispensa oficial será evaluado siguiendo los mismos criterios.
Para los casos de realización fraudulenta de ejercicios o probas será de aplicación lo recogido en la “Normativa de avaliación do rendemento académico dos estudantes e de revisión de cualificacións”.Horas presenciales: max. 35.
Requirements for participation: Students must obtain 25 ECTS in the first semester
Elective module in the second semester.
Language: German and/or EnglishRequisitos de participación: El alumnado debe obtener 25 ECTS en el primer semestre.
Módulo optativo del segundo semestre.
Lengua de enseñanza: alemán y/o inglés.
-