-
Créditos ECTS
Créditos ECTS: 5Horas ECTS Criterios/Memorias
Horas de Titorías: 5
Clase Expositiva: 15
Clase Interactiva: 20
Total: 40Linguas de uso
Alemán, InglésTipo:
Materia Ordinaria Máster RD 1393/2007 - 822/2021Departamentos:
Departamento externo vinculado ás titulaciónsÁreas:
Área externa M.U Erasmus Mundus en Lexicografía (2ªed)Centro
Facultade de FiloloxíaConvocatoria:
Segundo semestreDocencia:
Con docenciaMatrícula:
Matriculable | 1ro curso (Si) -
O estudantado debería ser capaz de:
• Formular os seus requisitos de corpus para un proxecto lexicográfico e especificar o deseño dun corpus representativo;
• Compilar un corpus desde páxinas web ou outras fontes
• anotar o corpus con información lingüística mediante ferramentas automáticas de procesamento da linguaxe natural;
• Facer buscas no corpus con expresións regulares e con consultas más complexas baseadas en patróns lexico-gramaticais;
• Aplicar técnicas cuantitativas tales como análise de colocacións e palabras-chave e interpretar os resultados apropiadamente;
• Comunicar os resultados do seu traballo aos/ás compañeiros/as estudantes
• Levar a cabo discusións académicas sobre aspectos técnicos e metodolóxicos da investigación baseada en corpus; e
• Documentar e arquivar datos de corpus e analizar resultadosFundacións de lingüística de corpus
• Principios e métodos de análise de corpus
• Aplicacións de datos de corpus en lexicografía
• Tipos de corpus, visión xeral dos corpus existentes
• Deseño de corpus, representatividade, fontes de datos, metadatos
Compilación de corpus
• Construción de corpus a partir de datos online: scraping da Web, etc.
• Limpeza de código de formato (boilerplate), normalización, extracción de metadatos
• Representación e intercambio de formatos
• Ferramentas online e autónomas para a compilación de corpus da Web
• Anotación automática lingüística (PoS, lema, NER, parsing, ...)
• Ferramentas online e autónomas para a anotación lingüística
Busca no corpus
• Expresións regulares
• Codificación de caracteres e estándar Unicode
• Consultas en linguaxe CQP para patróns léxico-gramatical
• Exercicios prácticos con SketchEngine e CQPweb
Análise cuantitativa
• Listas de frecuencia e distribución de metadatos
• Colocacións e sketches de palabras
• Análise de palabras-chave
• Interpretación lexicográfica dos resultados
• Fundacións da inferencia estatística
Reproducibilidade
• Metodoloxía de investigación e documentación
• Xestión de datos, sustentabilidade de fontes de corpusHSK 5.4, Ch. XVIII + XIX
Coñecementos ou contidos: Con05, Con06, Con07, Con10
Habilidades ou destrezas: H/D01, H/D05, H/D07, H/D03
Competencias: Comp04, Comp03, Comp09Seminario en bloque (data e duración a determinar)
1. Primeira oportunidade:
O/A profesor/a escolle un destes (recomendada a opción b):
a) Exame final de 90 minutos sobre os contidos do seminario
b) Presentación dun proxecto e mais un pequeno artigo (apr. 10 páxinas)
c) Artigo máis longo (15-20 páxinas)
2. Segunda oportunidade:
Aplicaranse os mesmos criterios que na primeira convocatoria.
O alumnado con dispensa oficial será avaliado seguindo os mesmos criterios.
Para os casos de realización fraudulenta de exercicios ou probas será de aplicación o recollido na “Normativa de avaliación do rendemento académico dos estudantes e de revisión de cualificacións”Horas presenciais: max. 35.
Requirements for participation: Students must obtain 25 ECTS in the first semester
Elective module in the second semester.
Language: German and/or EnglishRequisitos de participación: O estudantado debe obter 25 ECTS no primeiro semestre.
Módulo optativo do segundo semestre.
Lingua de ensino: alemán e/ou inglés.
-