Créditos ECTS Créditos ECTS: 5
Horas ECTS Criterios/Memorias Traballo do Alumno/a ECTS: 85 Horas de Titorías: 5 Clase Expositiva: 20 Clase Interactiva: 15 Total: 125
Linguas de uso Castelán, Galego
Tipo: Materia Ordinaria Máster RD 1393/2007 - 822/2021
Departamentos: Estatística, Análise Matemática e Optimización
Áreas: Estatística e Investigación Operativa
Centro Facultade de Matemáticas
Convocatoria: Segundo semestre
Docencia: Con docencia
Matrícula: Matriculable | 1ro curso (Si)
O obxectivo desta materia é que o alumnado se familiarice coas técnicas de regresión non paramétrica e semiparamétrica, con especial énfase na súa aplicación práctica. Estes obxectivos concretaranse nos seguintes resultados da aprendizaxe:
- Coñecer as priciipais técnicas non paramétricas e semiparamétricas de estimación da función de regresión.
- Saber escoller o modelo de regresión non paramétrico ou semiparamétrico axeitado para analizar a dependenza existente en datos complexos procedentes de situacións reais.
- Coñecer as limitacións das técnicas non paramétricas na análise de situacións reais cun alto número de variables.
- Acadar autonomía na análise de datos en contornas aplicadas multidisciplinares utilizando técnicas non paramétricas e semiparamétricas.
Tema 1. Introdución á estimación tipo núcleo
Estimación tipo núcleo da función de densidade. Selección do parámetro de suavizado. Modificacións do estimador tipo núcleo da densidade. Estimación da sparsity. Estimación da función de distribución. Estimación das derivadas da función de densidade. Análise exploratoria basada no estimador núcleo.
Tema 2. Regresión tipo núcleo.
O regresograma. O estimador de Nadaraya-Watson. O estimador polinómico local. Selección do parámetro de suavizado: plug-in e validación cruzada. Estimación das derivadas da función de regresión. Estimación non paramétrica da regresión multivariante. Verosimilitude local: regresión loxística non paramétrica.
Tema 3. Estimación da regresión por veciños máis próximos.
O estimador clásico polos k veciños máis próximos. Variantes do estimador por veciños máis próximos. O estimador Loess. Comparación coa suavización ordinaria.
Tema 4. Estimación da regresión mediante splines.
Mínimos cadrados penalizados. Spline de interpolación: spline cúbico natural e spline de suavización. Spline de regresión: base de splines e regresión spline penalizada. Xeneralización multivariante thin-plate spline e tensor product spline.
Tema 5. Modelos parcialmente lineares e modelos aditivos.
Presentación dos modelos parcialmente lineares e dos modelos aditivos. O problema de identificación e algoritmos de estimación.
Tema 6. Modelos aditivos xeneralizados.
Presentación dos modelos aditivos xeneralizados. Modelo loxístico aditivo e log-aditivo. Extensión dos algoritmos de estimación para os modelos aditivos xeneralizados. Modelo aditivo xeneralizado penalizado.
Tema 7. Modelos single-index.
Presentación do modelo single-index. O problema de identificación. Extensión dos modelos single-index.
BIBLIOGRAFÍA BÁSICA
[1] Bowman, A.W. e Azzalini, A. (1997). Applied smoothing techniques for data analysis. Oxford University Press.
[2] Härdle, W. (1990). Applied nonparametric regression. Econometric society monographs, Cambridge University Press.
[3] Härdle, W., Müller, M., Sperlich, S. y Werwatz, A. (2004). Nonparametric and Semiparametric Models. Springer.
[4] Wand, M.P. e Jones, M.C. (1995). Kernel Smoothing. Chapman Hall.
[5] Wasserman, L. (2005). All of Nonparametric Statistics. Springer.
[6] Wood, S.N. (2006). Generalized Additive Models. An Introduction with R. Chapman and Hall.
BIBLIOGRAFÍA COMPLEMENTARIA
[1] Fan, J. e Gijbels, I. (1996). Local Polynomial Modelling and Its Applications. Chapman and Hall.
[2] Green, P.J. e Silverman, B.W. (1994). Nonparametric regression and generalized linear models: A roughness penalty approach. Chapman and Hall.
[3] Hastie, T. e Tibshirani, R. (1990). Generalized Additive Models. Chapman and Hall.
[4] Scott, D.W. (1992). Multivariate Density Estimation: Theory, Practice, and Visualization. John Wiley and Sons.
[5] Silverman, B.W. (1986). Density Estimation for Statistics and Data Analysis. Chapman and Hall.
[6] Simonoff, J.S. (1996). Smoothing Methods in Statistics. Springer.
[7] Wahba, G. (1990). Spline Models for Observation Data. Society for Industrial and Applied Mathematics.
Nesta materia traballaranse as competencias básicas, xerais e transversais recollidas na memoria do título. Indícanse a continuación cales son as competencias específicas que se potenciarán nesta materia:
E1 - Coñecer, identificar, modelar, estudiar e resolver problemas complexos de estatística e investigación operativa, nun contexto científico, tecnolóxico ou profesional, xurdidos en aplicacións reais.
E2 - Desenvolver autonomía para a resolución práctica de problemas complexos xurdidos en aplicacións reais e para a interpretación dos resutlados de cara á axuda na toma de decisións.
E3 - Adquirir coñecementos avanzados dos fundamentos teóricos subxacentes ás distintas metodoloxías da estatística e a investigación operativa, que permitan o seu desenvolvemento profesional especializado.
E4 - Adquirir as destrezas necesarias no manexo teórico-práctico da teoría da probabilidade e as variables aleatorias que permitan o seu desenvolvemento profesional no ámbito científico/académico, tecnolóxico ou profesional especializado e multidisciplinar.
E5 - Afondar nos coñecementos nos fundamentos teórico-prácticos especializados do modelado e estudo de distintos tipos de relacións de dependencia entre variables estatísticas.
E6 - Adquirir coñecementos teórico-prácticos avanzados de distintas técnicas matemáticas, orientadas especificamente á axuda na toma de decisións e desenvolver capacidade de reflexión para avaliar e decidir entre distintas perspectivas en contextos complexos.
E8 - Adquirir coñecementos teórico-prácticos avanzados das técnicas destinadas á realización de inferencias e contrastes relativos a variables e parámetros dun modelo estatístico, e saber aplcialos con autonomía suficiente nun contexto científico, tecnolóxico e profesional.
E9 - Coñecer e saber aplicar con autnomía en contextos científicos, tencolóxicos ou profesionais, técnicas de aprendizaxe automática e técnicas de análise de datos de alta dimensión (big data).
E10 - Adquirir coñecementos avanzados sobre metodoloxías para a obtención e o tratamento de datos de distintas fontes, como enquisas, internet ou contornas "na nube".
A ensinanza constará de clases expositivas e interactivas, así como da titorización da aprendizaxe e das tarefas encomendadas ao alumnado. Proporcionarase material para o seguimento do curso, así como outro material orientativo da aprendizaxe do software. Nas clases expositivas e interactivas resolveranse exemplso mediante o software R, polo que é necesario que o alumno dispoña na aula dun ordenador.
A actividade presencial, xunto co correspondente e necesario traballo persoal do alumnado para a sú apreparación, valórase con tres créditos ECTS. Esta carga de traballo inclúe o exame final. Considérase que é suficiente unha hora e media de traballo persoal para a preparación de cada sesión presencial de tipo teórico-práctico. Os outros dous créditos ECTS da materia corresponden a traballos prácticos que o alumnado terá que elaborar ao longo do curso.
A continuación preséntase unha aproximación das horas que se dedicarán a cada tema.
TEMA 1. INTRODUCIÓN (3h expositiva, 4h de laboratorio)
TEMA 2. REG NÚCLEO (4h expositivas, 5h de laboratorio)
TEMA 3. KNN (1h expositivas, 1h de laboratorio)
TEMA 4. SPLINES (3h expositivas, 4h de laboratorio)
TEMA 5. PLM E ADITIVOS (2h expositivas, 3h de laboratorio)
TEMA 6. GAM (1h expositiva, 2h de laboratorio)
TEMA 7. SINGLE-INDEX (1h expositivas, 1h de laboratorio)
Avaliación continua (60%): a avaliación continua consistirá na preparación dun documento técnico sobre algunha temática relacionada coa materia. O alumnado revisará literatura estatística e, en función da temática, realizará análises de datos reais e/ou estudos de simulación. Os traballos serán presentados oralmente. Ademais, incluirase no proceso unha avaliación por pares, tanto do documento técnico como da presentación. Se o traballo se realiza en grupo, o profesorado considerará estratexias de avaliación que permitan discernir a nota de cada compoñente do equipo. Para o cálculo da cualificación terase en conta o documento técnico, a presentación e a avaliación dos pares. A cualificación conservarase entre as oportunidades (ordinaria e extraordinaria) dentro da convocatoria de cada curso. Coas distintas actividades que se proporán ao longo do curso, valorarase o nivel de adquisición das competencias básicas e xerais, CB6-CB10 e CG1-CG5. Tamén se avaliará no nivel acadado nas competencias transversais CT1-CT5 e nas competencias específicas E2, E6, E9 e E10.
Proba final (40%): a proba final constará de varias cuestóns teórico-prácticas sobre os contidos da materia, dentro das que se poderá incluír a interpretación de resultados obtidos coa linguaxe estatística utilizada na docencia interactiva (R). No exame avaliarase a adquisición das competencias específicas E1, E3, E4, E5 e E8.
Presentación á avaliación: considérase que un/ha alumno/a concorre a unha convocatoria cando participa nalgunha actividade de avaliación, ben sexa de avaliación continua ou de asistencia ao exame. O peso da avaliación continua na oportunidade extraordinaria de recuperación (probas de xullo) será o mesmo que na avaliación ordinaria. Na segunda oportunidade de avaliación (recuperación), realizarase un exame e a nota final será o máximo de tres cantidades: a nota da avaliación ordinaria, a nota do novo exame e a media ponderada do novo exame e a avaliación continua.
Debe notarse que para os casos de realización fraudulenta de exercicios ou probas, será de aplicación o recollido na "Normativa de avalación do rendemento académico dos estudantes e de revisión de cualificacións".
Cada crédito ECTS tradúcese en 7 horas de clase de tipo presencial. Estímase que o alumnado precisará dunha hora para preparar o material correspondente a cada hora presencial, previa á propia clase. Posteriormente, precisará de hora e media para a comprensión global dos contidos, incluíndo as actividades asociadas a exercicios e outras tarefas. En total, resultarán 24.5 horas por crédito ECTS.
Para superar con éxito a materia é aconsellable a asistencia ás clases, sendo fundamental o seguimento diaria do traballo realizado na aula. Tamén é recomendable que o alumnado sexa capaz de utilziar o software estatístico R para explroar as posibilidades das diversas técnicas non paramétricas e semiparamétricas explicadas ao longo do curso. Ademais, para un mellor aprendiaxe da materia, é conveniente ter presente a orientación práctica dos métodos introducidos ao longo do curso.
En caso de que a docencia se desenvolva de maneira presencial, o profesorado informará na clase de cales son os obxectivos da aprendizaxe a acadar e os contidos a traballar durante a semana que corresonda. No caso de que a docencia se desenvolva parcial ou totalmente de maneira non presencia, elaborarase o "plan de traballo semanal" que se facilitará ao alumnado o acomezo de cada semana. Neste plan daranse unha serie de aputas para axudar ao alumnado na súa aprendizaxe autónoma e onde se especificarán os contidos a traballar e as actividades recomendadas.
O desenvolvemento dos contidos da materia realizarase tendo en conta que as competencias a adquirir polo alumnado deben cumplir co nivel MECES3. Os contidos que se inclúen nesta materia son novidosos e altamente especializados. Traballarase sobre a correcta formulación de modelos, a construción de estimadores e a validación e análise das distintas propostas estudadas.
Para os casos de realización fraudulenta de exercicios ou probas, será de aplicación o recollido nas respectivas normativas das universidades participantes no Máster en Técnicas Estadísticas.
Esta guía e os criterios e metodoloxías nela descritos están suxeitos ás modificacións que se deriven de normativas e directrices das universidades participantes no Máster en Técnicas Estadísticas.
Rosa María Crujeiras Casais
- Departamento
- Estatística, Análise Matemática e Optimización
- Área
- Estatística e Investigación Operativa
- Teléfono
- 881813212
- Correo electrónico
- rosa.crujeiras [at] usc.es
- Categoría
- Profesor/a: Catedrático/a de Universidade
Jose Ameijeiras Alonso
Coordinador/a- Departamento
- Estatística, Análise Matemática e Optimización
- Área
- Estatística e Investigación Operativa
- Correo electrónico
- jose.ameijeiras [at] usc.es
- Categoría
- Profesor/a: Profesor Axudante Doutor LOU
22.05.2025 10:00-14:00 | Grupo /CLE_01 | Aula 04 |
07.07.2025 16:00-20:00 | Grupo /CLE_01 | Aula 04 |