Análisis robusto de la tendencia central, regresión simple, múltiple y ANOVA: Un tutorial paso a paso.
.
A menudo, métodos clásicos como la media, la regresión simple y múltiple, y el análisis de varianza (ANOVA), requieren que los datos se distribuyan normalmente y estén exentos de valores extremos, lo que en práctica es inusual. Los investigadores típicamente usan métodos como la detección y eliminación de valores extremos como una medida para que los datos se ajusten a los requerimientos de los métodos clásicos. En este artículo se muestran las desventajas tal práctica. En particular, se muestra que los valores extremos algunas veces pueden ser difíciles de detectar afectando así la interpretación de los resultados. Se propone entonces un método más apropiado y moderno que se basta en procedimientos robustos en donde los valores extremos no... Ver más
2011-2084
2011-7922
3
2010-06-30
78
87
International Journal of Psychological Research - 2010
info:eu-repo/semantics/openAccess
http://purl.org/coar/access_right/c_abf2
id |
metarevistapublica_unisanbuenaventura_internationaljournalofpsychologicalresearch_21_article_849 |
---|---|
record_format |
ojs |
spelling |
Análisis robusto de la tendencia central, regresión simple, múltiple y ANOVA: Un tutorial paso a paso. Análisis robusto de la tendencia central, regresión simple, múltiple y ANOVA: Un tutorial paso a paso. A menudo, métodos clásicos como la media, la regresión simple y múltiple, y el análisis de varianza (ANOVA), requieren que los datos se distribuyan normalmente y estén exentos de valores extremos, lo que en práctica es inusual. Los investigadores típicamente usan métodos como la detección y eliminación de valores extremos como una medida para que los datos se ajusten a los requerimientos de los métodos clásicos. En este artículo se muestran las desventajas tal práctica. En particular, se muestra que los valores extremos algunas veces pueden ser difíciles de detectar afectando así la interpretación de los resultados. Se propone entonces un método más apropiado y moderno que se basta en procedimientos robustos en donde los valores extremos no afectan los datos permitiendo una interpretación más adecuada de los mismos. Se presenta un tutorial paso a paso de un análisis descriptivo que le permita a los investigadores hacer una revisión inicial del método más apropiado para analizar los datos. Luego, se compara el ANOVA y la regresión tradicional con su versión robusta para discutir sus ventajas y desventajas. Finalmente, se presentan diagramas de los residuales de los análisis y que pueden usarse para determinar si las condiciones de aplicación de los análisis son apropiadas. Se usan ejemplos tomados de la investigación en psicología para ilustrar los argumentos acá expuestos, y se presenta un código en lenguaje R para que el lector use las técnicas acá presentadas. After much exertion and care to run an experiment in social science, the analysis of data should not be ruined by an improper analysis. Often, classical methods, like the mean, the usual simple and multiple linear regressions, and the ANOVA require normality and absence of outliers, which rarely occurs in data coming from experiments. To palliate to this problem, researchers often use some ad-hoc methods like the detection and deletion of outliers. In this tutorial, we will show the shortcomings of such an approach. In particular, we will show that outliers can sometimes be very difficult to detect and that the full inferential procedure is somewhat distorted by such a procedure. A more appropriate and modern approach is to use a robust procedure that provides estimation, inference and testing that are not influenced by outlying observations but describes correctly the structure for the bulk of the data. It can also give diagnostic of the distance of any point or subject relative to the central tendency. Robust procedures can also be viewed as methods to check the appropriateness of the classical methods. To provide a step-by-step tutorial, we present descriptive analyses that allow researchers to make an initial check on the conditions of application of the data. Next, we compare classical and robust alternatives to ANOVA and regression and discuss their advantages and disadvantages. Finally, we present indices and plots that are based on the residuals of the analysis and can be used to determine if the conditions of applications of the analyses are respected. Examples on data from psychological research illustrate each of these points and for each analysis and plot, R code is provided to allow the readers to apply the techniques presented throughout the article. S. Courvoisier, Delphine Renaud, Olivier robust methods ANOVA regression diagnostic outliers métodos robustos ANOVA regresión diagnostico valores extremos 3 1 Núm. 1 , Año 2010 : Special Issue of Statistics in Psychology Artículo de revista Journal article 2010-06-30T00:00:00Z 2010-06-30T00:00:00Z 2010-06-30 application/pdf Universidad San Buenaventura - USB (Colombia) International Journal of Psychological Research 2011-2084 2011-7922 https://revistas.usb.edu.co/index.php/IJPR/article/view/849 10.21500/20112084.849 https://doi.org/10.21500/20112084.849 eng https://creativecommons.org/licenses/by-nc-sa/4.0/ International Journal of Psychological Research - 2010 78 87 https://revistas.usb.edu.co/index.php/IJPR/article/download/849/604 info:eu-repo/semantics/article http://purl.org/coar/resource_type/c_6501 info:eu-repo/semantics/publishedVersion http://purl.org/coar/version/c_970fb48d4fbd8a85 info:eu-repo/semantics/openAccess http://purl.org/coar/access_right/c_abf2 Text Publication |
institution |
UNIVERSIDAD DE SAN BUENAVENTURA |
thumbnail |
https://nuevo.metarevistas.org/UNIVERSIDADDESANBUENAVENTURA_COLOMBIA/logo.png |
country_str |
Colombia |
collection |
International Journal of Psychological Research |
title |
Análisis robusto de la tendencia central, regresión simple, múltiple y ANOVA: Un tutorial paso a paso. |
spellingShingle |
Análisis robusto de la tendencia central, regresión simple, múltiple y ANOVA: Un tutorial paso a paso. S. Courvoisier, Delphine Renaud, Olivier robust methods ANOVA regression diagnostic outliers métodos robustos ANOVA regresión diagnostico valores extremos |
title_short |
Análisis robusto de la tendencia central, regresión simple, múltiple y ANOVA: Un tutorial paso a paso. |
title_full |
Análisis robusto de la tendencia central, regresión simple, múltiple y ANOVA: Un tutorial paso a paso. |
title_fullStr |
Análisis robusto de la tendencia central, regresión simple, múltiple y ANOVA: Un tutorial paso a paso. |
title_full_unstemmed |
Análisis robusto de la tendencia central, regresión simple, múltiple y ANOVA: Un tutorial paso a paso. |
title_sort |
análisis robusto de la tendencia central, regresión simple, múltiple y anova: un tutorial paso a paso. |
description |
A menudo, métodos clásicos como la media, la regresión simple y múltiple, y el análisis de varianza (ANOVA), requieren que los datos se distribuyan normalmente y estén exentos de valores extremos, lo que en práctica es inusual. Los investigadores típicamente usan métodos como la detección y eliminación de valores extremos como una medida para que los datos se ajusten a los requerimientos de los métodos clásicos. En este artículo se muestran las desventajas tal práctica. En particular, se muestra que los valores extremos algunas veces pueden ser difíciles de detectar afectando así la interpretación de los resultados. Se propone entonces un método más apropiado y moderno que se basta en procedimientos robustos en donde los valores extremos no afectan los datos permitiendo una interpretación más adecuada de los mismos. Se presenta un tutorial paso a paso de un análisis descriptivo que le permita a los investigadores hacer una revisión inicial del método más apropiado para analizar los datos. Luego, se compara el ANOVA y la regresión tradicional con su versión robusta para discutir sus ventajas y desventajas. Finalmente, se presentan diagramas de los residuales de los análisis y que pueden usarse para determinar si las condiciones de aplicación de los análisis son apropiadas. Se usan ejemplos tomados de la investigación en psicología para ilustrar los argumentos acá expuestos, y se presenta un código en lenguaje R para que el lector use las técnicas acá presentadas.
|
description_eng |
After much exertion and care to run an experiment in social science, the analysis of data should not be ruined by an improper analysis. Often, classical methods, like the mean, the usual simple and multiple linear regressions, and the ANOVA require normality and absence of outliers, which rarely occurs in data coming from experiments. To palliate to this problem, researchers often use some ad-hoc methods like the detection and deletion of outliers. In this tutorial, we will show the shortcomings of such an approach. In particular, we will show that outliers can sometimes be very difficult to detect and that the full inferential procedure is somewhat distorted by such a procedure. A more appropriate and modern approach is to use a robust procedure that provides estimation, inference and testing that are not influenced by outlying observations but describes correctly the structure for the bulk of the data. It can also give diagnostic of the distance of any point or subject relative to the central tendency. Robust procedures can also be viewed as methods to check the appropriateness of the classical methods. To provide a step-by-step tutorial, we present descriptive analyses that allow researchers to make an initial check on the conditions of application of the data. Next, we compare classical and robust alternatives to ANOVA and regression and discuss their advantages and disadvantages. Finally, we present indices and plots that are based on the residuals of the analysis and can be used to determine if the conditions of applications of the analyses are respected. Examples on data from psychological research illustrate each of these points and for each analysis and plot, R code is provided to allow the readers to apply the techniques presented throughout the article.
|
author |
S. Courvoisier, Delphine Renaud, Olivier |
author_facet |
S. Courvoisier, Delphine Renaud, Olivier |
topic |
robust methods ANOVA regression diagnostic outliers métodos robustos ANOVA regresión diagnostico valores extremos |
topic_facet |
robust methods ANOVA regression diagnostic outliers métodos robustos ANOVA regresión diagnostico valores extremos |
topicspa_str_mv |
métodos robustos ANOVA regresión diagnostico valores extremos |
citationvolume |
3 |
citationissue |
1 |
citationedition |
Núm. 1 , Año 2010 : Special Issue of Statistics in Psychology |
publisher |
Universidad San Buenaventura - USB (Colombia) |
ispartofjournal |
International Journal of Psychological Research |
source |
https://revistas.usb.edu.co/index.php/IJPR/article/view/849 |
language |
eng |
format |
Article |
rights |
https://creativecommons.org/licenses/by-nc-sa/4.0/ International Journal of Psychological Research - 2010 info:eu-repo/semantics/openAccess http://purl.org/coar/access_right/c_abf2 |
type_driver |
info:eu-repo/semantics/article |
type_coar |
http://purl.org/coar/resource_type/c_6501 |
type_version |
info:eu-repo/semantics/publishedVersion |
type_coarversion |
http://purl.org/coar/version/c_970fb48d4fbd8a85 |
type_content |
Text |
publishDate |
2010-06-30 |
date_accessioned |
2010-06-30T00:00:00Z |
date_available |
2010-06-30T00:00:00Z |
url |
https://revistas.usb.edu.co/index.php/IJPR/article/view/849 |
url_doi |
https://doi.org/10.21500/20112084.849 |
issn |
2011-2084 |
eissn |
2011-7922 |
doi |
10.21500/20112084.849 |
citationstartpage |
78 |
citationendpage |
87 |
url2_str_mv |
https://revistas.usb.edu.co/index.php/IJPR/article/download/849/604 |
_version_ |
1811200836314857472 |