Detección y tratamiento de valores extremos: una revisión
.
Los valores extremos son observaciones o medidas que son sospechosas en tanto que son mucho menores o mucho mayores que el resto de las observaciones. Estas observaciones son problemáticas en tanto que puede que no sean causadas por los procesos mentales que están siendo estudiados o puede que no reflejen la habilidad que se está estudiando. El problema es que unas pocas observaciones extremas son suficientes para distorsionar los resultados (alterando el desempeño medio, incrementando la variabilidad, etc.). En este artículo se revisan varias técnicas diseñadas para detectar observaciones extremas. Estas técnicas se subdividen en dos clases, aquellas relacionadas con datos univariados y aquellas relacionadas con datos multivariados. Dentro... Ver más
2011-2084
2011-7922
3
2010-06-30
58
67
International Journal of Psychological Research - 2010
info:eu-repo/semantics/openAccess
http://purl.org/coar/access_right/c_abf2
id |
metarevistapublica_unisanbuenaventura_internationaljournalofpsychologicalresearch_21_article_844 |
---|---|
record_format |
ojs |
spelling |
Detección y tratamiento de valores extremos: una revisión Detección y tratamiento de valores extremos: una revisión Los valores extremos son observaciones o medidas que son sospechosas en tanto que son mucho menores o mucho mayores que el resto de las observaciones. Estas observaciones son problemáticas en tanto que puede que no sean causadas por los procesos mentales que están siendo estudiados o puede que no reflejen la habilidad que se está estudiando. El problema es que unas pocas observaciones extremas son suficientes para distorsionar los resultados (alterando el desempeño medio, incrementando la variabilidad, etc.). En este artículo se revisan varias técnicas diseñadas para detectar observaciones extremas. Estas técnicas se subdividen en dos clases, aquellas relacionadas con datos univariados y aquellas relacionadas con datos multivariados. Dentro de estas dos clases, se consideran casos en que la distribución de la población es asumida como normal, casos en que la distribución es normal pero no conocida, o casos en que la población es desconocida. Para cada escenario se proponen algunas recomendaciones. Outliers are observations or measures that are suspicious because they are much smaller or much larger than the vast majority of the observations. These observations are problematic because they may not be caused by the mental process under scrutiny or may not reflect the ability under examination. The problem is that a few outliers is sometimes enough to distort the group results (by altering the mean performance, by increasing variability, etc.). In this paper, various techniques aimed at detecting potential outliers are reviewed. These techniques are subdivided into two classes, the ones regarding univariate data and those addressing multivariate data. Within these two classes, we consider the cases where the population distribution is known to be normal, the population is not normal but known, or the population is unknown. Recommendations will be put forward in each case. Cousineau, Denis Chartier, Sylvain Statistics outlier detection outlier treatment intervalos de confianza estadística de los intervalos guías representación gráfica encuestas nacionales aproximación Bayesiana 3 1 Núm. 1 , Año 2010 : Special Issue of Statistics in Psychology Artículo de revista Journal article 2010-06-30T00:00:00Z 2010-06-30T00:00:00Z 2010-06-30 application/pdf Universidad San Buenaventura - USB (Colombia) International Journal of Psychological Research 2011-2084 2011-7922 https://revistas.usb.edu.co/index.php/IJPR/article/view/844 10.21500/20112084.844 https://doi.org/10.21500/20112084.844 eng https://creativecommons.org/licenses/by-nc-sa/4.0/ International Journal of Psychological Research - 2010 58 67 Bamber, D. (1969). Reaction times and error rates for "same"-"different" judgments of multidimensional stimuli. Perception and Psychophysics, 6, 169-174. Belsley, D. A., Kuh, E., & Welsch, R. E. (1980). Regression diagnostics : identifying influential data and sources of collinearity. Wiley series in probability and mathematical statistics. New York: John Wiley & Sons. Cook, R. D. (1977). Detection of influatial observation in linear regression. Technometrics, 19, 15-18. Cousineau, D., & Shiffrin, R. M. (2004). Termination of a visual search with large display size effect. Spatial Vision, 17, 327-352. https://revistas.usb.edu.co/index.php/IJPR/article/download/844/601 info:eu-repo/semantics/article http://purl.org/coar/resource_type/c_6501 info:eu-repo/semantics/publishedVersion http://purl.org/coar/version/c_970fb48d4fbd8a85 info:eu-repo/semantics/openAccess http://purl.org/coar/access_right/c_abf2 Text Publication |
institution |
UNIVERSIDAD DE SAN BUENAVENTURA |
thumbnail |
https://nuevo.metarevistas.org/UNIVERSIDADDESANBUENAVENTURA_COLOMBIA/logo.png |
country_str |
Colombia |
collection |
International Journal of Psychological Research |
title |
Detección y tratamiento de valores extremos: una revisión |
spellingShingle |
Detección y tratamiento de valores extremos: una revisión Cousineau, Denis Chartier, Sylvain Statistics outlier detection outlier treatment intervalos de confianza estadística de los intervalos guías representación gráfica encuestas nacionales aproximación Bayesiana |
title_short |
Detección y tratamiento de valores extremos: una revisión |
title_full |
Detección y tratamiento de valores extremos: una revisión |
title_fullStr |
Detección y tratamiento de valores extremos: una revisión |
title_full_unstemmed |
Detección y tratamiento de valores extremos: una revisión |
title_sort |
detección y tratamiento de valores extremos: una revisión |
description |
Los valores extremos son observaciones o medidas que son sospechosas en tanto que son mucho menores o mucho mayores que el resto de las observaciones. Estas observaciones son problemáticas en tanto que puede que no sean causadas por los procesos mentales que están siendo estudiados o puede que no reflejen la habilidad que se está estudiando. El problema es que unas pocas observaciones extremas son suficientes para distorsionar los resultados (alterando el desempeño medio, incrementando la variabilidad, etc.). En este artículo se revisan varias técnicas diseñadas para detectar observaciones extremas. Estas técnicas se subdividen en dos clases, aquellas relacionadas con datos univariados y aquellas relacionadas con datos multivariados. Dentro de estas dos clases, se consideran casos en que la distribución de la población es asumida como normal, casos en que la distribución es normal pero no conocida, o casos en que la población es desconocida. Para cada escenario se proponen algunas recomendaciones.
|
description_eng |
Outliers are observations or measures that are suspicious because they are much smaller or much larger than the vast majority of the observations. These observations are problematic because they may not be caused by the mental process under scrutiny or may not reflect the ability under examination. The problem is that a few outliers is sometimes enough to distort the group results (by altering the mean performance, by increasing variability, etc.). In this paper, various techniques aimed at detecting potential outliers are reviewed. These techniques are subdivided into two classes, the ones regarding univariate data and those addressing multivariate data. Within these two classes, we consider the cases where the population distribution is known to be normal, the population is not normal but known, or the population is unknown. Recommendations will be put forward in each case.
|
author |
Cousineau, Denis Chartier, Sylvain |
author_facet |
Cousineau, Denis Chartier, Sylvain |
topic |
Statistics outlier detection outlier treatment intervalos de confianza estadística de los intervalos guías representación gráfica encuestas nacionales aproximación Bayesiana |
topic_facet |
Statistics outlier detection outlier treatment intervalos de confianza estadística de los intervalos guías representación gráfica encuestas nacionales aproximación Bayesiana |
topicspa_str_mv |
intervalos de confianza estadística de los intervalos guías representación gráfica encuestas nacionales aproximación Bayesiana |
citationvolume |
3 |
citationissue |
1 |
citationedition |
Núm. 1 , Año 2010 : Special Issue of Statistics in Psychology |
publisher |
Universidad San Buenaventura - USB (Colombia) |
ispartofjournal |
International Journal of Psychological Research |
source |
https://revistas.usb.edu.co/index.php/IJPR/article/view/844 |
language |
eng |
format |
Article |
rights |
https://creativecommons.org/licenses/by-nc-sa/4.0/ International Journal of Psychological Research - 2010 info:eu-repo/semantics/openAccess http://purl.org/coar/access_right/c_abf2 |
references_eng |
Bamber, D. (1969). Reaction times and error rates for "same"-"different" judgments of multidimensional stimuli. Perception and Psychophysics, 6, 169-174. Belsley, D. A., Kuh, E., & Welsch, R. E. (1980). Regression diagnostics : identifying influential data and sources of collinearity. Wiley series in probability and mathematical statistics. New York: John Wiley & Sons. Cook, R. D. (1977). Detection of influatial observation in linear regression. Technometrics, 19, 15-18. Cousineau, D., & Shiffrin, R. M. (2004). Termination of a visual search with large display size effect. Spatial Vision, 17, 327-352. |
type_driver |
info:eu-repo/semantics/article |
type_coar |
http://purl.org/coar/resource_type/c_6501 |
type_version |
info:eu-repo/semantics/publishedVersion |
type_coarversion |
http://purl.org/coar/version/c_970fb48d4fbd8a85 |
type_content |
Text |
publishDate |
2010-06-30 |
date_accessioned |
2010-06-30T00:00:00Z |
date_available |
2010-06-30T00:00:00Z |
url |
https://revistas.usb.edu.co/index.php/IJPR/article/view/844 |
url_doi |
https://doi.org/10.21500/20112084.844 |
issn |
2011-2084 |
eissn |
2011-7922 |
doi |
10.21500/20112084.844 |
citationstartpage |
58 |
citationendpage |
67 |
url2_str_mv |
https://revistas.usb.edu.co/index.php/IJPR/article/download/844/601 |
_version_ |
1811200836119822336 |