Detección y tratamiento de valores extremos: una revisión
.
Los valores extremos son observaciones o medidas que son sospechosas en tanto que son mucho menores o mucho mayores que el resto de las observaciones. Estas observaciones son problemáticas en tanto que puede que no sean causadas por los procesos mentales que están siendo estudiados o puede que no reflejen la habilidad que se está estudiando. El problema es que unas pocas observaciones extremas son suficientes para distorsionar los resultados (alterando el desempeño medio, incrementando la variabilidad, etc.). En este artículo se revisan varias técnicas diseñadas para detectar observaciones extremas. Estas técnicas se subdividen en dos clases, aquellas relacionadas con datos univariados y aquellas relacionadas con datos multivariados. Dentro... Ver más
2011-2084
2011-7922
3
2010-06-30
58
67
info:eu-repo/semantics/openAccess
http://purl.org/coar/access_right/c_abf2
International Journal of Psychological Research - 2010
id |
metarevistapublica_unisanbuenaventura_internationaljournalofpsychologicalresearch_21-article-844 |
---|---|
record_format |
ojs |
spelling |
Detección y tratamiento de valores extremos: una revisión intervalos de confianza Artículo de revista aproximación Bayesiana encuestas nacionales representación gráfica Detección y tratamiento de valores extremos: una revisión estadística de los intervalos guías Los valores extremos son observaciones o medidas que son sospechosas en tanto que son mucho menores o mucho mayores que el resto de las observaciones. Estas observaciones son problemáticas en tanto que puede que no sean causadas por los procesos mentales que están siendo estudiados o puede que no reflejen la habilidad que se está estudiando. El problema es que unas pocas observaciones extremas son suficientes para distorsionar los resultados (alterando el desempeño medio, incrementando la variabilidad, etc.). En este artículo se revisan varias técnicas diseñadas para detectar observaciones extremas. Estas técnicas se subdividen en dos clases, aquellas relacionadas con datos univariados y aquellas relacionadas con datos multivariados. Dentro de estas dos clases, se consideran casos en que la distribución de la población es asumida como normal, casos en que la distribución es normal pero no conocida, o casos en que la población es desconocida. Para cada escenario se proponen algunas recomendaciones. http://purl.org/coar/resource_type/c_6501 info:eu-repo/semantics/publishedVersion http://purl.org/coar/version/c_970fb48d4fbd8a85 info:eu-repo/semantics/openAccess http://purl.org/coar/access_right/c_abf2 Text info:eu-repo/semantics/article Bamber, D. (1969). Reaction times and error rates for "same"-"different" judgments of multidimensional stimuli. Perception and Psychophysics, 6, 169-174. Belsley, D. A., Kuh, E., & Welsch, R. E. (1980). Regression diagnostics : identifying influential data and sources of collinearity. Wiley series in probability and mathematical statistics. New York: John Wiley & Sons. Cook, R. D. (1977). Detection of influatial observation in linear regression. Technometrics, 19, 15-18. Cousineau, D., & Shiffrin, R. M. (2004). Termination of a visual search with large display size effect. Spatial Vision, 17, 327-352. International Journal of Psychological Research - 2010 https://creativecommons.org/licenses/by-nc-sa/4.0/ Inglés https://revistas.usb.edu.co/index.php/IJPR/article/view/844 International Journal of Psychological Research application/pdf Universidad San Buenaventura - USB (Colombia) 1 Outliers are observations or measures that are suspicious because they are much smaller or much larger than the vast majority of the observations. These observations are problematic because they may not be caused by the mental process under scrutiny or may not reflect the ability under examination. The problem is that a few outliers is sometimes enough to distort the group results (by altering the mean performance, by increasing variability, etc.). In this paper, various techniques aimed at detecting potential outliers are reviewed. These techniques are subdivided into two classes, the ones regarding univariate data and those addressing multivariate data. Within these two classes, we consider the cases where the population distribution is known to be normal, the population is not normal but known, or the population is unknown. Recommendations will be put forward in each case. Cousineau, Denis Chartier, Sylvain Statistics outlier detection outlier treatment 3 Publication Núm. 1 , Año 2010 : Special Issue of Statistics in Psychology Journal article 58 2010-06-30 https://revistas.usb.edu.co/index.php/IJPR/article/download/844/601 2010-06-30T00:00:00Z https://doi.org/10.21500/20112084.844 10.21500/20112084.844 2010-06-30T00:00:00Z 2011-7922 2011-2084 67 |
institution |
UNIVERSIDAD DE SAN BUENAVENTURA |
thumbnail |
https://nuevo.metarevistas.org/UNIVERSIDADDESANBUENAVENTURA_COLOMBIA/logo.png |
country_str |
Colombia |
collection |
International Journal of Psychological Research |
title |
Detección y tratamiento de valores extremos: una revisión |
spellingShingle |
Detección y tratamiento de valores extremos: una revisión Cousineau, Denis Chartier, Sylvain intervalos de confianza aproximación Bayesiana encuestas nacionales representación gráfica estadística de los intervalos guías Statistics outlier detection outlier treatment |
title_short |
Detección y tratamiento de valores extremos: una revisión |
title_full |
Detección y tratamiento de valores extremos: una revisión |
title_fullStr |
Detección y tratamiento de valores extremos: una revisión |
title_full_unstemmed |
Detección y tratamiento de valores extremos: una revisión |
title_sort |
detección y tratamiento de valores extremos: una revisión |
description |
Los valores extremos son observaciones o medidas que son sospechosas en tanto que son mucho menores o mucho mayores que el resto de las observaciones. Estas observaciones son problemáticas en tanto que puede que no sean causadas por los procesos mentales que están siendo estudiados o puede que no reflejen la habilidad que se está estudiando. El problema es que unas pocas observaciones extremas son suficientes para distorsionar los resultados (alterando el desempeño medio, incrementando la variabilidad, etc.). En este artículo se revisan varias técnicas diseñadas para detectar observaciones extremas. Estas técnicas se subdividen en dos clases, aquellas relacionadas con datos univariados y aquellas relacionadas con datos multivariados. Dentro de estas dos clases, se consideran casos en que la distribución de la población es asumida como normal, casos en que la distribución es normal pero no conocida, o casos en que la población es desconocida. Para cada escenario se proponen algunas recomendaciones.
|
description_eng |
Outliers are observations or measures that are suspicious because they are much smaller or much larger than the vast majority of the observations. These observations are problematic because they may not be caused by the mental process under scrutiny or may not reflect the ability under examination. The problem is that a few outliers is sometimes enough to distort the group results (by altering the mean performance, by increasing variability, etc.). In this paper, various techniques aimed at detecting potential outliers are reviewed. These techniques are subdivided into two classes, the ones regarding univariate data and those addressing multivariate data. Within these two classes, we consider the cases where the population distribution is known to be normal, the population is not normal but known, or the population is unknown. Recommendations will be put forward in each case.
|
author |
Cousineau, Denis Chartier, Sylvain |
author_facet |
Cousineau, Denis Chartier, Sylvain |
topicspa_str_mv |
intervalos de confianza aproximación Bayesiana encuestas nacionales representación gráfica estadística de los intervalos guías |
topic |
intervalos de confianza aproximación Bayesiana encuestas nacionales representación gráfica estadística de los intervalos guías Statistics outlier detection outlier treatment |
topic_facet |
intervalos de confianza aproximación Bayesiana encuestas nacionales representación gráfica estadística de los intervalos guías Statistics outlier detection outlier treatment |
citationvolume |
3 |
citationissue |
1 |
citationedition |
Núm. 1 , Año 2010 : Special Issue of Statistics in Psychology |
publisher |
Universidad San Buenaventura - USB (Colombia) |
ispartofjournal |
International Journal of Psychological Research |
source |
https://revistas.usb.edu.co/index.php/IJPR/article/view/844 |
language |
Inglés |
format |
Article |
rights |
info:eu-repo/semantics/openAccess http://purl.org/coar/access_right/c_abf2 International Journal of Psychological Research - 2010 https://creativecommons.org/licenses/by-nc-sa/4.0/ |
references_eng |
Bamber, D. (1969). Reaction times and error rates for "same"-"different" judgments of multidimensional stimuli. Perception and Psychophysics, 6, 169-174. Belsley, D. A., Kuh, E., & Welsch, R. E. (1980). Regression diagnostics : identifying influential data and sources of collinearity. Wiley series in probability and mathematical statistics. New York: John Wiley & Sons. Cook, R. D. (1977). Detection of influatial observation in linear regression. Technometrics, 19, 15-18. Cousineau, D., & Shiffrin, R. M. (2004). Termination of a visual search with large display size effect. Spatial Vision, 17, 327-352. |
type_driver |
info:eu-repo/semantics/article |
type_coar |
http://purl.org/coar/resource_type/c_6501 |
type_version |
info:eu-repo/semantics/publishedVersion |
type_coarversion |
http://purl.org/coar/version/c_970fb48d4fbd8a85 |
type_content |
Text |
publishDate |
2010-06-30 |
date_accessioned |
2010-06-30T00:00:00Z |
date_available |
2010-06-30T00:00:00Z |
url |
https://revistas.usb.edu.co/index.php/IJPR/article/view/844 |
url_doi |
https://doi.org/10.21500/20112084.844 |
issn |
2011-2084 |
eissn |
2011-7922 |
doi |
10.21500/20112084.844 |
citationstartpage |
58 |
citationendpage |
67 |
url2_str_mv |
https://revistas.usb.edu.co/index.php/IJPR/article/download/844/601 |
_version_ |
1823468255551946752 |