Arquitectura de referencia para un laboratorio virtual como herramienta de sistematización de datos de biodiversidad
.
El objetivo de esta investigación fue desarrollar un laboratorio virtual para la gestión de datos de biodiversidad en la región del Pacífico colombiano. La plataforma creada integra una base de datos relacional en PostgreSQL, el ecosistema JupyterHub y servicios de Amazon Web Services (AWS), con infraestructuras de datos globales. Se recopilaron 28.058 registros entre 2004 y 2022, destacando 44 familias, 119 géneros y 198 especies, incluyendo, especies maderables amenazadas, como Carapa guianensis, Humiriastrum procerum y Magnolia calimaensis. Entre las familias con mayores registros se encuentran Fabaceae, Arecaceae, Malvaceae y Moraceae, con 88 especies en total. La ejecución de rutinas de trabajo no excedió los 11 minutos en Python y R.... Ver más
0123-4226
2619-2551
27
2025-12-31
Juan Pablo Cuevas-Gonzalez, Fernando Fernandez-Mendez, Kelly T. Bocanegra-González - 2024
Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial 4.0.
info:eu-repo/semantics/openAccess
http://purl.org/coar/access_right/c_abf2
id |
metarevistapublica_udca_revistau.d.c.aactualidad_divulgacioncientifica_94-article-2389 |
---|---|
record_format |
ojs |
institution |
UNIVERSIDAD DE CIENCIAS APLICADAS Y AMBIENTALES |
thumbnail |
https://nuevo.metarevistas.org/UNIVERSIDADDECIENCIASAPLICADASYAMBIENTALES/logo.png |
country_str |
Colombia |
collection |
Revista U.D.C.A Actualidad & Divulgación Científica |
title |
Arquitectura de referencia para un laboratorio virtual como herramienta de sistematización de datos de biodiversidad |
spellingShingle |
Arquitectura de referencia para un laboratorio virtual como herramienta de sistematización de datos de biodiversidad Cuevas-Gonzalez, Juan Pablo Fernandez-Mendez, Fernando Bocanegra-González, Kelly T. Sistemas de información sobre biodiversidad Computación en la nube Conservación de la biodiversidad Curaduría Gestión de datos Curatorship Data management Biodiversity information systems Biodiversity conservation Cloud computing |
title_short |
Arquitectura de referencia para un laboratorio virtual como herramienta de sistematización de datos de biodiversidad |
title_full |
Arquitectura de referencia para un laboratorio virtual como herramienta de sistematización de datos de biodiversidad |
title_fullStr |
Arquitectura de referencia para un laboratorio virtual como herramienta de sistematización de datos de biodiversidad |
title_full_unstemmed |
Arquitectura de referencia para un laboratorio virtual como herramienta de sistematización de datos de biodiversidad |
title_sort |
arquitectura de referencia para un laboratorio virtual como herramienta de sistematización de datos de biodiversidad |
title_eng |
Reference architecture for a virtual laboratory as a biodiversity data systematization tool |
description |
El objetivo de esta investigación fue desarrollar un laboratorio virtual para la gestión de datos de biodiversidad en la región del Pacífico colombiano. La plataforma creada integra una base de datos relacional en PostgreSQL, el ecosistema JupyterHub y servicios de Amazon Web Services (AWS), con infraestructuras de datos globales. Se recopilaron 28.058 registros entre 2004 y 2022, destacando 44 familias, 119 géneros y 198 especies, incluyendo, especies maderables amenazadas, como Carapa guianensis, Humiriastrum procerum y Magnolia calimaensis. Entre las familias con mayores registros se encuentran Fabaceae, Arecaceae, Malvaceae y Moraceae, con 88 especies en total. La ejecución de rutinas de trabajo no excedió los 11 minutos en Python y R. Los servicios de AWS demostraron tiempos de respuesta de 200 ms y un tráfico de red de 0.1 GB/s. El inicio y cese de contenedores se realizó en 10 y 5 segundos, con un uso promedio de CPU y RAM ,del 80 y 75%, respectivamente. Además, se almacenaron 4 GB de objetos con tiempos de respuesta inferiores a 100 ms. Con la ayuda de las herramientas implementadas se logró prevenir errores en los datos dasométricos y taxonómicos, destacando la importancia del control de calidad y la validación de datos. La implementación de este laboratorio virtual permitió un manejo eficaz de grandes volúmenes de datos, facilitando la colaboración en tiempo real entre investigadores y proporcionando una herramienta escalable y flexible para el análisis de datos ecológicos, promoviendo una comprensión más completa de la biodiversidad en la región.
|
description_eng |
The objective of this research was to develop a virtual laboratory for the management of biodiversity data in the Colombian Pacific Region. The platform created integrates a relational database in PostgreSQL, the JupyterHub ecosystem, and Amazon Web Services (AWS) services with global data infrastructures. 28058 records were collected between 2004 and 2022, highlighting 44 families, 119 genera, and 198 species, including threatened timber species such as Carapa guianensis, Humiriastrum procerum, and Magnolia calimaensis. Among the families with the most significant number of records are Fabaceae, Arecaceae, Malvaceae, and Moraceae, which have 88 species. The execution of work routines was at most 11 minutes in Python, and R. AWS services demonstrated response times of 200 ms and network traffic of 0.1 GB/s. The start and stop of containers were carried out in 10 and 5 seconds, with an average CPU and RAM usage of 80% and 75%, respectively. In addition, 4 GB of objects were stored with response times of less than 100 ms. With the help of the implemented tools, it was possible to prevent errors in the dasometric and taxonomic data, highlighting the importance of quality control and data validation. The implementation of this virtual laboratory allowed an efficient management of large volumes of data, facilitating real-time collaboration between researchers and providing a scalable and flexible tool for the analysis of ecological data, promoting a more complete understanding of biodiversity in the region.
|
author |
Cuevas-Gonzalez, Juan Pablo Fernandez-Mendez, Fernando Bocanegra-González, Kelly T. |
author_facet |
Cuevas-Gonzalez, Juan Pablo Fernandez-Mendez, Fernando Bocanegra-González, Kelly T. |
topicspa_str_mv |
Sistemas de información sobre biodiversidad Computación en la nube Conservación de la biodiversidad Curaduría Gestión de datos |
topic |
Sistemas de información sobre biodiversidad Computación en la nube Conservación de la biodiversidad Curaduría Gestión de datos Curatorship Data management Biodiversity information systems Biodiversity conservation Cloud computing |
topic_facet |
Sistemas de información sobre biodiversidad Computación en la nube Conservación de la biodiversidad Curaduría Gestión de datos Curatorship Data management Biodiversity information systems Biodiversity conservation Cloud computing |
citationvolume |
27 |
citationissue |
2 |
citationedition |
Núm. 2 , Año 2024 :Revista U.D.C.A Actualidad & Divulgación Científica. Julio-Diciembre |
publisher |
Universidad de Ciencias Aplicadas y Ambientales U.D.C.A |
ispartofjournal |
Revista U.D.C.A Actualidad & Divulgación Científica |
source |
https://revistas.udca.edu.co/index.php/ruadc/article/view/2389 |
language |
Español |
format |
Article |
rights |
http://creativecommons.org/licenses/by-nc/4.0 Juan Pablo Cuevas-Gonzalez, Fernando Fernandez-Mendez, Kelly T. Bocanegra-González - 2024 Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial 4.0. info:eu-repo/semantics/openAccess http://purl.org/coar/access_right/c_abf2 |
references |
AGRILLO, E.; FILIPPONI, F.; PEZZAROSSA, A.; CASELLA, L.; SMIRAGLIA, D.; ORASI, A.; ATTORRE, F.; TARAMELLI, A. 2021. Earth observation and biodiversity big data for forest habitat types classification and mapping. Remote Sensing. 13(7):1231. https://doi.org/10.3390/rs13071231 ALBERTI, J.; MASSONE, O. 2022. Tired of losing valuable data? Build your lab ecological database as a cornerstone for long-term approaches. Ecología Austral. 32(1):151-157. https://doi.org/10.25260/ea.22.32.1.0.1785 ARECHIGA, J.; ESQUIVEL, T.; CAMACHO, A.; DELGADO-RODRÍGUEZ, M.R.; VARGAS-GONZÁLEZ, P.; QUIJAS, S. 2022. Floristic and structural diversity of riparian vegetation along an urban-natural gradient of Pitillal River Jalisco, México. Revista U.D.C.A Actualidad & Divulgación Científica. 25(1):e2196. https://doi.org/10.31910/rudca.v25.nSupl.1.2022.2196 ANDJARWIRAWAN, J.; NOVIANUS, P.H.; KURNIAWAN, A. 2020. Computer science laboratory environment using docker. 1-6. Disponible desde Internet en: https://repository.petra.ac.id/18698/1/Publikasi1_98031_5989.pdf BART, A.; FAZLIEV, A.; GORDOV, E.; OKLADNIKOV, I.; PRIVEZENTSEV, A.; TITOV, A. 2018. Virtual research environment for regional climatic processes analysis: Ontological approach to spatial data systematization. Data Science Journal. 17:14 https://doi.org/10.5334/dsj-2018-014 BAYER, M. 2013. SQLAlchemy. En: Brown, A.; Wilson, G. (eds.), The architecture of open source applications. Volume II. University of California Berkeley p.291-314. Disponible desde Internet en: http://software-carpentry.org/2011/05/06/%0Ahttps://aosabook.org/en/sqlalchemy.html BEG, M.; TAKA, J.; KLUYVER, T.; KONOVALOV, A.; RAGAN-KELLEY, M.; THIERY, N.M.; FANGOHR, H. 2021. Using Jupyter for Reproducible Scientific Workflows. Computing in Science and Engineering. 23(2):36-46. https://doi.org/10.1109/MCSE.2021.3052101 BOCANEGRA-GONZÁLEZ, K.; GUILLEMIN, M.L. 2018. Guidelines for the restoration of the tropical timber tree Anacardium excelsum: first input from genetic data. Tree Genetics and Genomes. 14(59). https://doi.org/10.1007/s11295-018-1271-z BOROWIEC, M.L.; DIKOW, R.B.; FRANDSEN, P.B.; MCKEEKEN, A.; VALENTINI, G.; WHITE, A.E. 2022. Deep learning as a tool for ecology and evolution. In Methods in Ecology and Evolution. 13(8):1640-1660. https://doi.org/10.1111/2041-210X.13901 CARNEIRO, T.; DA NOBREGA, R.V.M.; NEPOMUCENO, T.; BIAN, G. BIN; DE ALBUQUERQUE, V.H.C.; FILHO, P.P.R. 2018. Performance Analysis of Google Colaboratory as a Tool for Accelerating Deep Learning Applications. IEEE 6:61677-61685. https://doi.org/10.1109/ACCESS.2018.2874767 CHAMBERLAIN, S.; FORKEL, R.; LEGIND, J.; HOEY, S.V.; DESMET, P.; NOÉ, N. 2022. pygbif. Disponible desde Internet en: https://github.com/gbif/pygbif CHAPMAN, A.D.; WIECZOREK, J.R. 2022. Guía de buenas prácticas de georreferenciación. https://doi.org/10.15468/doc-gg7h-s853 CHEN, F.; HU, Y. 2021. Agricultural and rural ecological management system based on big data in complex system. Environmental Technology and Innovation. 22:101390. https://doi.org/10.1016/j.eti.2021.101390 COKER, S.; ATNOOR, D.; BUCKNER, P. 2019. Building the foundation for lab of the future using AWS. Disponible desde Internet en: https://aws.amazon.com/blogs/industries/building-the-foundation-for-lab-of-the-future-using-aws/ COOPER, D.H.; NOONAN-MOONEY, K. 2013. Convention on Biological Diversity. En: Levin, S. Encyclopedia of Biodiversity. Segunda edición. Academic Press. p.306-319. https://doi.org/10.1016/B978-0-12-384719-5.00418-4 COORDINATE SYSTEMS WORLDWIDE. 2022. WGS 84 - WGS84 - World Geodetic System 1984. used in GPS. Disponible desde Internet en: https://epsg.io/4326 DAVENPORT, T.; PRUSAK, L. 1998. Working knowledge: how organizations manage what they know. Choice Reviews Online. 35(09):5167. https://doi.org/10.5860/choice.35-5167 DEVICTOR, V.; BENSAUDE-VINCENT, B. 2016. From ecological records to big data: the invention of global biodiversity. History and Philosophy of the Life Sciences. 38:13. https://doi.org/10.1007/s40656-016-0113-2 FOOD AND AGRICULTURE ORGANIZATION OF THE UNITED NATIONS, FAO. 2022. El tratado internacional sobre los recursos fitogenéticos para la alimentación y la agricultura. Disponible desde Internet en: http://extwprlegs1.fao.org/treaty/docs/tre000005S.pdf FORESTPLOTS.NET. 2020. ForestPlots.NET. Disponible desde Internet en: https://www.forestplots.net/ GARCÍA-LÓPEZ, Y.; GONZÁLEZ-SÁEZ, L.Y.; CABRERA-HERNÁNDEZ, A.J. 2022. Aplicaciones de aprendizaje automático para el análisis industrial de la provisión azucarera en Matanzas, Cuba. Revista U.D.C.A Actualidad & Divulgación Científica. 25(2):1-10. https://doi.org/10.31910/rudca.v25.n2.2022.2334 GLOBAL BIODIVERSITY INFOMATION FACILITY, GBIF. 2020. Global Biodiversity Information Facility. Disponible desde Internet en: https://www.gbif.org/ GLOBAL BIODIVERSITY INFOMATION FACILITY, GBIF. 2022. Introducción a GBIF Tabla de Contenido. Disponible desde Internet en: https://docs.gbif.org/course-introduction-to-gbif/es/introduccion-a-gbif.es.pdf GENTRY, A. 1996. A Field Guide the Families and Genera Woody Plants of Northwest South America (Colombia, Ecuador, Peru). University of Chicago. 920p. GIMÉNEZ, J.A. 2019. Buenas prácticas en el diseño de bases de datos. Revista Científica Internacional ARANDU UTIC. 6:193-210. GOOGLE. 2023. Google Colaboratory. Disponible desde Internet en: https://colab.research.google.com/ GRATTAROLA, F.; BOTTO, G.; DA ROSA, I.; GOBEL, N.; GONZÁLEZ, E.M.; GONZÁLEZ, J.; HERNÁNDEZ, D.; LAUFER, G.; MANEYRO, R.; MARTÍNEZ-LANFRANCO, J.A.; NAYA, D.E.; RODALES, A.L.; ZIEGLER, L.; PINCHEIRA-DONOSO, D. 2019. Biodiversidata: An open-access biodiversity database for Uruguay. Biodiversity Data Journal. 7:e36226 https://doi.org/10.3897/BDJ.7.e36226 GROUP ON EARTH OBSERVATION, GEO. 2015. Strategic Plan 2016-2025: Implementing GEOSS. Disponible desde Internet en: https://www.earthobservations.org/documents/GEO_Strategic_Plan_2016_2025_Implementing_GEOSS.pdf HAMPTON, S.E.; STRASSER, C.A.; TEWKSBURY, JJ.; GRAM, W.K.; BUDDEN, A.E.; BATCHELLER, A.L.; DUKE, C.S.; PORTER, J.H. 2013. Big data and the future of ecology. Frontiers in Ecology and the Environment. 11(3):156-162. https://doi.org/10.1890/120103 HERNANDEZ, L.; ÁLVAREZ-MARTÍNEZ, J.M.; GÓMEZ ALMARAZ, C.; SÁNCHEZ DE DIOS, R.; JÍMENEZ ALFARO, B.; ÁLVAREZ-TABOADA, F. 2022. Seguimiento de la biodiversidad en la era del Big Data. Ecosistemas. 31(3). https://doi.org/10.7818/ECOS.2450 HU, F.; CHE, S. 2019. Establishment of the Docker-Based Laboratory Environment. Open Access Library Journal. 6:e5519. https://doi.org/10.4236/oalib.1105519 INTERGOVERNMENTAL PANEL ON CLIMATE CHANGE, IPCC. 2019. El IPCC y el sexto ciclo de evaluación. Disponible desde Internet en: https://www.ipcc.ch/site/assets/uploads/2018/09/AC6_brochure_es.pdf JUPYTER PROJECT. 2022a. Jupyterhub: A multi-user version of the notebook designed for companies, classrooms and research labs. Disponible desde Internet en: https://jupyter.org/ JUPYTER PROJECT. 2022b. Jupyter Notebook: The classic notebook interface. Disponible desde Internet en: https://jupyter.org/ KOVÁCS, D.D.; REYES-MUÑOZ, P.; SALINERO-DELGADO, M.; MÉSZÁROS, V.I.; BERGER, K.; VERRELST, J. 2023. Cloud-free global maps of essential vegetation traits processed from the TOA Sentinel-3 catalogue in Google Earth Engine. Remote Sensing. 15(13). https://doi.org/10.3390/rs15133404 LESLIE, B. 2022. Pygpx. Disponible desde Internet en: https://github.com/fxdgear/pygpx LI, R.; RANIPETA, A.; WILSHIRE, J.; MALCZYK, J.; DUONG, M.; GURALNICK, R.; WILSON, A.; JETZ, W. 2021. A cloud-based toolbox for the versatile environmental annotation of biodiversity data. PLoS Biology. 19(11). https://doi.org/10.1371/journal.pbio.3001460 MCKINNEY, W. 2010. Data Structures for Statistical Computing in Python. Proceedings of the 9th Python in Science Conference. 1:56-61. https://doi.org/10.25080/majora-92bf1922-00a MELO, O.A.; VARGAS, R. 2003. Evaluación ecológica y silvicultural de ecosistemas boscosos. Universidad del Tolima, CRG, carder, corpocaldas, cortolima. Ibagué, Colombia. p.222 MUÑOZ, D.A.; DUEÑAS, M.C.; VILLEGAS, X.F.; MURCIA., U.G.; URIBE, C.; ARIAS, L.; SIERRA, P.; HERRERA, I.; CASTRO, W.; HERNÁNDEZ, V.; BENAVIDES, J. 2007. Sistema de información ambiental de Colombia-SIAC Marco Conceptual del SIAC: Aplicación del enfoque ecosistémico. 1-197. Disponible desde Internet en: https://www.siac.gov.co/portal/default.aspx MUSVUUGWA, T.; DLOMU, M.G.; ADEBOWALE, A. 2021. Big data in biodiversity science: A framework for engagement. Technologies. 9(3):60. https://doi.org/10.3390/technologies9030060 NAKAMURA, K.; HORI, K.; HIROSE, S. 2021. Algebraic fault analysis of sha-256 compression function and its application. Information. 12(10):433. https://doi.org/10.3390/info12100433 NOREÑA-P., A.; GONZÁLEZ MUÑOZ, A.; MOSQUERA-RENDÓN, J.; BOTERO, K.; CRISTANCHO, M.A. 2018. Colombia, an unknown genetic diversity in the era of Big Data. BMC Genomics. 19:859. https://doi.org/10.1186/s12864-018-5194-8 ORGANIZACIÓN DE LAS NACIONES UNIDAS, ONU. 1998. Protocolo de Kyoto de la convención marco de las naciones unidas sobre el cambio climático. 24p. ORGANIZACIÓN DE LAS NACIONES UNIDAS, ONU. 2018. La Agenda 2030 y los objetivos de desarrollo sostenible una oportunidad para América Latina y el Caribe. Naciones Unidas. 89p. Disponible desde Internet en: https://repositorio.cepal.org/bitstream/handle/11362/40155/24/S1801141_es.pdf PIMENTEL, J.F.; MURTA, L.; BRAGANHOLO, V.; FREIRE, J. 2019. A large-scale study about quality and reproducibility of jupyter notebooks. IEEE International Working Conference on Mining Software Repositories. 507-517. https://doi.org/10.1109/MSR.2019.00077 POSTGRESQL GLOBAL DEVELOPMENT GROUP. 2022. PostgreSQL 13.3. Disponible desde Internet en: https://www.postgresql.org PÖTTKER, M.; KIEHL, K.; JARMER, T.; TRAUTZ, D. 2023. Convolutional neural network maps plant communities in semi-natural grasslands using multispectral unmanned aerial vehicle imagery. Remote Sensing. 15(7). https://doi.org/10.3390/rs15071945 PYTHON SOFTWARE FOUNDATION. 2022. cpython. Disponible desde Internet en: https://github.com/python/cpython/tree/3.10 RACCOON, T.; PHAM, H. 2022. TablePlus. Disponible desde Internet en: https://tableplus.com/ ROBERTS, J.F.; MWANGI, R.; MUKABI, F.; NJUI, J.; NZIOKA, K.; NDAMBIRI, J.K.; BISPO, P.C.; ESPIRITO-SANTO, F.D.B.; GOU, Y.; JOHNSON, S.C.M.; LOUIS, V.; RODRIGUEZ-VEIGA, P.; TANSEY, K.; UPTON, C.; ROBB, C.; BALZTER, H. 2022. Pyeo: A Python package for near-real-time forest cover change detection from Earth observation using machine learning. Computers and Geosciences. 167:105192. https://doi.org/10.1016/j.cageo.2022.105192 R DEVELOPMENT CORE TEAM. 1993. R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. Disponible desde Internet en: https://www.R-project.org/ SENTERRE, B.; WAGNER, M. 2016. Standardization of data collection and creation of a biodiversity database: a PostgreSQL-PostGIS database for Island Conservation Society (Seychelles). https://doi.org/10.13140/RG.2.2.10370.27844 SHIN, D.H.; CHOI, M. 2015. Ecological views of big data: Perspectives and issues. Telematics and Informatics. 32(2):311-320. https://doi.org/10.1016/j.tele.2014.09.006 SIERRA, C.A.; MAHECHA, M.; POVEDA, G.; ÁLVAREZ-DÁVILA, E.; GUTIERREZ-VELEZ, V.H.; REU, B.; FEILHAUER, H.; ANÁYA, J.; ARMENTERAS, D.; BENAVIDES, A.M.; BUENDIA, C.; DUQUE, Á.; ESTUPIÑAN-SUAREZ, L.M.; GONZÁLEZ, C.; GONZALEZ-CARO, S.; JIMENEZ, R.; KRAEMER, G.; LONDOÑO, M.C.; ORREGO, S.A.; SKOWRONEK, S. 2017. Monitoring ecological change during rapid socio-economic and political transitions: Colombian ecosystems in the post-conflict era. Environmental Science and Policy. 76:40-49. https://doi.org/10.1016/j.envsci.2017.06.011 SISTEMA DE INFORMACIÓN SOBRE BIODIVERSIDAD DE COLOMBIA, SIB. 2017. Crear compartir transformar. Una guía con herramientas para comprender y participar en las dinámicas del acceso abierto. SiB Colombia. Disponible desde Internet en: http://www.sibcolombia.net/nosotros/acceso-abierto/ABC.pdf%0A SOLTIS, D.E.; SOLTIS, P.S. 2016. Mobilizing and integrating big data in studies of spatial and phylogenetic patterns of biodiversity. Plant Diversity. 38(6):264-270. https://doi.org/10.1016/j.pld.2016.12.001 SVOB, S.; ARROYO, J.P.; KALACSKA, M. 2014. The development of a forestry geodatabase for natural forest management plans in Costa Rica. Forest Ecology and Management. 327:240-250. https://doi.org/10.1016/j.foreco.2014.05.024 TRIANA-VALLEJOS, J.A.; BAILÓN-AIJÓN, C.; CIFUENTES-CASTELLANOS, J.M. 2022. Morphological description and molecular characterization of fungi associated with the root of Masdevallia coccinea Linden ex Lindl. Revista U.D.C.A Actualidad and Divulgacion Cientifica. 25(1):e2098. https://doi.org/10.31910/rudca.v25.n1.2022.2098 VAN ROSSUM, G. 1995. Python tutorial, Technical Report CS-R9526. Centrum Voor Wiskunde En Informatica (CWI). Disponible desde Internet en: https://ir.cwi.nl/pub/5007/05007D.pdf WÄGELE, J.W.; BODESHEIM, P.; BOURLAT, S.J.; DENZLER, J.; DIEPENBROEK, M.; FONSECA, V.; FROMMOLT, K.H.; GEIGER, M.F.; GEMEINHOLZER, B.; GLÖCKNER, F.O.; HAUCKE, T.; KIRSE, A.; KÖLPIN, A.; KOSTADINOV, I.; KÜHL, H.S.; KURTH, F.; LASSECK, M.; LIEDKE, S.; LOSCH, F.; WILDERMANN, S. 2022. Towards a multisensor station for automated biodiversity monitoring. Basic and Applied Ecology. 59:105-138. https://doi.org/10.1016/j.baae.2022.01.003 |
type_driver |
info:eu-repo/semantics/article |
type_coar |
http://purl.org/coar/resource_type/c_6501 |
type_version |
info:eu-repo/semantics/publishedVersion |
type_coarversion |
http://purl.org/coar/version/c_970fb48d4fbd8a85 |
type_content |
Text |
publishDate |
2025-12-31 |
date_accessioned |
2024-12-31T00:00:00Z |
date_available |
2024-12-31T00:00:00Z |
url |
https://revistas.udca.edu.co/index.php/ruadc/article/view/2389 |
url_doi |
https://doi.org/10.31910/rudca.v27.n2.2024.2389 |
issn |
0123-4226 |
eissn |
2619-2551 |
doi |
10.31910/rudca.v27.n2.2024.2389 |
url4_str_mv |
https://revistas.udca.edu.co/index.php/ruadc/article/download/2389/3168 |
url2_str_mv |
https://revistas.udca.edu.co/index.php/ruadc/article/download/2389/3169 |
_version_ |
1821293703966228480 |
spelling |
Arquitectura de referencia para un laboratorio virtual como herramienta de sistematización de datos de biodiversidad AGRILLO, E.; FILIPPONI, F.; PEZZAROSSA, A.; CASELLA, L.; SMIRAGLIA, D.; ORASI, A.; ATTORRE, F.; TARAMELLI, A. 2021. Earth observation and biodiversity big data for forest habitat types classification and mapping. Remote Sensing. 13(7):1231. https://doi.org/10.3390/rs13071231 ALBERTI, J.; MASSONE, O. 2022. Tired of losing valuable data? Build your lab ecological database as a cornerstone for long-term approaches. Ecología Austral. 32(1):151-157. https://doi.org/10.25260/ea.22.32.1.0.1785 ARECHIGA, J.; ESQUIVEL, T.; CAMACHO, A.; DELGADO-RODRÍGUEZ, M.R.; VARGAS-GONZÁLEZ, P.; QUIJAS, S. 2022. Floristic and structural diversity of riparian vegetation along an urban-natural gradient of Pitillal River Jalisco, México. Revista U.D.C.A Actualidad & Divulgación Científica. 25(1):e2196. https://doi.org/10.31910/rudca.v25.nSupl.1.2022.2196 ANDJARWIRAWAN, J.; NOVIANUS, P.H.; KURNIAWAN, A. 2020. Computer science laboratory environment using docker. 1-6. Disponible desde Internet en: https://repository.petra.ac.id/18698/1/Publikasi1_98031_5989.pdf BART, A.; FAZLIEV, A.; GORDOV, E.; OKLADNIKOV, I.; PRIVEZENTSEV, A.; TITOV, A. 2018. Virtual research environment for regional climatic processes analysis: Ontological approach to spatial data systematization. Data Science Journal. 17:14 https://doi.org/10.5334/dsj-2018-014 BAYER, M. 2013. SQLAlchemy. En: Brown, A.; Wilson, G. (eds.), The architecture of open source applications. Volume II. University of California Berkeley p.291-314. Disponible desde Internet en: http://software-carpentry.org/2011/05/06/%0Ahttps://aosabook.org/en/sqlalchemy.html BEG, M.; TAKA, J.; KLUYVER, T.; KONOVALOV, A.; RAGAN-KELLEY, M.; THIERY, N.M.; FANGOHR, H. 2021. Using Jupyter for Reproducible Scientific Workflows. Computing in Science and Engineering. 23(2):36-46. https://doi.org/10.1109/MCSE.2021.3052101 BOCANEGRA-GONZÁLEZ, K.; GUILLEMIN, M.L. 2018. Guidelines for the restoration of the tropical timber tree Anacardium excelsum: first input from genetic data. Tree Genetics and Genomes. 14(59). https://doi.org/10.1007/s11295-018-1271-z BOROWIEC, M.L.; DIKOW, R.B.; FRANDSEN, P.B.; MCKEEKEN, A.; VALENTINI, G.; WHITE, A.E. 2022. Deep learning as a tool for ecology and evolution. In Methods in Ecology and Evolution. 13(8):1640-1660. https://doi.org/10.1111/2041-210X.13901 CARNEIRO, T.; DA NOBREGA, R.V.M.; NEPOMUCENO, T.; BIAN, G. BIN; DE ALBUQUERQUE, V.H.C.; FILHO, P.P.R. 2018. Performance Analysis of Google Colaboratory as a Tool for Accelerating Deep Learning Applications. IEEE 6:61677-61685. https://doi.org/10.1109/ACCESS.2018.2874767 CHAMBERLAIN, S.; FORKEL, R.; LEGIND, J.; HOEY, S.V.; DESMET, P.; NOÉ, N. 2022. pygbif. Disponible desde Internet en: https://github.com/gbif/pygbif CHAPMAN, A.D.; WIECZOREK, J.R. 2022. Guía de buenas prácticas de georreferenciación. https://doi.org/10.15468/doc-gg7h-s853 CHEN, F.; HU, Y. 2021. Agricultural and rural ecological management system based on big data in complex system. Environmental Technology and Innovation. 22:101390. https://doi.org/10.1016/j.eti.2021.101390 COKER, S.; ATNOOR, D.; BUCKNER, P. 2019. Building the foundation for lab of the future using AWS. Disponible desde Internet en: https://aws.amazon.com/blogs/industries/building-the-foundation-for-lab-of-the-future-using-aws/ COOPER, D.H.; NOONAN-MOONEY, K. 2013. Convention on Biological Diversity. En: Levin, S. Encyclopedia of Biodiversity. Segunda edición. Academic Press. p.306-319. https://doi.org/10.1016/B978-0-12-384719-5.00418-4 COORDINATE SYSTEMS WORLDWIDE. 2022. WGS 84 - WGS84 - World Geodetic System 1984. used in GPS. Disponible desde Internet en: https://epsg.io/4326 DAVENPORT, T.; PRUSAK, L. 1998. Working knowledge: how organizations manage what they know. Choice Reviews Online. 35(09):5167. https://doi.org/10.5860/choice.35-5167 DEVICTOR, V.; BENSAUDE-VINCENT, B. 2016. From ecological records to big data: the invention of global biodiversity. History and Philosophy of the Life Sciences. 38:13. https://doi.org/10.1007/s40656-016-0113-2 FOOD AND AGRICULTURE ORGANIZATION OF THE UNITED NATIONS, FAO. 2022. El tratado internacional sobre los recursos fitogenéticos para la alimentación y la agricultura. Disponible desde Internet en: http://extwprlegs1.fao.org/treaty/docs/tre000005S.pdf FORESTPLOTS.NET. 2020. ForestPlots.NET. Disponible desde Internet en: https://www.forestplots.net/ GARCÍA-LÓPEZ, Y.; GONZÁLEZ-SÁEZ, L.Y.; CABRERA-HERNÁNDEZ, A.J. 2022. Aplicaciones de aprendizaje automático para el análisis industrial de la provisión azucarera en Matanzas, Cuba. Revista U.D.C.A Actualidad & Divulgación Científica. 25(2):1-10. https://doi.org/10.31910/rudca.v25.n2.2022.2334 GLOBAL BIODIVERSITY INFOMATION FACILITY, GBIF. 2020. Global Biodiversity Information Facility. Disponible desde Internet en: https://www.gbif.org/ GLOBAL BIODIVERSITY INFOMATION FACILITY, GBIF. 2022. Introducción a GBIF Tabla de Contenido. Disponible desde Internet en: https://docs.gbif.org/course-introduction-to-gbif/es/introduccion-a-gbif.es.pdf GENTRY, A. 1996. A Field Guide the Families and Genera Woody Plants of Northwest South America (Colombia, Ecuador, Peru). University of Chicago. 920p. GIMÉNEZ, J.A. 2019. Buenas prácticas en el diseño de bases de datos. Revista Científica Internacional ARANDU UTIC. 6:193-210. GOOGLE. 2023. Google Colaboratory. Disponible desde Internet en: https://colab.research.google.com/ GRATTAROLA, F.; BOTTO, G.; DA ROSA, I.; GOBEL, N.; GONZÁLEZ, E.M.; GONZÁLEZ, J.; HERNÁNDEZ, D.; LAUFER, G.; MANEYRO, R.; MARTÍNEZ-LANFRANCO, J.A.; NAYA, D.E.; RODALES, A.L.; ZIEGLER, L.; PINCHEIRA-DONOSO, D. 2019. Biodiversidata: An open-access biodiversity database for Uruguay. Biodiversity Data Journal. 7:e36226 https://doi.org/10.3897/BDJ.7.e36226 GROUP ON EARTH OBSERVATION, GEO. 2015. Strategic Plan 2016-2025: Implementing GEOSS. Disponible desde Internet en: https://www.earthobservations.org/documents/GEO_Strategic_Plan_2016_2025_Implementing_GEOSS.pdf HAMPTON, S.E.; STRASSER, C.A.; TEWKSBURY, JJ.; GRAM, W.K.; BUDDEN, A.E.; BATCHELLER, A.L.; DUKE, C.S.; PORTER, J.H. 2013. Big data and the future of ecology. Frontiers in Ecology and the Environment. 11(3):156-162. https://doi.org/10.1890/120103 HERNANDEZ, L.; ÁLVAREZ-MARTÍNEZ, J.M.; GÓMEZ ALMARAZ, C.; SÁNCHEZ DE DIOS, R.; JÍMENEZ ALFARO, B.; ÁLVAREZ-TABOADA, F. 2022. Seguimiento de la biodiversidad en la era del Big Data. Ecosistemas. 31(3). https://doi.org/10.7818/ECOS.2450 HU, F.; CHE, S. 2019. Establishment of the Docker-Based Laboratory Environment. Open Access Library Journal. 6:e5519. https://doi.org/10.4236/oalib.1105519 INTERGOVERNMENTAL PANEL ON CLIMATE CHANGE, IPCC. 2019. El IPCC y el sexto ciclo de evaluación. Disponible desde Internet en: https://www.ipcc.ch/site/assets/uploads/2018/09/AC6_brochure_es.pdf JUPYTER PROJECT. 2022a. Jupyterhub: A multi-user version of the notebook designed for companies, classrooms and research labs. Disponible desde Internet en: https://jupyter.org/ JUPYTER PROJECT. 2022b. Jupyter Notebook: The classic notebook interface. Disponible desde Internet en: https://jupyter.org/ KOVÁCS, D.D.; REYES-MUÑOZ, P.; SALINERO-DELGADO, M.; MÉSZÁROS, V.I.; BERGER, K.; VERRELST, J. 2023. Cloud-free global maps of essential vegetation traits processed from the TOA Sentinel-3 catalogue in Google Earth Engine. Remote Sensing. 15(13). https://doi.org/10.3390/rs15133404 LESLIE, B. 2022. Pygpx. Disponible desde Internet en: https://github.com/fxdgear/pygpx LI, R.; RANIPETA, A.; WILSHIRE, J.; MALCZYK, J.; DUONG, M.; GURALNICK, R.; WILSON, A.; JETZ, W. 2021. A cloud-based toolbox for the versatile environmental annotation of biodiversity data. PLoS Biology. 19(11). https://doi.org/10.1371/journal.pbio.3001460 MCKINNEY, W. 2010. Data Structures for Statistical Computing in Python. Proceedings of the 9th Python in Science Conference. 1:56-61. https://doi.org/10.25080/majora-92bf1922-00a MELO, O.A.; VARGAS, R. 2003. Evaluación ecológica y silvicultural de ecosistemas boscosos. Universidad del Tolima, CRG, carder, corpocaldas, cortolima. Ibagué, Colombia. p.222 MUÑOZ, D.A.; DUEÑAS, M.C.; VILLEGAS, X.F.; MURCIA., U.G.; URIBE, C.; ARIAS, L.; SIERRA, P.; HERRERA, I.; CASTRO, W.; HERNÁNDEZ, V.; BENAVIDES, J. 2007. Sistema de información ambiental de Colombia-SIAC Marco Conceptual del SIAC: Aplicación del enfoque ecosistémico. 1-197. Disponible desde Internet en: https://www.siac.gov.co/portal/default.aspx MUSVUUGWA, T.; DLOMU, M.G.; ADEBOWALE, A. 2021. Big data in biodiversity science: A framework for engagement. Technologies. 9(3):60. https://doi.org/10.3390/technologies9030060 NAKAMURA, K.; HORI, K.; HIROSE, S. 2021. Algebraic fault analysis of sha-256 compression function and its application. Information. 12(10):433. https://doi.org/10.3390/info12100433 NOREÑA-P., A.; GONZÁLEZ MUÑOZ, A.; MOSQUERA-RENDÓN, J.; BOTERO, K.; CRISTANCHO, M.A. 2018. Colombia, an unknown genetic diversity in the era of Big Data. BMC Genomics. 19:859. https://doi.org/10.1186/s12864-018-5194-8 ORGANIZACIÓN DE LAS NACIONES UNIDAS, ONU. 1998. Protocolo de Kyoto de la convención marco de las naciones unidas sobre el cambio climático. 24p. ORGANIZACIÓN DE LAS NACIONES UNIDAS, ONU. 2018. La Agenda 2030 y los objetivos de desarrollo sostenible una oportunidad para América Latina y el Caribe. Naciones Unidas. 89p. Disponible desde Internet en: https://repositorio.cepal.org/bitstream/handle/11362/40155/24/S1801141_es.pdf PIMENTEL, J.F.; MURTA, L.; BRAGANHOLO, V.; FREIRE, J. 2019. A large-scale study about quality and reproducibility of jupyter notebooks. IEEE International Working Conference on Mining Software Repositories. 507-517. https://doi.org/10.1109/MSR.2019.00077 POSTGRESQL GLOBAL DEVELOPMENT GROUP. 2022. PostgreSQL 13.3. Disponible desde Internet en: https://www.postgresql.org PÖTTKER, M.; KIEHL, K.; JARMER, T.; TRAUTZ, D. 2023. Convolutional neural network maps plant communities in semi-natural grasslands using multispectral unmanned aerial vehicle imagery. Remote Sensing. 15(7). https://doi.org/10.3390/rs15071945 PYTHON SOFTWARE FOUNDATION. 2022. cpython. Disponible desde Internet en: https://github.com/python/cpython/tree/3.10 RACCOON, T.; PHAM, H. 2022. TablePlus. Disponible desde Internet en: https://tableplus.com/ ROBERTS, J.F.; MWANGI, R.; MUKABI, F.; NJUI, J.; NZIOKA, K.; NDAMBIRI, J.K.; BISPO, P.C.; ESPIRITO-SANTO, F.D.B.; GOU, Y.; JOHNSON, S.C.M.; LOUIS, V.; RODRIGUEZ-VEIGA, P.; TANSEY, K.; UPTON, C.; ROBB, C.; BALZTER, H. 2022. Pyeo: A Python package for near-real-time forest cover change detection from Earth observation using machine learning. Computers and Geosciences. 167:105192. https://doi.org/10.1016/j.cageo.2022.105192 R DEVELOPMENT CORE TEAM. 1993. R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. Disponible desde Internet en: https://www.R-project.org/ SENTERRE, B.; WAGNER, M. 2016. Standardization of data collection and creation of a biodiversity database: a PostgreSQL-PostGIS database for Island Conservation Society (Seychelles). https://doi.org/10.13140/RG.2.2.10370.27844 SHIN, D.H.; CHOI, M. 2015. Ecological views of big data: Perspectives and issues. Telematics and Informatics. 32(2):311-320. https://doi.org/10.1016/j.tele.2014.09.006 SIERRA, C.A.; MAHECHA, M.; POVEDA, G.; ÁLVAREZ-DÁVILA, E.; GUTIERREZ-VELEZ, V.H.; REU, B.; FEILHAUER, H.; ANÁYA, J.; ARMENTERAS, D.; BENAVIDES, A.M.; BUENDIA, C.; DUQUE, Á.; ESTUPIÑAN-SUAREZ, L.M.; GONZÁLEZ, C.; GONZALEZ-CARO, S.; JIMENEZ, R.; KRAEMER, G.; LONDOÑO, M.C.; ORREGO, S.A.; SKOWRONEK, S. 2017. Monitoring ecological change during rapid socio-economic and political transitions: Colombian ecosystems in the post-conflict era. Environmental Science and Policy. 76:40-49. https://doi.org/10.1016/j.envsci.2017.06.011 SISTEMA DE INFORMACIÓN SOBRE BIODIVERSIDAD DE COLOMBIA, SIB. 2017. Crear compartir transformar. Una guía con herramientas para comprender y participar en las dinámicas del acceso abierto. SiB Colombia. Disponible desde Internet en: http://www.sibcolombia.net/nosotros/acceso-abierto/ABC.pdf%0A SOLTIS, D.E.; SOLTIS, P.S. 2016. Mobilizing and integrating big data in studies of spatial and phylogenetic patterns of biodiversity. Plant Diversity. 38(6):264-270. https://doi.org/10.1016/j.pld.2016.12.001 SVOB, S.; ARROYO, J.P.; KALACSKA, M. 2014. The development of a forestry geodatabase for natural forest management plans in Costa Rica. Forest Ecology and Management. 327:240-250. https://doi.org/10.1016/j.foreco.2014.05.024 TRIANA-VALLEJOS, J.A.; BAILÓN-AIJÓN, C.; CIFUENTES-CASTELLANOS, J.M. 2022. Morphological description and molecular characterization of fungi associated with the root of Masdevallia coccinea Linden ex Lindl. Revista U.D.C.A Actualidad and Divulgacion Cientifica. 25(1):e2098. https://doi.org/10.31910/rudca.v25.n1.2022.2098 VAN ROSSUM, G. 1995. Python tutorial, Technical Report CS-R9526. Centrum Voor Wiskunde En Informatica (CWI). Disponible desde Internet en: https://ir.cwi.nl/pub/5007/05007D.pdf WÄGELE, J.W.; BODESHEIM, P.; BOURLAT, S.J.; DENZLER, J.; DIEPENBROEK, M.; FONSECA, V.; FROMMOLT, K.H.; GEIGER, M.F.; GEMEINHOLZER, B.; GLÖCKNER, F.O.; HAUCKE, T.; KIRSE, A.; KÖLPIN, A.; KOSTADINOV, I.; KÜHL, H.S.; KURTH, F.; LASSECK, M.; LIEDKE, S.; LOSCH, F.; WILDERMANN, S. 2022. Towards a multisensor station for automated biodiversity monitoring. Basic and Applied Ecology. 59:105-138. https://doi.org/10.1016/j.baae.2022.01.003 Universidad de Ciencias Aplicadas y Ambientales U.D.C.A Revista U.D.C.A Actualidad & Divulgación Científica https://revistas.udca.edu.co/index.php/ruadc/article/view/2389 Español http://creativecommons.org/licenses/by-nc/4.0 Juan Pablo Cuevas-Gonzalez, Fernando Fernandez-Mendez, Kelly T. Bocanegra-González - 2024 Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial 4.0. info:eu-repo/semantics/article Artículo de revista http://purl.org/coar/resource_type/c_6501 http://purl.org/coar/resource_type/c_1843 info:eu-repo/semantics/publishedVersion http://purl.org/coar/version/c_970fb48d4fbd8a85 info:eu-repo/semantics/openAccess http://purl.org/coar/access_right/c_abf2 Text application/pdf text/xml Núm. 2 , Año 2024 :Revista U.D.C.A Actualidad & Divulgación Científica. Julio-Diciembre Sistemas de información sobre biodiversidad El objetivo de esta investigación fue desarrollar un laboratorio virtual para la gestión de datos de biodiversidad en la región del Pacífico colombiano. La plataforma creada integra una base de datos relacional en PostgreSQL, el ecosistema JupyterHub y servicios de Amazon Web Services (AWS), con infraestructuras de datos globales. Se recopilaron 28.058 registros entre 2004 y 2022, destacando 44 familias, 119 géneros y 198 especies, incluyendo, especies maderables amenazadas, como Carapa guianensis, Humiriastrum procerum y Magnolia calimaensis. Entre las familias con mayores registros se encuentran Fabaceae, Arecaceae, Malvaceae y Moraceae, con 88 especies en total. La ejecución de rutinas de trabajo no excedió los 11 minutos en Python y R. Los servicios de AWS demostraron tiempos de respuesta de 200 ms y un tráfico de red de 0.1 GB/s. El inicio y cese de contenedores se realizó en 10 y 5 segundos, con un uso promedio de CPU y RAM ,del 80 y 75%, respectivamente. Además, se almacenaron 4 GB de objetos con tiempos de respuesta inferiores a 100 ms. Con la ayuda de las herramientas implementadas se logró prevenir errores en los datos dasométricos y taxonómicos, destacando la importancia del control de calidad y la validación de datos. La implementación de este laboratorio virtual permitió un manejo eficaz de grandes volúmenes de datos, facilitando la colaboración en tiempo real entre investigadores y proporcionando una herramienta escalable y flexible para el análisis de datos ecológicos, promoviendo una comprensión más completa de la biodiversidad en la región. Cuevas-Gonzalez, Juan Pablo Fernandez-Mendez, Fernando Bocanegra-González, Kelly T. Computación en la nube Conservación de la biodiversidad Curaduría Gestión de datos Publication 2 27 Curatorship Data management The objective of this research was to develop a virtual laboratory for the management of biodiversity data in the Colombian Pacific Region. The platform created integrates a relational database in PostgreSQL, the JupyterHub ecosystem, and Amazon Web Services (AWS) services with global data infrastructures. 28058 records were collected between 2004 and 2022, highlighting 44 families, 119 genera, and 198 species, including threatened timber species such as Carapa guianensis, Humiriastrum procerum, and Magnolia calimaensis. Among the families with the most significant number of records are Fabaceae, Arecaceae, Malvaceae, and Moraceae, which have 88 species. The execution of work routines was at most 11 minutes in Python, and R. AWS services demonstrated response times of 200 ms and network traffic of 0.1 GB/s. The start and stop of containers were carried out in 10 and 5 seconds, with an average CPU and RAM usage of 80% and 75%, respectively. In addition, 4 GB of objects were stored with response times of less than 100 ms. With the help of the implemented tools, it was possible to prevent errors in the dasometric and taxonomic data, highlighting the importance of quality control and data validation. The implementation of this virtual laboratory allowed an efficient management of large volumes of data, facilitating real-time collaboration between researchers and providing a scalable and flexible tool for the analysis of ecological data, promoting a more complete understanding of biodiversity in the region. Reference architecture for a virtual laboratory as a biodiversity data systematization tool Biodiversity information systems Biodiversity conservation Journal article Cloud computing 0123-4226 https://revistas.udca.edu.co/index.php/ruadc/article/download/2389/3168 10.31910/rudca.v27.n2.2024.2389 2619-2551 2025-12-31 2024-12-31T00:00:00Z https://doi.org/10.31910/rudca.v27.n2.2024.2389 2024-12-31T00:00:00Z https://revistas.udca.edu.co/index.php/ruadc/article/download/2389/3169 |