17/04/2003
I en verden, hvor datadrevet forskning bliver stadig mere afgørende for folkesundheden, er adgang til pålidelige og opdaterede datasæt essentiel. For forskere, epidemiologer og sundhedsanalytikere, der arbejder med malaria, udgør Malaria Atlas Project (MAP) en uvurderlig ressource. For at bygge bro mellem denne massive databank og det udbredte statistiske programmeringssprog R, er malariaAtlas-pakken blevet udviklet. Dette værktøj fungerer som et kraftfuldt R-interface, der giver brugerne mulighed for problemfrit at hente, visualisere og analysere en bred vifte af malariometriske data. Denne artikel vil guide dig gennem funktionerne i malariaAtlas og vise, hvordan det kan transformere din tilgang til malariaforskning ved at gøre den mere effektiv, gennemsigtig og reproducerbar.

Hvad er malariaAtlas R-pakken?
MalariaAtlas er en specialiseret R-pakke designet til at give direkte og programmerbar adgang til de åbne databaser, der hostes af Malaria Atlas Project. Traditionelt kan det at finde, downloade og formatere data fra forskellige kilder være en tidskrævende proces, der er udsat for fejl. Denne pakke løser dette problem ved at tilbyde en række funktioner, der automatiserer datahentning og sikrer, at forskere altid arbejder med de mest aktuelle versioner af datasættene. Ved at integrere dataadgang direkte i et R-workflow, fremmer pakken reproducerbar forskning, hvor hver trin i dataanalysen kan dokumenteres og deles via kode.
Pakken giver adgang til fire primære datatyper:
- Parasitrate (PR) data: Georefererede undersøgelsespunkter, der måler forekomsten af malariaparasitter (Plasmodium falciparum og P. vivax) i befolkninger.
- Vektorforekomstdata: Observationer af de 41 dominerende malarioverførende myggearter.
- Administrative grænser (Shapefiles): Geografiske filer, der definerer nationale og subnationale grænser, hvilket er afgørende for rumlig analyse og kortlægning.
- Modellerede raster-overflader: En stor samling af gitterbaserede datasæt, der repræsenterer forudsigelser af forskellige malaria-relaterede målinger, såsom sygdomsforekomst, interventionsdækning og miljøfaktorer.
Kom Godt i Gang: Installation og Grundlæggende Funktioner
Det første skridt for at bruge pakken er installation. Den stabile version kan nemt installeres direkte fra CRAN (Comprehensive R Archive Network) med en simpel kommando i din R-konsol:
install.packages("malariaAtlas")
For brugere, der ønsker de seneste opdateringer og fejlrettelser, kan udviklingsversionen installeres fra GitHub. Når pakken er installeret, kan du begynde at udforske de tilgængelige data ved hjælp af `list*` funktionerne. Disse funktioner er designet til at give et overblik over, hvilke data der er tilgængelige for download, før du henter store datasæt.
Udforskning af Tilgængelige Data
Før du downloader data, er det en god praksis at undersøge, hvad der er tilgængeligt. Dette kan gøres med følgende funktioner:
listPRPointVersions(): Viser tilgængelige versioner af parasitrate-datasættet.listVecOccPointVersions(): Viser tilgængelige versioner af vektorforekomst-datasættet.listShpVersions(): Viser tilgængelige versioner af shapefile-datasættet.listPRPointCountries(): Lister de lande, hvor der findes PR-data.listVecOccPointCountries(): Lister de lande, hvor der findes data om vektorforekomst.listSpecies(): Lister de tilgængelige myggearter i vektor-databasen.listRaster(): Returnerer en omfattende data.frame med information om alle tilgængelige raster-overflader, herunder deres `dataset_id`, titel, abstrakt og tidsperiode.
Disse funktioner giver dig mulighed for at specificere versioner i dine datahentningskald, hvilket sikrer fuld reproducerbarhed af din analyse.
Download og Visualisering af Malariadata
Når du har identificeret de data, du har brug for, kan du bruge `get*` funktionerne til at downloade dem. Hver `get*` funktion er skræddersyet til en specifik datatype og returnerer data i et format, der er let at arbejde med i R. Derudover har pakken indbyggede `autoplot` metoder, som gør det muligt hurtigt at visualisere de downloadede data ved hjælp af `ggplot2`-pakken.
Parasitrate-undersøgelsespunkter (PR)
Funktionen getPR() downloader PR-data for et specificeret geografisk område (land, kontinent eller brugerdefineret omfang) og for en bestemt Plasmodium-art (Pf, Pv eller begge). Dataene returneres som en data.frame, der indeholder detaljerede oplysninger som latitude, longitude, antal undersøgte, antal positive, aldersgruppe og undersøgelsesår. For eksempel, for at hente alle PR-data for Madagascar, kan du bruge:
MDG_pr_data <- getPR(country = "Madagascar", species = "both")
For hurtigt at visualisere placeringen af disse punkter kan du bruge:
autoplot(MDG_pr_data)
Vektorforekomstpunkter
Tilsvarende henter getVecOcc() data om forekomsten af malariamyg. Du kan specificere et land og eventuelt en bestemt art. For eksempel, for at få alle vektordata fra Myanmar:
MMR_vec_data <- getVecOcc(country = "Myanmar")
Visualisering er lige så enkel med autoplot(MMR_vec_data), som kan opdeles efter art for et mere detaljeret overblik.
Administrative Grænser og Rastere
Geografiske data er rygraden i rumlig epidemiologi. getShp() downloader shapefiles for specificerede lande og administrative niveauer (f.eks. nationalt, regionalt). Disse returneres som 'simple feature' (sf) objekter, som er standarden for rumlige data i R.
For at downloade modellerede overflader bruges getRaster(). Du skal angive et `dataset_id` (som findes via listRaster()) og et geografisk område (enten et shapefile-objekt eller en bounding box). Dette er ekstremt nyttigt for at hente covariate-data til geostatistisk modellering. For eksempel, for at hente den forudsagte P. falciparum prævalens for Madagaskar i 2013:
MDG_shp <- getShp(ISO = "MDG")MDG_PfPR <- getRaster(dataset_id = "Explorer__2020_Global_PfPR", shp = MDG_shp, year = 2013)
Disse rastere kan derefter let plottes med autoplot(MDG_PfPR).

Sammenligning af Nøglefunktioner
For at give et klart overblik er her en tabel, der sammenligner de primære datahentningsfunktioner i malariaAtlas-pakken.
| Formål | Funktion | Eksempel på Anvendelse | Returnerer |
|---|---|---|---|
| Hent data for parasitrate | getPR() | getPR(country = "Nigeria", species = "Pf") | En `data.frame` med PR-undersøgelsespunkter |
| Hent data for vektorforekomst | getVecOcc() | getVecOcc(continent = "Asia") | En `data.frame` med vektorobservationspunkter |
| Hent administrative grænser | getShp() | getShp(ISO = "MDG", admin_level = "admin1") | Et `sf` objekt (shapefile) |
| Hent modellerede raster-overflader | getRaster() | getRaster(dataset_id = "...", year = 2015) | Et `SpatRaster` objekt |
Kombineret Visualisering og Analyse
Den sande styrke ved malariaAtlas ligger i dens evne til at integrere forskellige datatyper i en enkelt analyse. En forsker kan for eksempel downloade PR-punkter og overlejre dem på et kort over forudsagt malariaforekomst for at validere eller sammenligne model-output med rådata. Ved at bruge `ggplot2` kan man nemt kombinere `autoplot` output med yderligere `geom_point` lag for at skabe informative og publiceringsklare figurer. Dette giver mulighed for komplekse analyser, såsom at bygge en rumlig model, hvor PR-data fungerer som respons-variabel, og de downloadede rastere (f.eks. temperatur, nedbør, rejsetid til byer) fungerer som prædiktor-variable (covariates). Denne integrerede tilgang er afgørende for moderne epidemiologisk forskning.
Ofte Stillede Spørgsmål (FAQ)
Hvad er Malaria Atlas Project (MAP)?
Malaria Atlas Project er et non-profit initiativ, der har til formål at indsamle, kuratere og dele globale rumlige data om malaria. Deres arbejde understøtter forskning og politiske beslutninger for at bekæmpe malaria på verdensplan.
Er dataene i malariaAtlas gratis at bruge?
Ja, pakken giver et R-interface til åbent tilgængelige data. Det er dog god videnskabelig praksis og ofte et krav at citere de originale datakilder, som leveres sammen med de downloadede data, samt selve malariaAtlas-pakken i dine publikationer.
Hvilke færdigheder kræves for at bruge pakken?
Et grundlæggende kendskab til R-programmeringssproget er nødvendigt. Pakken er designet til at være brugervenlig for dem, der allerede er fortrolige med R's syntaks, især data.frames og rumlige objekter.
Hvor ofte opdateres dataene?
Da malariaAtlas henter data direkte fra MAP's servere, har du adgang til de mest opdaterede versioner, så snart de bliver frigivet af MAP. Dette sikrer, at din forskning altid er baseret på den nyeste tilgængelige viden.
Afslutningsvis er malariaAtlas-pakken et uundværligt værktøj for enhver, der arbejder med malaria-data i R. Den forenkler dataadgang, fremmer reproducerbarhed og muliggør sofistikerede rumlige analyser, hvilket i sidste ende bidrager til den globale indsats for at forstå og udrydde malaria.
Hvis du vil læse andre artikler, der ligner Malaria Atlas: Din adgang til malariadata i R, kan du besøge kategorien Sundhed.
