Saznajte Kompatibilnost Po Znaku Zodijaka
Kako novinari mogu koristiti Geocommons za izradu interaktivnih karata
Ostalo
Prije nekoliko mjeseci, John Keefe je napisao Poynter.org How To o korištenju shape datoteka. Snaga shapefile-a, napisao je, je sposobnost upućivanja na regije umjesto na točke.
Ali što ako vaši podaci imaju točke (na primjer, adrese), a želite mapirati regije? Recimo, na primjer, imate adrese kršenja okoliša i želite pokazati koji kongresni okrugi imaju najviše kršenja. Morate pronaći način da povežete te točke u oblike. U ovom vodiču objasnit ću kako to učiniti.
Uzmimo primjer iz organizacije za koju radim, Sunlight Foundation. Imamo stranicu pod nazivom Podaci o transparentnosti , gdje korisnici mogu preuzeti podatke, od kojih neki uključuju adrese. Jedan takav skup podataka su podaci o kršenjima EPA-e. Idite na Transparentnost podataka, kliknite karticu 'EPA', a zatim potražite kršenja između 1. srpnja 2011. i 31. prosinca 2011. Podaci o transparentnosti vratit će oko 1300 zapisa. Kliknite golemi gumb 'Preuzmi podatke' da biste spremili zapise na svoje računalo.
Nakon što preuzmemo te podatke, otvorit ćemo ih u proračunskoj tablici. Vidjet ćete da jedan od stupaca uključuje adresu kršenja. (Napominjemo, neke ćelije u ovom stupcu uključuju više adresa, dok druge uopće nemaju adrese. Za naše potrebe eliminirat ćemo sve zapise s više adresa ili one bez ikakvih adresa. Možete pogledati ovu raniju priču, 'Kako novinari mogu koristiti Excel za organiziranje podataka za priče' ako vam je potrebna pomoć u tome.)
Također bismo trebali razdvojiti adresu na sastavne dijelove. Napravit ću nove stupce za grad, državu i ZIP.
(Možete se obratiti jednom od mojih ranijih Uputa - 'Kako novinari mogu koristiti regularne izraze za uparivanje nizova teksta' za pomoć u vezi s tim. Savjet, moj pronalazak/zamjena je bio da tražim:
|_+_|i zamijeni sa:
|_+_|To će ostaviti neke pogreške (kao što su brojevi apartmana u polju grada), koje ćemo ispraviti traženjem:
|_+_|i zamjena sa:
|_+_|Kada su podaci očišćeni, vratit ćemo ih u našu proračunsku tablicu. Zatim ćemo tu proračunsku tablicu izvesti kao .csv ili tekstualnu datoteku 'vrijednosti odvojene zarezima' koja vam daje datoteku koja izgleda ovako .)
Sada, da objedinimo ove adrese s kongresnim okruzima, koristit ćemo jedan od mojih omiljenih alata: GeoCommons . Ovaj ćemo postupak započeti izvozom gornje proračunske tablice kao CSV ili tekstualne datoteke 'vrijednosti odvojene zarezima'. Ovdje sam objavio primjer datoteke . Zatim ćemo taj CSV prenijeti izravno na GeoCommons.
Nakon učitavanja na GeoCommons, slijedit ćemo upute sve dok usluga od nas ne zatraži da 'pomognemo geolocirati' podatke. Daju nam se dvije opcije. Prvo, možemo povezati ili spojiti podatke s graničnim skupom podataka. Ako bismo odabrali ovu opciju, trebali bismo granične podatke u proračunskoj tablici. Takvi podaci mogu uključivati nazive okruga ili FIPS kodove, kongresne kodove okruga, popisne zapise i slično. Nemamo ta polja u našim podacima.
Druga opcija, 'geokodiranje na temelju adrese ili naziva mjesta', uzima informacije o lokaciji, kao što je adresa ulice, i pretvara ih u zemljopisnu dužinu i širinu. Ovo je opcija koju želimo odabrati.
Ovisno o zaglavlju u vašoj datoteci, GeoCommons može automatski prepoznati neka od polja lokacije. U suprotnom, morat ćemo pomoći GeoCommonsu da odredi koja polja sačinjavaju adresu. Da bismo to učinili, pomaknut ćemo se prema dolje do 'adresa lokacije' i odabrati 'uredi'. Tamo ćemo odabrati 'uličnu adresu'. Isto ćemo učiniti za grad, državu i poštanski broj. Zatim kliknite 'Nastavi'. (Napomena, GeoCommons može geokodirati samo do 5000 adresa po datoteci.) Također možete prilagoditi druge vrste podataka polja ako želite ili trebate.
Usluga će trebati neko vrijeme da dekodira adrese i pretvori ih u točke zemljopisne širine i dužine. Na kraju tog procesa, GeoCommons će nam dati do znanja koliko je dobro uspio geolocirati adrese. U mom testu geokodiranje je trajalo oko 10 minuta. (Ako ne želite čekati da se vaša datoteka geokodira, slobodno upotrijebite kopiju mojih podataka, koja je dostupna ovdje .) Naravno, možete koristiti i druge usluge za geokodiranje podataka u geografsku širinu i dužinu, a zatim prenijeti CSV koji sadrži ta polja — uz sva ostala — na GeoCommons.
Zatim ćemo iskoristiti jednu od najboljih značajki GeoCommonsa: sposobnost analize podataka. Ako prijeđemo na naš novo geokodirani skup podataka, tim značajkama možemo pristupiti klikom na gumb 'analiziraj' u gornjem desnom dijelu stranice.
Ovo donosi mnoštvo opcija. Trebali biste provesti neko vrijeme igrajući se s ovim alatima, ali za ovaj vodič ćemo odabrati drugi, 'Agregacija'. U rezultirajućem dijaloškom okviru trebamo odabrati granični skup. Pojavit će se prozor i tražit ćemo '111. kongresni okrug'. Tamo ćemo odabrati okruge koje sam prenio. Ove oblasti su u obliku shapefilea, što je vektorski bazirana metoda opisivanja područja.
Poništio sam odabir 'Zadrži prazne granice', jer ne želim prikazati okruge koji nemaju kršenja pravila.
GeoCommons će sada izvršiti svoju analizu, što je u mom slučaju trajalo oko 20 minuta. Dobivena datoteka se nalazi ovdje .
Iako možete mapirati rezultirajući skup podataka unutar GeoCommonsa, smatram da su karte usluge previše ograničavajuće. Na primjer, nemate potpunu kontrolu nad načinom na koji su formatirane informacije u opisima karte.
Iz tog razloga volim izvoziti kartu iz GeoCommonsa pomoću funkcije 'Preuzmi kao KML'. KML datoteka koju GeoCommons izvozi sadrži sve podatke, kao i informacije o granicama. Pomoću ove datoteke mogu se obratiti Google Fusion Tables, uvesti KML i imati potpunu kontrolu nad dizajnom, sjenčanjem, prozorom s informacijama i još mnogo toga. John Keefe je to već obradio u svom uvodu u shapefiles, tako da neću pokrivati isto tlo.
Iako obično ne koristim Geocommons za gotovu kartu, to je neprocjenjiv alat za stvaranje informativnih i zanimljivih karata, posebno kada se radi o granicama ili područjima.
Zabavite se istražujući i podijelite svoje iskustvo s GeoCommons i mapiranjem u odjeljku za komentare. Ako imate druge teme koje biste željeli obraditi/obratiti u ovoj seriji, javite nam.
Ova priča je dio Poyntera Hakovi/Hakeri serija s Kako koji se usredotočuju na ono što novinari mogu naučiti iz novih trendova u tehnologiji i novih tehnoloških alata.