
Piirtelen uutta versiota kahden vuoden takaisesta kartasta.
Tällä kertaa ideana on, että haetaan jokaisen kaupungin osalta Wikitravel-sivustolta ensimmäisenä kaupungin kohdalta löytyvä adjektiivi ja sitä seuraavat substantiivit. Näistä sitten piirretään kartta. Sivujen hakemisen tein tällä kertaa Pythonilla ja adjektiivien tunnistamiseen käytin mainiota NLTK-kirjastoa.
NLTK:n käyttöön on hyvä tutoriaali Stream Hacker -blogissa ja myös NLTK:n oma Taggers-opas on hyvä.
En ole vielä aivan tyytyväinen tähän versioon kartasta. Katsotaan jos vaikka jaksaisin vielä parannella sitä fontin, kernauksen ja teksteissä olevien pikkubugien osalta. Myös ylösalaisin oleville teksteille ja pitkille riveille voisi tehdä jotain.
Tällä kertaa dataa on kerätty 2445 suurimmasta kaupungista Geonames-datajoukossa.
Tähän liittyen verkossa tuli vastaan Dorothy Gambrellin kartat Craigslist Missed Connections -palstalta. Gambrellin mainioita visualisointeja on Very Small Array -blogissa, mutta tunnetumpi lienee hänen Cat and Girl -sarjakuvansa.