Nairobikoll!

Wikipedia globalare än etablerade medier?

Posted on: 14 september 2008

Det är fantastiskt vad man kan få för sig när man har långtråkigt. Den här helgen har jag, förutom att vandra i Ngong Hills, hunnit göra något slags analys av svenska Wikipedias fokus på olika länder (inspirerad av att ha suttit och kollat på Global Attention Profiles, som mätt hur etablerade medier bevakar världen sedan 2003. Jag var nyfiken på hur Wikipedia står sig i jämförelse). Här kommer en lång post med resultatet:

Bilden anger en kombination om faktiskt antal artiklar / invånare och beräknat antal artiklar / invånare, se närmare förklaring nedan. Ju rödare färg, desto mer bevakat.

Bilden anger en kombination om faktiskt antal artiklar / invånare och beräknat antal artiklar / invånare, se närmare förklaring nedan. Ju rödare färg, desto mer bevakat.

Mest bevakade länder är (inte otippat) de nordiska länderna samt en del ö-nationer och Vatikanstaten (på grund av det lilla antalet invånare). Därefter kommer många europeiska länder. Några av världens största länder kommer i botten på listan, bland annat Kina (på en extrem jumboplats) och Bangladesh. Även Nigeria och Indien ligger väldigt långt ner. Det är folkrika och politiskt viktiga länder som skulle behöva en insats (lämpligt nog har Projekt Kina nyligen startat, där jag redan har hunnit engagerat mig en del.)

Världens tio största länder

Världens tio största länder klarar sig så här (ordnade efter artiklar/invånare):

Land Folkmängd Artiklar Jämförelsetal 1000:e artikel

USA 305 milj. 11438 37,44 Bill Lawrence

Japan 127 milj. 1924 15,1 Nagako
Ryssland 141 milj. 1721 12,18 Orjol
Brasilien 190 milj. 650 3,42
Indien 1 130 milj. 2553 2,26 John Abraham
Pakistan 165 milj. 239 1,45
Indonesien 234 milj. 338 1,44
Nigeria 135 milj. 164 1,21
Bangladesh 150 milj. 125 0,83
Kina 1 329 milj. 1056 0,79 Yongzheng-kejsaren

Antalet artiklar är en uppskattning, se nedan.

Länderna med flesta antal artiklar

Ordningen är ganska osäker efter som uppskattningen har stora felmarginaler (se nedan). USA toppar listan här, men när jag istället för ord nummer 1000 utgår från ord nummer 100 hamnar Sverige i topp och USA en bit ner.

Land Folkmängd Artiklar Jämförelsetal

USA 305 milj. 11438 37,44
Sverige 9 milj. 10977 1215,55
Storbritannien 62 milj. 6641 108,46
Frankrike 64 milj. 4039 62,64
Tyskland 82 milj. 3747 45,48
Italien 62 milj. 3665 58,97
Danmark 5 milj. 3497 639,62
Norge 5 milj. 2951 637,43
Indien 1 130 milj. 2553 2,26
Finland 5 milj. 2459 469,48

Sämst representerade länder

I omvänd ordning – Kina är sämst representerat.

Land Folkmängd Artiklar Jämförelsetal

Indien 1 130 milj. 2553 2,26
Nepal 29 milj. 61 2,11
Sudan 39 milj. 80 2,03
Pakistan 165 milj. 239 1,45
Indonesien 235 milj. 338 1,44
Etiopien 77 milj. 100 1,31
Nigeria 135 milj. 164 1,21
Burma 47 milj. 48 1,01
Bangladesh 150 milj. 125 0,83
Kina 1 329 milj. 1056 0,79

Hela listan över länder finns här

Så här gjorde jag:

Jag använde ett verktyg som heter Cat Scan, som räknar antalet artiklar i olika kategorier i Wikipedias kategorisystem. För varje land sökte jag efter varje artikel och kategori i landets huvudkategori och underkategorier, tre nivåer ner. Catscan ger de 1000 första resultatet. För länder med fler än tusen artiklar tog jag därför det 1000:e artikelnamnet, omvandlade det till ett tal som anger hur långt fram i alfabetisk ordning namnet kommer, och använde det talet för att beräkna det ungefärliga antalet artiklar i landets kategorier. Metoden har förstås sina svagheter, bland annat följande:

  • Alla bokstäver är inte lika vanliga i alla länders artiklar (tänk andelen kinesiska artiklar som början med X, Y eller Z, jämfört med svenska).
  • Historieartiklar kan ligga under tidigare statsbildningar, t.ex. Nord- / Sydkoreas historieartiklar under Korea, vilket kan minska antalet artiklar för vissa länder.
  • Invånarantalet kan inkludera regioner som inte räknas in under landskategorierna, t.ex Mayotte under Frankrike.
  • å,ä,ö har alla ersatts med ”Z”, för att enklare kunna omvandla bostäver till siffror, och jag har förutsatt att alfabetet har omkring 26 bokstäver

Jag försökte kontrollera tillförlitligheten, genom att använda samma metod på det hundrade uppslagsordet för varje land. Eftersom jag för de flesta länder (de som har mellan 100 och 1000 uppslagsord) visste det exakta antalet artiklar, kunde jag jämföra och konstatera att det beräknade antalet artiklar avvek omkring 25 procent från det faktiska. Eftersom skillnaderna länderna emellan när det gäller antal artiklar/invånare är flera tiopotenser, så verkade det vara en acceptabel avvikelse. Dessutom bör metoden vara mindre känslig för olika tillfälligheter när den används på den 1000:e artikeln istället.

Kartan är gjord med det fenomenala verktyget Gunnmap.

3 svar to "Wikipedia globalare än etablerade medier?"

Om du på CatScans resultat-URL hakar på &raw=on så slipper du 1000-artikelsbegränsningen. Alternativt kan du kryssa i ”CSV output” och få samma resultat.

Tack Mike, ska göra om sökningen med exakta siffror senare!

Kommentera

Fyll i dina uppgifter nedan eller klicka på en ikon för att logga in:

WordPress.com Logo

Du kommenterar med ditt WordPress.com-konto. Logga ut / Ändra )

Twitter-bild

Du kommenterar med ditt Twitter-konto. Logga ut / Ändra )

Facebook-foto

Du kommenterar med ditt Facebook-konto. Logga ut / Ändra )

Google+ photo

Du kommenterar med ditt Google+-konto. Logga ut / Ändra )

Ansluter till %s

Om mig

Jag är frilansande journalist och konceptutvecklare.
Kontaktuppgifter: leowallentin.se

Kvitter

Arkiv

%d bloggare gillar detta: