Nairobikoll!

Wikipedia globalare än etablerade medier?

Posted on: 14 september 2008

Det är fantastiskt vad man kan få för sig när man har långtråkigt. Den här helgen har jag, förutom att vandra i Ngong Hills, hunnit göra något slags analys av svenska Wikipedias fokus på olika länder (inspirerad av att ha suttit och kollat på Global Attention Profiles, som mätt hur etablerade medier bevakar världen sedan 2003. Jag var nyfiken på hur Wikipedia står sig i jämförelse). Här kommer en lång post med resultatet:

Bilden anger en kombination om faktiskt antal artiklar / invånare och beräknat antal artiklar / invånare, se närmare förklaring nedan. Ju rödare färg, desto mer bevakat.

Bilden anger en kombination om faktiskt antal artiklar / invånare och beräknat antal artiklar / invånare, se närmare förklaring nedan. Ju rödare färg, desto mer bevakat.

Mest bevakade länder är (inte otippat) de nordiska länderna samt en del ö-nationer och Vatikanstaten (på grund av det lilla antalet invånare). Därefter kommer många europeiska länder. Några av världens största länder kommer i botten på listan, bland annat Kina (på en extrem jumboplats) och Bangladesh. Även Nigeria och Indien ligger väldigt långt ner. Det är folkrika och politiskt viktiga länder som skulle behöva en insats (lämpligt nog har Projekt Kina nyligen startat, där jag redan har hunnit engagerat mig en del.)

Världens tio största länder

Världens tio största länder klarar sig så här (ordnade efter artiklar/invånare):

Land

Folkmängd

Artiklar

Jämförelsetal

1000:e artikel

USA

305 milj.

11438

37,44

Bill Lawrence

Japan

127 milj.

1924

15,1

Nagako
Ryssland

141 milj.

1721

12,18

Orjol
Brasilien

190 milj.

650

3,42

Indien

1 130 milj.

2553

2,26

John Abraham
Pakistan

165 milj.

239

1,45

Indonesien

234 milj.

338

1,44

Nigeria

135 milj.

164

1,21

Bangladesh

150 milj.

125

0,83

Kina

1 329 milj.

1056

0,79

Yongzheng-kejsaren

Antalet artiklar är en uppskattning, se nedan.

Länderna med flesta antal artiklar

Ordningen är ganska osäker efter som uppskattningen har stora felmarginaler (se nedan). USA toppar listan här, men när jag istället för ord nummer 1000 utgår från ord nummer 100 hamnar Sverige i topp och USA en bit ner.

Land

Folkmängd

Artiklar

Jämförelsetal

USA

305 milj.

11438

37,44
Sverige

9 milj.

10977

1215,55
Storbritannien

62 milj.

6641

108,46
Frankrike

64 milj.

4039

62,64
Tyskland

82 milj.

3747

45,48
Italien

62 milj.

3665

58,97
Danmark

5 milj.

3497

639,62
Norge

5 milj.

2951

637,43
Indien

1 130 milj.

2553

2,26
Finland

5 milj.

2459

469,48

Sämst representerade länder

I omvänd ordning – Kina är sämst representerat.

Land

Folkmängd

Artiklar

Jämförelsetal

Indien

1 130 milj.

2553

2,26
Nepal

29 milj.

61

2,11
Sudan

39 milj.

80

2,03
Pakistan

165 milj.

239

1,45
Indonesien

235 milj.

338

1,44
Etiopien

77 milj.

100

1,31
Nigeria

135 milj.

164

1,21
Burma

47 milj.

48

1,01
Bangladesh

150 milj.

125

0,83
Kina

1 329 milj.

1056

0,79

Hela listan över länder finns här

Så här gjorde jag:

Jag använde ett verktyg som heter Cat Scan, som räknar antalet artiklar i olika kategorier i Wikipedias kategorisystem. För varje land sökte jag efter varje artikel och kategori i landets huvudkategori och underkategorier, tre nivåer ner. Catscan ger de 1000 första resultatet. För länder med fler än tusen artiklar tog jag därför det 1000:e artikelnamnet, omvandlade det till ett tal som anger hur långt fram i alfabetisk ordning namnet kommer, och använde det talet för att beräkna det ungefärliga antalet artiklar i landets kategorier. Metoden har förstås sina svagheter, bland annat följande:

  • Alla bokstäver är inte lika vanliga i alla länders artiklar (tänk andelen kinesiska artiklar som början med X, Y eller Z, jämfört med svenska).
  • Historieartiklar kan ligga under tidigare statsbildningar, t.ex. Nord- / Sydkoreas historieartiklar under Korea, vilket kan minska antalet artiklar för vissa länder.
  • Invånarantalet kan inkludera regioner som inte räknas in under landskategorierna, t.ex Mayotte under Frankrike.
  • å,ä,ö har alla ersatts med ”Z”, för att enklare kunna omvandla bostäver till siffror, och jag har förutsatt att alfabetet har omkring 26 bokstäver

Jag försökte kontrollera tillförlitligheten, genom att använda samma metod på det hundrade uppslagsordet för varje land. Eftersom jag för de flesta länder (de som har mellan 100 och 1000 uppslagsord) visste det exakta antalet artiklar, kunde jag jämföra och konstatera att det beräknade antalet artiklar avvek omkring 25 procent från det faktiska. Eftersom skillnaderna länderna emellan när det gäller antal artiklar/invånare är flera tiopotenser, så verkade det vara en acceptabel avvikelse. Dessutom bör metoden vara mindre känslig för olika tillfälligheter när den används på den 1000:e artikeln istället.

Kartan är gjord med det fenomenala verktyget Gunnmap.

Annonser

3 svar to "Wikipedia globalare än etablerade medier?"

Om du på CatScans resultat-URL hakar på &raw=on så slipper du 1000-artikelsbegränsningen. Alternativt kan du kryssa i ”CSV output” och få samma resultat.

Tack Mike, ska göra om sökningen med exakta siffror senare!

Kommentera

Fyll i dina uppgifter nedan eller klicka på en ikon för att logga in:

WordPress.com Logo

Du kommenterar med ditt WordPress.com-konto. Logga ut / Ändra )

Twitter-bild

Du kommenterar med ditt Twitter-konto. Logga ut / Ändra )

Facebook-foto

Du kommenterar med ditt Facebook-konto. Logga ut / Ändra )

Google+ photo

Du kommenterar med ditt Google+-konto. Logga ut / Ändra )

Ansluter till %s

Om mig

Jag är frilansande journalist och konceptutvecklare.
Kontaktuppgifter: leowallentin.se

Kvitter

Arkiv

%d bloggare gillar detta: