Wikipedia globalare än etablerade medier?
Posted 14 september 2008
on:- I: webb
- 3 Comments
Det är fantastiskt vad man kan få för sig när man har långtråkigt. Den här helgen har jag, förutom att vandra i Ngong Hills, hunnit göra något slags analys av svenska Wikipedias fokus på olika länder (inspirerad av att ha suttit och kollat på Global Attention Profiles, som mätt hur etablerade medier bevakar världen sedan 2003. Jag var nyfiken på hur Wikipedia står sig i jämförelse). Här kommer en lång post med resultatet:

Bilden anger en kombination om faktiskt antal artiklar / invånare och beräknat antal artiklar / invånare, se närmare förklaring nedan. Ju rödare färg, desto mer bevakat.
Mest bevakade länder är (inte otippat) de nordiska länderna samt en del ö-nationer och Vatikanstaten (på grund av det lilla antalet invånare). Därefter kommer många europeiska länder. Några av världens största länder kommer i botten på listan, bland annat Kina (på en extrem jumboplats) och Bangladesh. Även Nigeria och Indien ligger väldigt långt ner. Det är folkrika och politiskt viktiga länder som skulle behöva en insats (lämpligt nog har Projekt Kina nyligen startat, där jag redan har hunnit engagerat mig en del.)
Världens tio största länder
Världens tio största länder klarar sig så här (ordnade efter artiklar/invånare):
Land | Folkmängd | Artiklar | Jämförelsetal | 1000:e artikel |
---|---|---|---|---|
USA | 305 milj. | 11438 | 37,44 | Bill Lawrence |
Japan | 127 milj. | 1924 | 15,1 | Nagako |
Ryssland | 141 milj. | 1721 | 12,18 | Orjol |
Brasilien | 190 milj. | 650 | 3,42 | |
Indien | 1 130 milj. | 2553 | 2,26 | John Abraham |
Pakistan | 165 milj. | 239 | 1,45 | |
Indonesien | 234 milj. | 338 | 1,44 | |
Nigeria | 135 milj. | 164 | 1,21 | |
Bangladesh | 150 milj. | 125 | 0,83 | |
Kina | 1 329 milj. | 1056 | 0,79
Yongzheng-kejsaren | |
Antalet artiklar är en uppskattning, se nedan.
Länderna med flesta antal artiklar
Ordningen är ganska osäker efter som uppskattningen har stora felmarginaler (se nedan). USA toppar listan här, men när jag istället för ord nummer 1000 utgår från ord nummer 100 hamnar Sverige i topp och USA en bit ner.
Land | Folkmängd | Artiklar | Jämförelsetal |
---|---|---|---|
USA | 305 milj. | 11438 | 37,44 |
Sverige | 9 milj. | 10977 | 1215,55 |
Storbritannien | 62 milj. | 6641 | 108,46 |
Frankrike | 64 milj. | 4039 | 62,64 |
Tyskland | 82 milj. | 3747 | 45,48 |
Italien | 62 milj. | 3665 | 58,97 |
Danmark | 5 milj. | 3497 | 639,62 |
Norge | 5 milj. | 2951 | 637,43 |
Indien | 1 130 milj. | 2553 | 2,26 |
Finland | 5 milj. | 2459 | 469,48 |
Sämst representerade länder
I omvänd ordning – Kina är sämst representerat.
Land | Folkmängd | Artiklar | Jämförelsetal |
---|---|---|---|
Indien | 1 130 milj. | 2553 | 2,26 |
Nepal | 29 milj. | 61 | 2,11 |
Sudan | 39 milj. | 80 | 2,03 |
Pakistan | 165 milj. | 239 | 1,45 |
Indonesien | 235 milj. | 338 | 1,44 |
Etiopien | 77 milj. | 100 | 1,31 |
Nigeria | 135 milj. | 164 | 1,21 |
Burma | 47 milj. | 48 | 1,01 |
Bangladesh | 150 milj. | 125 | 0,83 |
Kina | 1 329 milj. | 1056 | 0,79 |
Hela listan över länder finns här
Så här gjorde jag:
Jag använde ett verktyg som heter Cat Scan, som räknar antalet artiklar i olika kategorier i Wikipedias kategorisystem. För varje land sökte jag efter varje artikel och kategori i landets huvudkategori och underkategorier, tre nivåer ner. Catscan ger de 1000 första resultatet. För länder med fler än tusen artiklar tog jag därför det 1000:e artikelnamnet, omvandlade det till ett tal som anger hur långt fram i alfabetisk ordning namnet kommer, och använde det talet för att beräkna det ungefärliga antalet artiklar i landets kategorier. Metoden har förstås sina svagheter, bland annat följande:
- Alla bokstäver är inte lika vanliga i alla länders artiklar (tänk andelen kinesiska artiklar som början med X, Y eller Z, jämfört med svenska).
- Historieartiklar kan ligga under tidigare statsbildningar, t.ex. Nord- / Sydkoreas historieartiklar under Korea, vilket kan minska antalet artiklar för vissa länder.
- Invånarantalet kan inkludera regioner som inte räknas in under landskategorierna, t.ex Mayotte under Frankrike.
- å,ä,ö har alla ersatts med ”Z”, för att enklare kunna omvandla bostäver till siffror, och jag har förutsatt att alfabetet har omkring 26 bokstäver
Jag försökte kontrollera tillförlitligheten, genom att använda samma metod på det hundrade uppslagsordet för varje land. Eftersom jag för de flesta länder (de som har mellan 100 och 1000 uppslagsord) visste det exakta antalet artiklar, kunde jag jämföra och konstatera att det beräknade antalet artiklar avvek omkring 25 procent från det faktiska. Eftersom skillnaderna länderna emellan när det gäller antal artiklar/invånare är flera tiopotenser, så verkade det vara en acceptabel avvikelse. Dessutom bör metoden vara mindre känslig för olika tillfälligheter när den används på den 1000:e artikeln istället.
Kartan är gjord med det fenomenala verktyget Gunnmap.
3 svar till "Wikipedia globalare än etablerade medier?"

Om du på CatScans resultat-URL hakar på &raw=on så slipper du 1000-artikelsbegränsningen. Alternativt kan du kryssa i ”CSV output” och få samma resultat.

15 september 2008 den 2:21
häftigt.