Wikinformetria


En un article de finals del 2022 [1] els seus autors Arroyo-Machado, Torres-Salinas i Costas encunyen el nou terme Wikinformetrics, per referir-se a l’àrea d’estudi on la informetria s’aplica sobre la Wikipedia. El podríem traduir per Wikinformetria (o Viquinformetria).

La bola de wikipedia

[Imatge de: Michael Morgenstern for  the Chronicle Review

Si la informetria és l’estudi quantitatiu de la informació, la Wikinformetria es podria definir com l’estudi quantitatiu de la informació que conté la Wikipedia. Per exemple, les entrades de Wikipedia inclouen en principi la bibliografia en què es basa la seva elaboració i molts documents d’aquestes bibliografies són publicacions científiques. De manera que es pot fer, per una banda, un seguiment informètric de la solidesa de les entrades atenent a la seva bibliografia Per l’altra, es pot avaluar la difusió d’un article a partir de les seves mencions  en diferents entrades de Wikipedia. I a més,  es pot estudiar la qualitat d’una entrada de Wikipedia en funció de les vegades que és enllacada per altres entrades.
En aquets mesures hi tenen un destacat paper a jugar les altmètriques, el rastreig de la informació científica a les xarxes socials i altres publicacions electròniques. Entre elles la mateixa Wikipedia. Nosaltres havíem definit aquests seguiments de les almètriques a Wikipedia con Wikialtmètriques o Viquialtmètriques, tal i com s’explica en altres entrades d’aquest mateix blog [2] i [3]. Ara el nou terme Wikinformetria engloba el nostre Wikialtmetria i redefineix millor aquesta àrea d’estudi.

El títol de l’article [1] el podríem traduir com:
Wikinformetria : construcció i descripció d’un conjunt de dades obertes de gràfics de coneixement de la Wikipedia amb finalitats informètriques.

I el resum de l’article el podríem traduir com:
“La Wikipedia és un dels llocs web més visitats del món i també és un tema freqüent de recerca científica. Tanmateix, les possibilitats analítiques de la informació de la Wikipedia encara no s’han analitzat considerant alhora un gran volum de pàgines i atributs. L’objectiu principal d’aquest treball és oferir un marc metodològic i un gràfic de coneixement obert per a l’estudi informètric a gran escala de la Wikipedia. Les característiques de les pàgines de la Wikipedia es comparen amb les de les publicacions científiques per destacar les (des)similaritats entre els dos tipus de documents. A partir d’aquesta comparació, s’exploren les diferents possibilitats analítiques que ofereix la Wikipedia i les seves diverses fonts de dades, oferint finalment un conjunt de mètriques destinades a estudiar la Wikipedia des de diferents dimensions analítiques. Paral·lelament, es va construir (i compartir) un conjunt complet de dades de la Wikipedia en anglès seguint un model relacional. Finalment, es realitza un estudi de cas descriptiu sobre el conjunt de dades de la Wikipedia en anglès per il·lustrar el potencial analític del gràfic de coneixement i les seves mètriques.”

L’article comença fent una revisió de publicacions que facin un estudi informètric sobre les referències bibliogràfiques incloses en pàgines de Wikipedia. I es planteja els següent objectiu principal:
“Explorar el valor de recerca de la Wikipedia des d’una perspectiva informètrica, proporcionant, finalment, un gràfic de coneixement complet de la Wikipedia”
I tres objectius específics:

  1. Objectiu teòric: Establir un marc per a l’anàlisi de la Wikipedia, mitjançant l’exploració de les característiques informètriques de les pàgines de la Wikipedia (composició, categories, fonts, recollida de dades, etc..) i proposant un conjunt de mètriques d’inspiració informètrica (Wikinformètrica) per al seu estudi quantitatiu.
  2. Objectiu instrumental: Crear un gran gràfic de coneixement obert de la Wikipedia.
  3. Objectiu aplicat: Realitzar un estudi quantitatiu descriptiu de la mètrica de la Wikipedia

Repassem els 15 articles seleccionats en la revisió inicial com a principals estudis, qualitatius i quantitatius,  sobre referències bibliogràfiques incloses en entrades de Wikipedia

Citació article Tipus estudi Aplicació Aproximació metodològica
Mühlhauser and Oser (Mühlhauser & Oser, 2008) Qualitatiu Anàlisi de qualitat i contingut Llista de comprovacioó
Candelario et al. (Candelario et al., 2017) Qualitatiu  Anàlisi de qualitat i contingut Sistema de puntuació
Kaffee and Elsahar (Kaffee & Elsahar, 2021) Qualitatiu Anàlisi  del procés de citació dels editors Enquestes i entrevistes
Nielsen (Nielsen, 2007) Quantitatiu Anàlisi de models de citació Estadística descriptiva
Kousha and Thelwall (Kousha & Thelwall, 2017) Quantitatiu Avaluació de l’impacte de les referències Estadística descriptiva
Lewoniewski et al. (Lewoniewski, Węcel, & Abramowicz, 2017) Quantitatiu Cobertura de les referències a través dels llenguatges Estadística descriptiva
Maggio et al. (Maggio, Willinsky et al., 2017) Quantitatiu Anàlisi de models de citació Estadística descriptiva
Pooladian and Borrego (Pooladian & Borrego, 2017)
[Mencionat en aquest blog [4]
Quantitatiu Avaluació de l’impacte de les referències Anàlisi descriptiu
Jemielniak et al. (Jemielniak, Masukume, & Wilamowski, 2019) Quantitatiu Rànking de revistes per citacions Anàlisi de citacions
Torres-Salinas et al. (Torres-Salinas, Romero-Frías, & Arroyo-Machado, 2019) Quantitatiu Mapatge d’estructures de coneixement Anàlisi de cocitacions
Arroyo-Machado et al. (Arroyo-Machado et al., 2020) Quantitatiu Mapatge d’estructures de coneixement Anàlisi dde cocitacions
Colavizza (Colavizza, 2020) Quantitatiu Cobertura de publicacions Modelització temàtica i anàlisi de regressió
Nicholson et al. (Nicholson, Uppala et al., 2021) Quantitatiu Revisió de la qualitat de les citacions Modelització de classificacions
Singh et al. (Singh et al., 2020) Quantitatiu Creació de conjunts de dades Mineria de textos
Zagorova et al. (Zagorova et al., 2022)
(Mencionat en aquest blog [5])
Quantitatiu Creació de conjunts de dades Mineria de textos

Versió reduïda Table 1, article [1] pàg. 933

Per estudiar els articles o entrades de Wikipedia des d’una vessant informètrica es pot fer una analogia entre aquestes entrades i les publicacions científiques

 

 

Taula 2, art. [1] pàg 938

Això ens permet comparar les principals característiques de les entrades Wikipedia i les publicacions científiques

I ens permet també fer un diagrama amb els principals elements involucrats en la creació i edició de les entrades de Wikipedia

Figura 1, art. [1] Pàg. 938

Les pàgines de Wikipedia segueixen un control de qualitat  transparent que s’ajusta a l’esquema de gradació següent:

Taula 3, art [1] Pàg 940

I d’aquí arribem a poder llistar i descriure les mètriques obtingudes per a les entrades de Wikipedia des d’una dimensió analítica

Taula 5, art. [1] pàg 948

Aquesta taula detalla les magnituds de les entrades de Wikipedia susceptibles de ser mesurades informètricament, les wikinformètriques.
Traduim-la.

Metric Mètrica Descripció
Editorts Editors Nombre d’editors que han editat una entrada Wikipedia
Edits Edicions Nombre total d’edicions que s’han fet per a una entrada de Wikipedia
Linked Entrades enllaçades Nombre d’entrades de Wikipedia que enllacen amb una entrada donada
Links Enllaços Nombre d’enllaços interns  que té una entrada ded Wikipedia cap a altres entrades
Age Temps Nombre d’anys que han passat ds de la creació dd la pàgina o des de la seva recol·lecció
Length Amplitud (Mesura) Mesura en bytes de l’entrada de Wikipedia
Talkers Conversants Nombre d’editors que han editat una pàgina de conversa de Wikipedia
Talks Converses Nombre total d’edicions que s’han fet per a una pàgina de conversa de Wikipedia
Views Vistes Nombre diari de visualitzacions d’una entrada de Wikipedia
References Referències Nombre d’elements llistats en les referències d’una entrada ded Wikipedia
Pub. referenced Publicacions referenciades Nombre de publicacions referenciades
URLs URLs Nombre d’enllaços externs que apunten a una entrada de Wikipedia

 

Finalment ja es pot dissenyar el gràfic de coneixement de Wikipedia

 

Figura 3, art [1] Pàg. 949

La part final  de l’article  és un cas pràctic d’anàlisi informètrica aplicada sobre la wikipedia versió anglesa.
La representació del resultat final seria:

Figura 4, art. [1] Pàg. 947

La mitjana de les mètriques de les entrades de Wikipedia diferenciant per la qualitat assignada des de cada projecte,

A les fileres tenim  les mètriques de la Wikipedia (wikinformètriques) (Taula 5) i a les columnes l’esquema de gradació de la qualitat de les  pàgines de Wikipedia (Taula 3)

Es tracta d’un exemple d’aplicació a l’engròs, amb moltes dades, i amb el suggeriment de que es facin càlculs i estudis semblants en wikipedies en altres versions idiomàtiques per comparar resultats

 

Bibliografia

[1] Arroyo-Machado, Wenceslao; Torres-Salinas, Daniel; Costas, Rodrigo. Wikinformetrics : Construction and description of an open Wikipedia knowledge graph data set for informetric purposes. Quantitative Science Studies. 2022; 3 (4), 931-952 https://doi.org/10.1162/qss_a_00226

[2] Altmètriques i Viquipèdia, una amistat interessada 2015 Ambidireccional (blog en proves) 15/12/2015

[3] Wikialtmètrics 2020 Ambidireccional. 24/01/2021

[4] Serveixen les citacions de la Viquipèdia per avaluar la recerca?. Ambidireccional. 22/05/2018

[5] Actualitzant referències a Wikipedia. Ambidireccional. 29/09/2022

Leave a comment

L'adreça electrònica no es publicarà. Els camps necessaris estan marcats amb *