En un article de finals del 2022 [1] els seus autors Arroyo-Machado, Torres-Salinas i Costas encunyen el nou terme Wikinformetrics, per referir-se a l’àrea d’estudi on la informetria s’aplica sobre la Wikipedia. El podríem traduir per Wikinformetria (o Viquinformetria).
[Imatge de: Michael Morgenstern for the Chronicle Review
Si la informetria és l’estudi quantitatiu de la informació, la Wikinformetria es podria definir com l’estudi quantitatiu de la informació que conté la Wikipedia. Per exemple, les entrades de Wikipedia inclouen en principi la bibliografia en què es basa la seva elaboració i molts documents d’aquestes bibliografies són publicacions científiques. De manera que es pot fer, per una banda, un seguiment informètric de la solidesa de les entrades atenent a la seva bibliografia Per l’altra, es pot avaluar la difusió d’un article a partir de les seves mencions en diferents entrades de Wikipedia. I a més, es pot estudiar la qualitat d’una entrada de Wikipedia en funció de les vegades que és enllacada per altres entrades.
En aquets mesures hi tenen un destacat paper a jugar les altmètriques, el rastreig de la informació científica a les xarxes socials i altres publicacions electròniques. Entre elles la mateixa Wikipedia. Nosaltres havíem definit aquests seguiments de les almètriques a Wikipedia con Wikialtmètriques o Viquialtmètriques, tal i com s’explica en altres entrades d’aquest mateix blog [2] i [3]. Ara el nou terme Wikinformetria engloba el nostre Wikialtmetria i redefineix millor aquesta àrea d’estudi.
El títol de l’article [1] el podríem traduir com:
Wikinformetria : construcció i descripció d’un conjunt de dades obertes de gràfics de coneixement de la Wikipedia amb finalitats informètriques.
I el resum de l’article el podríem traduir com:
“La Wikipedia és un dels llocs web més visitats del món i també és un tema freqüent de recerca científica. Tanmateix, les possibilitats analítiques de la informació de la Wikipedia encara no s’han analitzat considerant alhora un gran volum de pàgines i atributs. L’objectiu principal d’aquest treball és oferir un marc metodològic i un gràfic de coneixement obert per a l’estudi informètric a gran escala de la Wikipedia. Les característiques de les pàgines de la Wikipedia es comparen amb les de les publicacions científiques per destacar les (des)similaritats entre els dos tipus de documents. A partir d’aquesta comparació, s’exploren les diferents possibilitats analítiques que ofereix la Wikipedia i les seves diverses fonts de dades, oferint finalment un conjunt de mètriques destinades a estudiar la Wikipedia des de diferents dimensions analítiques. Paral·lelament, es va construir (i compartir) un conjunt complet de dades de la Wikipedia en anglès seguint un model relacional. Finalment, es realitza un estudi de cas descriptiu sobre el conjunt de dades de la Wikipedia en anglès per il·lustrar el potencial analític del gràfic de coneixement i les seves mètriques.”
L’article comença fent una revisió de publicacions que facin un estudi informètric sobre les referències bibliogràfiques incloses en pàgines de Wikipedia. I es planteja els següent objectiu principal:
“Explorar el valor de recerca de la Wikipedia des d’una perspectiva informètrica, proporcionant, finalment, un gràfic de coneixement complet de la Wikipedia”
I tres objectius específics:
- Objectiu teòric: Establir un marc per a l’anàlisi de la Wikipedia, mitjançant l’exploració de les característiques informètriques de les pàgines de la Wikipedia (composició, categories, fonts, recollida de dades, etc..) i proposant un conjunt de mètriques d’inspiració informètrica (Wikinformètrica) per al seu estudi quantitatiu.
- Objectiu instrumental: Crear un gran gràfic de coneixement obert de la Wikipedia.
- Objectiu aplicat: Realitzar un estudi quantitatiu descriptiu de la mètrica de la Wikipedia
Repassem els 15 articles seleccionats en la revisió inicial com a principals estudis, qualitatius i quantitatius, sobre referències bibliogràfiques incloses en entrades de Wikipedia
Citació article | Tipus estudi | Aplicació | Aproximació metodològica |
Mühlhauser and Oser (Mühlhauser & Oser, 2008) | Qualitatiu | Anàlisi de qualitat i contingut | Llista de comprovacioó |
Candelario et al. (Candelario et al., 2017) | Qualitatiu | Anàlisi de qualitat i contingut | Sistema de puntuació |
Kaffee and Elsahar (Kaffee & Elsahar, 2021) | Qualitatiu | Anàlisi del procés de citació dels editors | Enquestes i entrevistes |
Nielsen (Nielsen, 2007) | Quantitatiu | Anàlisi de models de citació | Estadística descriptiva |
Kousha and Thelwall (Kousha & Thelwall, 2017) | Quantitatiu | Avaluació de l’impacte de les referències | Estadística descriptiva |
Lewoniewski et al. (Lewoniewski, Węcel, & Abramowicz, 2017) | Quantitatiu | Cobertura de les referències a través dels llenguatges | Estadística descriptiva |
Maggio et al. (Maggio, Willinsky et al., 2017) | Quantitatiu | Anàlisi de models de citació | Estadística descriptiva |
Pooladian and Borrego (Pooladian & Borrego, 2017) [Mencionat en aquest blog [4] |
Quantitatiu | Avaluació de l’impacte de les referències | Anàlisi descriptiu |
Jemielniak et al. (Jemielniak, Masukume, & Wilamowski, 2019) | Quantitatiu | Rànking de revistes per citacions | Anàlisi de citacions |
Torres-Salinas et al. (Torres-Salinas, Romero-Frías, & Arroyo-Machado, 2019) | Quantitatiu | Mapatge d’estructures de coneixement | Anàlisi de cocitacions |
Arroyo-Machado et al. (Arroyo-Machado et al., 2020) | Quantitatiu | Mapatge d’estructures de coneixement | Anàlisi dde cocitacions |
Colavizza (Colavizza, 2020) | Quantitatiu | Cobertura de publicacions | Modelització temàtica i anàlisi de regressió |
Nicholson et al. (Nicholson, Uppala et al., 2021) | Quantitatiu | Revisió de la qualitat de les citacions | Modelització de classificacions |
Singh et al. (Singh et al., 2020) | Quantitatiu | Creació de conjunts de dades | Mineria de textos |
Zagorova et al. (Zagorova et al., 2022) (Mencionat en aquest blog [5]) |
Quantitatiu | Creació de conjunts de dades | Mineria de textos |
Versió reduïda Table 1, article [1] pàg. 933
Per estudiar els articles o entrades de Wikipedia des d’una vessant informètrica es pot fer una analogia entre aquestes entrades i les publicacions científiques
Taula 2, art. [1] pàg 938
Això ens permet comparar les principals característiques de les entrades Wikipedia i les publicacions científiques
I ens permet també fer un diagrama amb els principals elements involucrats en la creació i edició de les entrades de Wikipedia
Figura 1, art. [1] Pàg. 938
Les pàgines de Wikipedia segueixen un control de qualitat transparent que s’ajusta a l’esquema de gradació següent:
Taula 3, art [1] Pàg 940
I d’aquí arribem a poder llistar i descriure les mètriques obtingudes per a les entrades de Wikipedia des d’una dimensió analítica
Taula 5, art. [1] pàg 948
Aquesta taula detalla les magnituds de les entrades de Wikipedia susceptibles de ser mesurades informètricament, les wikinformètriques.
Traduim-la.
Metric | Mètrica | Descripció |
Editorts | Editors | Nombre d’editors que han editat una entrada Wikipedia |
Edits | Edicions | Nombre total d’edicions que s’han fet per a una entrada de Wikipedia |
Linked | Entrades enllaçades | Nombre d’entrades de Wikipedia que enllacen amb una entrada donada |
Links | Enllaços | Nombre d’enllaços interns que té una entrada ded Wikipedia cap a altres entrades |
Age | Temps | Nombre d’anys que han passat ds de la creació dd la pàgina o des de la seva recol·lecció |
Length | Amplitud (Mesura) | Mesura en bytes de l’entrada de Wikipedia |
Talkers | Conversants | Nombre d’editors que han editat una pàgina de conversa de Wikipedia |
Talks | Converses | Nombre total d’edicions que s’han fet per a una pàgina de conversa de Wikipedia |
Views | Vistes | Nombre diari de visualitzacions d’una entrada de Wikipedia |
References | Referències | Nombre d’elements llistats en les referències d’una entrada ded Wikipedia |
Pub. referenced | Publicacions referenciades | Nombre de publicacions referenciades |
URLs | URLs | Nombre d’enllaços externs que apunten a una entrada de Wikipedia |
Finalment ja es pot dissenyar el gràfic de coneixement de Wikipedia
Figura 3, art [1] Pàg. 949
La part final de l’article és un cas pràctic d’anàlisi informètrica aplicada sobre la wikipedia versió anglesa.
La representació del resultat final seria:
Figura 4, art. [1] Pàg. 947
La mitjana de les mètriques de les entrades de Wikipedia diferenciant per la qualitat assignada des de cada projecte,
A les fileres tenim les mètriques de la Wikipedia (wikinformètriques) (Taula 5) i a les columnes l’esquema de gradació de la qualitat de les pàgines de Wikipedia (Taula 3)
Es tracta d’un exemple d’aplicació a l’engròs, amb moltes dades, i amb el suggeriment de que es facin càlculs i estudis semblants en wikipedies en altres versions idiomàtiques per comparar resultats
Bibliografia
[1] Arroyo-Machado, Wenceslao; Torres-Salinas, Daniel; Costas, Rodrigo. Wikinformetrics : Construction and description of an open Wikipedia knowledge graph data set for informetric purposes. Quantitative Science Studies. 2022; 3 (4), 931-952 https://doi.org/10.1162/qss_a_00226
[2] Altmètriques i Viquipèdia, una amistat interessada 2015 Ambidireccional (blog en proves) 15/12/2015
[3] Wikialtmètrics 2020 Ambidireccional. 24/01/2021
[4] Serveixen les citacions de la Viquipèdia per avaluar la recerca?. Ambidireccional. 22/05/2018
[5] Actualitzant referències a Wikipedia. Ambidireccional. 29/09/2022