{"id":54186,"date":"2024-05-18T01:49:14","date_gmt":"2024-05-18T06:49:14","guid":{"rendered":"https:\/\/einsteresante.com\/?p=54186"},"modified":"2024-05-18T01:49:15","modified_gmt":"2024-05-18T06:49:15","slug":"articulos-huerfanos-la-materia-oscura-de-wikipedia","status":"publish","type":"post","link":"https:\/\/einsteresante.com\/index.php\/2024\/05\/18\/articulos-huerfanos-la-materia-oscura-de-wikipedia\/","title":{"rendered":"Art\u00edculos hu\u00e9rfanos: la &#8220;materia oscura&#8221; de Wikipedia"},"content":{"rendered":"\n<p>Wikipedia es la mayor plataforma de conocimiento en l\u00ednea abierto y de libre acceso hasta el momento. En un nuevo estudio, los investigadores de la Escuela Polit\u00e9cnica Federal de Lausana, Suiza (EPFL) han descubierto que alrededor del 15% del contenido es efectivamente invisible para los lectores que navegan por Wikipedia y han desarrollado una nueva herramienta para ayudar a superar esto. El trabajo se publica en el servidor de preimpresi\u00f3n arXiv.<\/p>\n\n\n\n<p>Con 60 millones de art\u00edculos en m\u00e1s de 300 versiones ling\u00fc\u00edsticas, el contenido disponible en Wikipedia crece continuamente a un ritmo de alrededor de 200 mil nuevos art\u00edculos cada mes. Los lectores suelen descubrir nuevos conocimientos y profundizar en un tema haciendo clic en hiperv\u00ednculos que conectan un art\u00edculo con el siguiente. Pero \u00bfqu\u00e9 pasa con los art\u00edculos de Wikipedia a los que ning\u00fan otro art\u00edculo enlaza?<\/p>\n\n\n\n<p>Estos se conocen com\u00fanmente como art\u00edculos &#8220;hu\u00e9rfanos&#8221; y, para comprender mejor este fen\u00f3meno, los investigadores de la EPFL del Laboratorio de Ciencias de Datos (DLAB) de la Facultad de Ciencias de la Computaci\u00f3n y la Comunicaci\u00f3n, en colaboraci\u00f3n con el equipo de investigaci\u00f3n de la Fundaci\u00f3n Wikimedia, llevaron a cabo la primera investigaci\u00f3n sistem\u00e1tica de art\u00edculos hu\u00e9rfanos en las 319 versiones de Wikipedia en diferentes idiomas que exist\u00edan en el momento en que se realiz\u00f3 el estudio.<\/p>\n\n\n\n<p>&#8220;Wikipedia es una red como las carreteras, Internet, los compuestos qu\u00edmicos o los genes, y cualquier red tiene un concepto b\u00e1sico de navegabilidad para poder ir de un lugar a otro. Las redes de informaci\u00f3n est\u00e1n organizadas en jerarqu\u00edas particulares y ten\u00edamos curiosidad por entenderlas. art\u00edculos a los que nadie acced\u00eda. As\u00ed es como empezamos a buscar art\u00edculos hu\u00e9rfanos&#8221;, explic\u00f3 Akhil Arora, Ph.D. Investigador en DLAB y autor principal del estudio &#8220;Art\u00edculos hu\u00e9rfanos: La materia oscura de Wikipedia&#8221;.<\/p>\n\n\n\n<p>Los investigadores descubrieron que casi 9 millones de art\u00edculos en Wikipedia en todos los idiomas (alrededor del 15%) eran hu\u00e9rfanos, efectivamente invisibles para los lectores que navegaban en Wikipedia, y exist\u00edan en casi todas las \u00e1reas tem\u00e1ticas de la plataforma. En general, las p\u00e1ginas vistas recibidas por art\u00edculos no hu\u00e9rfanos son el doble que las p\u00e1ginas vistas de art\u00edculos hu\u00e9rfanos. M\u00e1s all\u00e1 de las simples correlaciones, los investigadores tambi\u00e9n establecieron una relaci\u00f3n de causa y efecto entre la adici\u00f3n de enlaces entrantes a art\u00edculos hu\u00e9rfanos y un aumento en sus p\u00e1ginas vistas.<\/p>\n\n\n\n<p>La falta de visibilidad de los art\u00edculos hu\u00e9rfanos se debe a la forma en que los usuarios buscan y ven las p\u00e1ginas en Wikipedia. La primera es a trav\u00e9s de un motor de b\u00fasqueda, donde se dirige al usuario a una p\u00e1gina particular de Wikipedia. El segundo es usar Wikipedia como enciclopedia y hacer clic de un art\u00edculo a otro y el tercero es una combinaci\u00f3n de ambos.<\/p>\n\n\n\n<p>En todos estos escenarios, un editor no s\u00f3lo necesitar\u00e1 agregar enlaces en la direcci\u00f3n de salida desde el art\u00edculo que est\u00e1 editando, sino que tambi\u00e9n necesitar\u00e1 conocer todos los art\u00edculos relevantes de Wikipedia que potencialmente podr\u00edan enlazar hacia adentro, y esta es una perspectiva dif\u00edcil.<\/p>\n\n\n\n<p>&#8220;Un editor est\u00e1 editando algo sobre lo que sabe mucho para poder agregar enlaces externos a otros art\u00edculos&#8221;, dijo Arora. &#8220;Revertir la direccionalidad presenta muchas dificultades porque es posible que no se sea un experto en otros temas y art\u00edculos; a veces estas relaciones no son sim\u00e9tricas y el universo es la totalidad de Wikipedia&#8221;.<\/p>\n\n\n\n<p>La investigaci\u00f3n encontr\u00f3 que existen grandes discrepancias entre idiomas. En m\u00e1s de 100 idiomas, el porcentaje de art\u00edculos hu\u00e9rfanos supera el 30%, con una cifra especialmente alta en el \u00e1rabe egipcio (78%) y el vietnamita (50%). Ambas se encuentran entre las 20 versiones ling\u00fc\u00edsticas m\u00e1s importantes de Wikipedia. Esto se\u00f1ala el desaf\u00edo de la falta de capacidad de edici\u00f3n en algunos idiomas y demuestra la necesidad de mejorar las herramientas existentes, como FindLink, que apoyan a los editores en esta tarea. Un hallazgo interesante del estudio es que un art\u00edculo hu\u00e9rfano en un idioma no siempre lo es en otros idiomas y esto llev\u00f3 a los investigadores a desarrollar un nuevo enfoque para identificar art\u00edculos desde los cuales vincular a los hu\u00e9rfanos mediante la traducci\u00f3n de enlaces.<\/p>\n\n\n\n<p>&#8220;Si el mismo art\u00edculo no es hu\u00e9rfano en otro idioma, significa que los editores de esa comunidad pudieron encontrar otros art\u00edculos que podr\u00edan vincularse a este art\u00edculo. As\u00ed que simplemente transferimos el enlace de otros idiomas al idioma en el que el art\u00edculo era hu\u00e9rfano. Descubrimos que este enfoque pod\u00eda sugerir enlaces para m\u00e1s del 63% de los art\u00edculos hu\u00e9rfanos&#8221;, dijo Arora.<\/p>\n\n\n\n<p>El equipo de EPFL contin\u00faa colaborando con investigadores de la Fundaci\u00f3n Wikimedia sobre formas en que este enfoque podr\u00eda estar disponible como herramienta (ver el prototipo inicial) para mejorar la experiencia de los lectores en Wikipedia. Tambi\u00e9n est\u00e1 utilizando la IA para ayudar en este esfuerzo en dos frentes.<\/p>\n\n\n\n<p>Primero, los investigadores est\u00e1n trabajando en redes neuronales gr\u00e1ficas para organizar recomendaciones de enlaces que servir\u00e1n de base para la herramienta. En segundo lugar, de manera similar a un mapa de calor, est\u00e1n desarrollando una herramienta adicional que puede guiar a los editores sobre en qu\u00e9 parte del texto de una p\u00e1gina deber\u00edan considerar agregar nuevos conceptos que luego usar\u00e1n IA generativa para sugerir alg\u00fan texto inicial. Es importante destacar que los editores voluntarios mejoran, editan y auditan el trabajo realizado por la IA. El enfoque de la IA en Wikipedia siempre ha sido a trav\u00e9s de sistemas de &#8220;circuito cerrado&#8221;, en los que los humanos est\u00e1n al tanto.<\/p>\n\n\n\n<p>&#8220;La comunidad de editores est\u00e1 prestando su servicio al mundo, pero no hay suficientes, especialmente en los idiomas m\u00e1s peque\u00f1os. Uno de nuestros objetivos es brindar un mejor apoyo a los editores porque puede ser una tarea desalentadora escribir y mantener art\u00edculos. Wikipedia es un incre\u00edble servicio de acceso abierto y es por eso que las herramientas que estamos creando son tan \u00fatiles para los editores que realizan este valioso trabajo&#8221;, concluy\u00f3 Arora.<\/p>\n\n\n\n<p>Fuente: <a href=\"https:\/\/techxplore.com\/news\/2024-05-orphan-articles-dark-wikipedia.html\">Tech Xplore<\/a>.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Wikipedia es la mayor plataforma de conocimiento en l\u00ednea abierto y de libre acceso hasta el momento. En un nuevo estudio, los investigadores de la Escuela Polit\u00e9cnica Federal de Lausana, Suiza (EPFL) han descubierto que alrededor del 15% del contenido es efectivamente invisible para los lectores que navegan por Wikipedia y han desarrollado una nueva [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[6],"tags":[],"class_list":["post-54186","post","type-post","status-publish","format-standard","hentry","category-humanidades"],"_links":{"self":[{"href":"https:\/\/einsteresante.com\/index.php\/wp-json\/wp\/v2\/posts\/54186","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/einsteresante.com\/index.php\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/einsteresante.com\/index.php\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/einsteresante.com\/index.php\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/einsteresante.com\/index.php\/wp-json\/wp\/v2\/comments?post=54186"}],"version-history":[{"count":8,"href":"https:\/\/einsteresante.com\/index.php\/wp-json\/wp\/v2\/posts\/54186\/revisions"}],"predecessor-version":[{"id":54194,"href":"https:\/\/einsteresante.com\/index.php\/wp-json\/wp\/v2\/posts\/54186\/revisions\/54194"}],"wp:attachment":[{"href":"https:\/\/einsteresante.com\/index.php\/wp-json\/wp\/v2\/media?parent=54186"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/einsteresante.com\/index.php\/wp-json\/wp\/v2\/categories?post=54186"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/einsteresante.com\/index.php\/wp-json\/wp\/v2\/tags?post=54186"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}