Esa
es la interesante conclusión de un estudio sobre la calidad de la participación
en un foro de internet
Si
pasas tiempo programando, probablemente hayas visitado el foro de preguntas y
respuestas Stack Overflow. El sitio permite publicar una cuestión relacionada
con la programación y obtener respuestas de la comunidad.
La
iniciativa ha resultado todo un éxito. Según la clasificación de la compañía
Alexa, Stack Overflow es la tercera web de preguntas y respuestas más popular
del mundo, y ocupa el puesto 79 en el ranking de popularidad general.
Pero
este éxito ha conducido, de forma natural, a un problema: el enorme número de
preguntas y respuestas con las que el sitio tiene que lidiar. Para ayudar a
filtrar toda esta información, los usuarios pueden clasificarla y ganarse una
reputación al tiempo que hacen sus contribuciones.
Sin
embargo, Stack Overflow aún tiene problemas para eliminar preguntas y
respuestas irrelevantes y que se salen de los temas. Esto requiere un
considerable grado de dedicación por parte de moderadores experimentados. Por
tanto, resulta interesante saber si es posible automatizar el proceso de
eliminación de aquellas preguntas y respuestas menos útiles a medida que son
publicadas.
Yuan
Yao junto a sus colegas en el Laboratorio Principal Estatal de Nueva Tecnología
de Software (China), afirman haber desarrollado un algoritmo capaz de hacerlo.
Aseguran que su trabajo revela algo interesante: si quieres buenas respuestas,
haz buenas preguntas. Aunque suene a obviedad, aseguran que hasta ahora no se
contaba con ningún tipo de evidencia que apoyara la idea.
El
equipo asegura: "Por lo que sabemos, somos los primeros en validar
cuantitativamente la correlación entre la calidad de la pregunta y la respuesta
de calidad asociada".
Comenzaron
su trabajo mediante el estudio de todo el corpus de preguntas y respuestas en
Stack Overflow entre julio de 2008 y agosto de 2011. Son cerca de 2 millones
las preguntas y 800.000 personas que han producido más de 4 millones de
respuestas y 7 millones de comentarios. También consideraron los metadatos,
como por ejemplo el número de votos positivos y negativos de cada entrada.
Hasta
ahora, la mayoría de los intentos por evaluar la calidad de las aportaciones de
los usuarios sólo habían tenido en cuenta los votos asociados a las preguntas o
los votos asociados a las respuestas. Por ejemplo, una buena respuesta tiene
más votos positivos que negativos, y cuanto mayor sea la diferencia, mejor será
el resultado.
Pero
Yuan y su equipo fueron un poco más lejos. Se fijaron en la correlación entre
preguntas y respuestas bien aceptadas. Y descubrieron que están fuertemente
correlacionadas.
Hay
un número de factores que resultan importantes. Entre ellos está la reputación
de la persona que hace la pregunta o la responde, el número de preguntas o
respuestas anteriores que han publicado, la popularidad de su entrada en el
pasado reciente, junto con medidas como la longitud de la pregunta y el título.
Tras
calcular todo esto, el sistema es capaz de predecir el nivel de calidad de la
pregunta y sus respuestas esperadas. Esto le permite encontrar las mejores
preguntas y respuestas, e indirectamente también las peores.
Por
supuesto, el método tiene sus limitaciones. En primer lugar, sólo puede hacer
predicciones después de las primeras 24 horas de respuestas a una pregunta. Eso
no resulta tan útil en Stack Overflow, ya que tiene que encontrar la forma de
filtrar las preguntas de baja calidad antes de que lleguen a la comunidad
general. Por tanto, Yaun y sus colegas afirman estar buscando formas de filtrar
las peores preguntas más rápidamente.
En
segundo lugar, Yuan y su equipo se basan en la impresionante cantidad de
metadatos que Stack Overflow recoge tanto para las preguntas como las
respuestas. Eso está en marcado contraste con muchos sitios de preguntas y
respuestas, que sólo permiten a los usuarios votar las respuestas. El objetivo
de estos sitios podría ser recoger más datos sobre las preguntas.
En
todo caso, este trabajo enseña una lección importante a los usuarios de sitios
de preguntas y respuestas. Si quieres buenas respuestas, primero tienes que
hacer una buena pregunta. Y eso te puede llevar tiempo y experiencia.
Tal
vez la aplicación inmediata más interesante de este nuevo trabajo podría ser su
uso como herramienta de enseñanza para ayudar en este proceso de aprendizaje, y
así mejorar la calidad de las preguntas y respuestas en general.
Fuente:
MIT Technology Review.