24 de enero de 2014

DEMOSTRADO: las buenas preguntas generan buenas respuestas


Esa es la interesante conclusión de un estudio sobre la calidad de la participación en un foro de internet
Si pasas tiempo programando, probablemente hayas visitado el foro de preguntas y respuestas Stack Overflow. El sitio permite publicar una cuestión relacionada con la programación y obtener respuestas de la comunidad.
La iniciativa ha resultado todo un éxito. Según la clasificación de la compañía Alexa, Stack Overflow es la tercera web de preguntas y respuestas más popular del mundo, y ocupa el puesto 79 en el ranking de popularidad general.
Pero este éxito ha conducido, de forma natural, a un problema: el enorme número de preguntas y respuestas con las que el sitio tiene que lidiar. Para ayudar a filtrar toda esta información, los usuarios pueden clasificarla y ganarse una reputación al tiempo que hacen sus contribuciones.
Sin embargo, Stack Overflow aún tiene problemas para eliminar preguntas y respuestas irrelevantes y que se salen de los temas. Esto requiere un considerable grado de dedicación por parte de moderadores experimentados. Por tanto, resulta interesante saber si es posible automatizar el proceso de eliminación de aquellas preguntas y respuestas menos útiles a medida que son publicadas.
Yuan Yao junto a sus colegas en el Laboratorio Principal Estatal de Nueva Tecnología de Software (China), afirman haber desarrollado un algoritmo capaz de hacerlo. Aseguran que su trabajo revela algo interesante: si quieres buenas respuestas, haz buenas preguntas. Aunque suene a obviedad, aseguran que hasta ahora no se contaba con ningún tipo de evidencia que apoyara la idea.
El equipo asegura: "Por lo que sabemos, somos los primeros en validar cuantitativamente la correlación entre la calidad de la pregunta y la respuesta de calidad asociada".
Comenzaron su trabajo mediante el estudio de todo el corpus de preguntas y respuestas en Stack Overflow entre julio de 2008 y agosto de 2011. Son cerca de 2 millones las preguntas y 800.000 personas que han producido más de 4 millones de respuestas y 7 millones de comentarios. También consideraron los metadatos, como por ejemplo el número de votos positivos y negativos de cada entrada.
Hasta ahora, la mayoría de los intentos por evaluar la calidad de las aportaciones de los usuarios sólo habían tenido en cuenta los votos asociados a las preguntas o los votos asociados a las respuestas. Por ejemplo, una buena respuesta tiene más votos positivos que negativos, y cuanto mayor sea la diferencia, mejor será el resultado.
Pero Yuan y su equipo fueron un poco más lejos. Se fijaron en la correlación entre preguntas y respuestas bien aceptadas. Y descubrieron que están fuertemente correlacionadas.
Hay un número de factores que resultan importantes. Entre ellos está la reputación de la persona que hace la pregunta o la responde, el número de preguntas o respuestas anteriores que han publicado, la popularidad de su entrada en el pasado reciente, junto con medidas como la longitud de la pregunta y el título.
Tras calcular todo esto, el sistema es capaz de predecir el nivel de calidad de la pregunta y sus respuestas esperadas. Esto le permite encontrar las mejores preguntas y respuestas, e indirectamente también las peores.
Por supuesto, el método tiene sus limitaciones. En primer lugar, sólo puede hacer predicciones después de las primeras 24 horas de respuestas a una pregunta. Eso no resulta tan útil en Stack Overflow, ya que tiene que encontrar la forma de filtrar las preguntas de baja calidad antes de que lleguen a la comunidad general. Por tanto, Yaun y sus colegas afirman estar buscando formas de filtrar las peores preguntas más rápidamente.
En segundo lugar, Yuan y su equipo se basan en la impresionante cantidad de metadatos que Stack Overflow recoge tanto para las preguntas como las respuestas. Eso está en marcado contraste con muchos sitios de preguntas y respuestas, que sólo permiten a los usuarios votar las respuestas. El objetivo de estos sitios podría ser recoger más datos sobre las preguntas.
En todo caso, este trabajo enseña una lección importante a los usuarios de sitios de preguntas y respuestas. Si quieres buenas respuestas, primero tienes que hacer una buena pregunta. Y eso te puede llevar tiempo y experiencia.
Tal vez la aplicación inmediata más interesante de este nuevo trabajo podría ser su uso como herramienta de enseñanza para ayudar en este proceso de aprendizaje, y así mejorar la calidad de las preguntas y respuestas en general.
Fuente: MIT Technology Review.