Send to Kindle

Norman Bates de Psycho

Investigadores presentarán los resultados de una investigación interesante en el marco de las conferencias de seguridad DefCon 20; el identificar a potenciales psicópatas por el contenido de sus tweets. Antes, un poco de antecedentes: de acuerdo con un estudio del 2011 se estableció que hay un patrón entre los psicópatas y el lenguaje que usan; de aquí que a algunos investigadores se les ocurriera aplicar el estudio a las redes sociales de modo que se pudiera ayudar a las agencias de seguridad a identificar rasgos de potenciales psicópatas. Para lograr esto, se comparó una auto valoración de tres razgos “obscuros” que son psicopatía, maquiavelismo y narcisismo con otros cinco razgos personales que con apertura, conciencia, extraversión, amabilidad y nivel de neurosis con la información de Twitter. Para este estudio usaron una muestra de 2,927 participantes, entre los cuales se encontraron relaciones estadísticamente significativas entre los razgos más obscuros de tales personas y su actividad en Twitter, al igual que identificaron relaciones entre la actitud del usuario hacia la privacidad, sus razgos personales y su uso de Twitter. Suena por demás interesante que presentarán los enfoques técnicos para recolectar, almacenar y analizar los datos de Twitter con herramientas open source, así como también discutir los problemas éticos, de privacidad y de derechos humanos relacionados con el análisis de datos de medios sociales.

Vale la pena mencionar otros datos importantes del estudio, como por ejemplo que el set de datos obtenido se procesó en Kaggle, un lugar donde científicos de datos compiten para crear modelos predictivos, pero a estos se les dieron datos convertidos – es decir, los datos de Twitter se conviertieron en puntos de datos, 337 para ser exactos. Estos puntos significan características linguísticas, puntuaciones de Klout, frecuencia de tweets y otros más, esto supongo fue hecho con miras a “anonimizar” la información de modo que los investigadores no tengan idea de que representa cada número más allá de lo necesario. Luego de esto, el set de datos de Twitter se partió en dos: el primero se usó para hacer ingeniería inversa sobre la valoración personal, y luego construir un modelo que correlacione los datos de Twitter con las puntuaciones que recibieron los usuarios en los tests de personalidad. Estos modelos predictivos se usaron en el segundo set de datos para ver cual predecía mejor las puntuaciones obtenidas por los usuarios de Twitter en sus pruebas.

Por supuesto este método no es completamente 100% confiable, como todo lo que es basado en estadísticas; sin embargo uno de los que lo expondrán en el DefCon dice que con aprendizaje por computadoras se podría incrementar significativamente la predicción. Por ahora, si se usara este método quizás hasta a mi me agarraría la policía, a juzgar por este tweet mío:

Cuando que fue una broma inspirada por una línea de una película sobre Manuel Noriega. Si, ya sé, mala idea. Pero la tecnología y su capacidad de procesamiento está avanzando tremendamente, y de hecho ya se hacen estudios sobre medios sociales en la actualidad, aunque por ahora creo que no es lo mejor aplicar métodos como este, en particular debido a que, al menos en Twitter, muchos usuarios lo usan como si fuera Second Life, es decir, muchas cuentas son el realidad el alter ego de sus usuarios, lo que quisieran ser en la vida, ya sea un matón, un tipo rudo, una adicta al sexo o un cínico, y debido a que están dentro de un papel, difícilmente se les podrá analizar correctamente: aquí es donde entrarían las computadoras para analizar patrones y poder determinar al mentiroso del que habla en serio.

Como yo en el tweet anterior. :sqwhat: ¡ja! es broma, última vez que lo hago.

Send to Kindle