Twitter y los archivos digitales

1. En Slate,  Christopher Beam se pregunta cómo usarán los historiadores del futuro los archivos de Twitter, y las respuestas son ciertamente interesantes, nos invitan a pensar. Veámoslo:

Entre las muchas críticas que se le hacen a Twitter, la más común, con mucho, es que a nadie le importa lo que alguien ha desayunado.    De hecho, a pocas personas les importa.  “Yo realmente creo que es muy útil,” dice Paul Freedman, profesor de la Universidad de Yale que estudia la historia de la comida. Para él, una oda de 140 carácteres sobre un sandwich doble podría ser un documento histórico impagable. “Los historiadores están interesados en la vida cotidiana”, dice Freedman. “Y Twitter es un recurso increíble para la vida cotidiana”.

De ahí la decisión tomada por la Biblioteca del Congreso la semana pasada de almacenar los archivos completos de Twitter.  Dejando pasar seis meses de demora, cada tweet -actualmente se producen a un ritmo de 50 millones al día- se guardará en un disco duro de la Biblioteca y, presumiblemente, será accesible a los historiadores para … bueno, para siempre.

El archivo digital no es nada nuevo. Internet Archive, una biblioteca digital sin fines de lucro,  empezó a recoger instantáneas de la World Wide Web en 1996. Las bibliotecas universitarias escanean periódicamente sus colecciones de investigación para que sean accesibles en la Web.  Google Books está actualmente   escaneando libros de al menos 20 de las principales bibliotecas de investigación.

Pero la decisión de archivar Twitter lleva la preservación digital a un nuevo nivel de detalle. En el pasado, todos los archivos, incluso los digitales, tuvieron que ser selectivo. El Internet Archive no conserva cada byte de la web,  sólo las partes que parecen importantes. El archivo de Twitter, por el contrario, será abrumadoramente completo. Todo, desde las reacciones al alzamiento en Irán al primer Tweet  de Robert Gibbs, pasando por las dos de la frases dedicadas a la película Hot Tub Time Machine, se guardarán para la posteridad.  Lo cuál es, desde la perspectiva del historiador, histórico. Ahora que hemos empezado el registro de todos los pensamientos vagabundos lanzados al ciberespacio, la posibilidad de registrar cada palabra que haya sido publicada -parafraseando al archivero Brewster Kahle , estamos “adelantando a los griegos”– no parece una locura especial.

La pregunta es, ¿la conservación de los contenidos digitales, desde tweets a Facebook pasando por los comentarios del blog, hace que el trabajo de los historiadores sea más fácil o más difícil?

La respuesta es: ambas cosas. Por un lado, hay más información útil a tamizar para los historiadores. Por otra parte, hay más información inútil. Y sin el beneficio de la retrospección, es imposible decir cuál es cuál. Es como lo que John Wanamaker, supuestamente, dijo sobre la publicidad:  sabía que la mitad de ella era en vano, pero no sabía qué mitad.

El truco estará en la  organización. Loa hashtags -los símbolos #que  usa la gente para crear foros de discusión, tales como  #ashtag para la nube del volcán islandés y #snowpocalypse para la tormenta de nieve que azotó en febrero a Washington, DC- son un comienzo. Pero muchos tweeters no se molestan en etiquetar sus entradas. Los historiadores probablemente serán capaces de buscar por palabras clave. Pero eso también les puede llevar por mal camino. ¿Cómo sabes si alguien se queja de las ventanas (windows)  de su casa o del Windows de su ordenador?

La extracción (minería) de datos se ha convertido en lo suficientemente sofisticada como para permitir estas distinciones en función del contexto. A veces eso significa mirar las palabras clave que rodean a otra.  (Si la palabra “portátil” aparece cerca de “Windows”, por ejemplo, el autor  probablemente  habla de software). También se podrían mirar a los metadatos:  cuándo fue enviado el Tweet, desde dónde fue enviado,  a qué persona sigue y viceversa. Twitter no tiene planes para compartir los metadatos públicos con la Biblioteca del Congreso, pero un portavoz dijo que estaría “abierto a discutirlo con ellos”.

El que los historiadores pueden dar sentido a estos datos depende de las herramientas que tengan para ordenarlos.  “Esto es lo que los historiadores siempre han hecho: crear orden a partir del caos”, dice Martha Anderson, directora de la LOC’s National Digital Information Infrastructure and Preservation Program. “Es un poco como decir, ‘¿son útiles los periódicos para los historiadores?'”, dice Elaine Tyler May,  profesora de historia en la Universidad de Minnesota y presidenta de la Organization of American Historians .  “Sabemos lo que son, pero hay que saber lo que estás buscando”.

Guardémoslo todo, dice el profesor de historia Dan Cohen. Nunca se sabe lo que la gente va a hacer con eso. Cohen dirige el Center for History and New Media de la Universidad George Mason. Después del  11/9 , el Centro creó un archivo que incluye decenas de miles de historias personales de ese día. Cuando los investigadores analizaron los registros del servidor para ver quién lo había visitado, hallaron que algunos visitantes eran lingüistas estudiando la jerga adolescente. Algunos bucearon en el archivo mientras investigaban el uso de teléfonos móviles, ya que en muchas de las historias estaban implicados esos teléfonos. “Ese es el poder de un archivo abierto a gran escala”, dice Cohen.

Los movimientos historiográficos suelen estar influidos por la política. En la década de 1960 y 70, por ejemplo, la historia social desde abajo, en lugar de la de los “grandes hombres”, se hizo popular en los círculos académicos. Pero la tecnología también puede desarrollar nuevos tipos de la historia. Vayamos de nuevo al ejemplo de los alimentos. Los historiadores culinarios que estudian la década de 1950 disponen de materiales limitados.    “Uno puede leer libros de cocina, leer reseñas de restaurantes, críticas en el New Yorker”, dice Nicolaas Mink, un profesor de historia de la alimentación en la Universidad de Wisconsin-Stevens Point. “Pero no tienes una idea de cómo se están preparando en realidad esos alimentos  ni cómo son recibidos por el consumidor final”. Twitter es una fuente para la crítica de la comida por parte de los aficionados  -exactamente lo que un historiador interesado en las difundidas actitudes sociales hacia la comida estaría buscando.

O tomemos la historia de los adolescentes. El material de base para el estudio de cómo y qué piensan los niños siempre ha estado limitado a documentos escolares, cartas de padres y maestros, algún diario ocasional. Una vez más, sobre todo una historia “de arriba hacia abajo”. Hay pocos datos del mundo real sobre cómo los niños interactúan entre sí. Los blogs, los tweets y las actualizaciones de Facebook ofrecen miradas sobre la vida de los niños en una escala que ningún estudio  podría recrear.

Twitter, como documento histórico, también debería permitir a los estudiosos rastrear fenómenos en tiempo real. Los historiadores han tratado de reconstruir cómo la palabra  SIDA se difundió en Nueva York en la década de 1980. Pero es difícil de documentar quién la conocía y cuándo. “Muchas de esas conversaciones se pierden, excepto para personas como yo  que pudieran recordar el momento de hace 30 años”, dice David Mindich, profesor de periodismo en Saint Michael’s College. Twitter conserva esos momentos culturales. Google ya ha creado un programa llamado Replay que representa los asuntos tratados en Twitter con el tiempo.

Hay límites a lo que Twitter puede decirnos. Parte del problema es el sesgo de la selección. Los Tweets están diseñados para el consumo público. Como Mindich dijo: “Si estás mirando lo que alguien comió en el desayuno, también estás mirando lo que algunos quieren que todos piensen que comieron en el desayuno”. O pensemos en las fotos de Facebook. Si un sociólogo llevara a cabo un estudio del comportamiento de los estudiantes universitarios a partir de fotografías seleccionadas en Facebook, asumiría que el 98 por ciento de tiempo de un estudiante lo pasa asiendo una taza. Los datos recogidos de Twitter también podrían considerarse faltos de fiabilidad. “Será trabajo de los historiadores verificarlo”, dice Elaine Tyler May.

Por supuesto, el sesgo de selección es siempre un problema. Las cartas conservadas en un archivo  personall son las letras amorosamente guardadas para su conservación. Tal vez la calidad chapucera de los tweets los hace más fiables como documentos históricos. Nadie transmite la sensación que le deja en la boca un sandwich doble del KFC pensando en  la posteridad -al menos no hasta que la Biblioteca del Congreso anunció su plan. En ese sentido, se podría argumentar que hay menor cálculo en un tweet que en, por ejemplo, la correspondencia completa de William Jefferson Clinton.

Dicho esto, la historiografía Twitter estará relativamente preparada de antemano desde el momento en que su contenido es público. El verdadero reto será averiguar lo que sucede con las misivas privadas digitales, como el contenido de la cuenta de Gmail de alguien.  La actual política de Google consiste en  transferir la cuenta de un difunto a sus familiares, siempre que hagan los trámites correctos.  ¿Pero qué ocurrirá de aquí a  100, 200 o 500 años, cuando el interés público en abrir una cuenta de correo electrónico prevalezca sobre el interés privado en mantenerla en secreto? “Es una cuestión de tiempo”, dice Martha Anderson, de la Biblioteca del Congreso. “Pero si alguien mirara a mi cuenta de Gmail, pensaría que se trata de una mujer aburrida que siempre estaba de tiendas”.  Lo cual, para los futuros historiadores que estudien los patrones de consumo a principios del siglo XXI en América, podría ser realmente fascinante.

2. Ese mismo asunto lo aborda también Randall Stross en el New York Times, consultando a distintos especialistas:

“Mi reacción inicial fue: cuando miras Tweet a Tweet, parecen un montón detrastos”, dice Amy Murrell Taylor, profesora asociada de historia en la Universidad Estatal de Nueva York,  en Albany. “Pero podría ser muy valiosa si se examina colectivamente”.  Taylor está trabajando en un libro sobre esclavos fugitivos   durante la Guerra Civil, un proyecto para el que hay montañas de documentos en papel. “No tengo un motor de búsqueda para tamizarlos”, añade.

El archivo de Twitter,  “nacido digital”, como dicen los archiveros, será fácilmente consultable con una máquina – a diferencia de las cartas y diarios familiares que están acumulando polvo en los desvanes.

Como constancia escrita, los Tweets están muy cerca de los pensamientos originarios. “La mayoría de nuestras fuentes se escriben después del hecho, mediadas por la memoria – a veces la falsa memoria”, indica Taylor. “Y los periódicos están mediados por los editores. Los Tweets te llevan más directamente al momento, de una manera que ninguna otra fuente lo hace. Eso es lo que es tan emocionante. ”

Los mensajes de Twitter preservan los relatos de testigos sobre una extraordinaria variedad de eventos en todo el planeta. “En el pasado, algunas personas eran capaces de estar en un lugar y escribir, o hacer un borrador, como testigos de un evento, como el ahorcamiento de John Brown”, señala William G. Thomas III, profesor de historia en la Universidad de Nebraska-Lincoln . “Pero eso es algo muy raro, un registro histórico excepcional”.

Diez millones de mensajes de Twitter ocupan poco espacio de almacenamiento: alrededor de cinco terabytes de datos. (Un disco duro de dos terabytes se puede encontrar por menos de 150 dólares). Y Twitter dice que el archivo será un poco más pequeño cuando se envíe a la Biblioteca. Antes de su transferencia, la empresa eliminará los mensajes de los usuarios que indiquen que su cuenta está “protegida”, de modo que sólo podrán consultarla las personas que obtengan su permiso explícito. Un usuario de Twitter también pueden optar por utilizar un seudónimo y no compartir ninguna información sobre su identidad.   Twitter no añade etiquetas que asocien a sus usuarios con personas reales. Cada mensaje se acompaña de algunos fragmentos de información adicional, como el número de seguidores que el autor tenía en ese tiempo y el número de usuarios que el autor estaba siguiendo. Si bien Dan Cohen añade que sería útil para un historiador saber los seguidores y a quién siguen, esta información no está incluida en el propio Tweet.

Pero no hay nada privado acerca de quién va detrás de quién  entre los usuarios desprotegidos en Twitter, en cuentas públicas. Esta información se muestra tanto en el propio sitio de Twitter como en las aplicaciones desarrolladas por terceros a quienes Twitter da la bienvenida para aprovechar su base de datos.

(…)

Cohen alienta a los historiadores a encontrar nuevas herramientas y métodos para explotar el “asombroso y gran registro históricp” que suponen los Tweets. Para ello será necesario un enfoque diferente, añade, uno que permite superar la simple “historia anecdótica”.

Al final, quizá la calidad surja de la mera cantidad.

Anuncios

4 Respuestas a “Twitter y los archivos digitales

  1. Aló¡

    Vaya, me haz hecho reconsiderar la óptica que tenía sobre el twitter. En efecto, yo era de los que pensaba: “¿De qué demonios sirve saber que tu amigo está a punto de comerse un rico pollo?”. Bueno, no es que vaya inmediatamente a abrir juna cuenta de Twitter en este momento luego de comentar tu entrada, pero visto en perspectiva, resulta fascinante este uso que se le puede dar en un futuro.
    Los futuros historiadores de los estudios Subalternos no tendrán pretextos en cuanto a escasez de fuentes, jojojo.
    Saludos

  2. Pingback: Historiadores en la era digital « Clionauta: Blog de Historia·

  3. Interesante articulo, comparto la opinión de preservar los archivos en versión digital, ya que esto definitivamente es una fuente para el análisis histórico, lo que habría que analizar más son las maneras de conservar esta información para que sea inalterable en el tiempo, habría que reflexionar en torno a ello.

Los comentarios están cerrados.