Páginas

sábado, 12 de enero de 2013

Los dedos de los maestros en un teclado mac


Los dedos de los maestros en un teclado mac

Por: Marco Hernández

Teclas manchadas o desgastadas por el uso, fue el inicio de la idea de construir un análisis gráfico de las grandes obras de la historia literaria de occidente.
Imagen de ilustración Marco Hernández.


Durante una extraña divagación comencé a pensar como se vería un teclado si las obras clásicas de la literatura se hubiesen escrito a través de un "teclado contemporáneo" en una exageración de la imagen, como quedaría después de haber pasado por las manos de un genio compulsivo como Shakespeare, Cervantes, García Márquez o Herman Melvilla, inclusive, que pasaría si comparamos su forma de escribir a través de sus obras. Esta inquietud me mantuvo ocupada la mente para imaginar la forma de graficar esta información hasta que finalmente encontré una forma.

 + F

Firefox, Safari pero en especial Chrome incluyen una herramienta de búsqueda en sus navegadores, Chrome (VRS 23.0 y algunas versiones anteriores) tienen la particularidad de contar los caracteres totales que se encuentra desplegados en una página específica, la idea fue buscar los textos de estas obras en  formato pdf para abrirlos y procesar el conteo en el browser, esto nos diría cuantas letras contienen estas obras. Una vez normalizado a través de cuotas porcentuales, la información fue comparable entre sí, para visualizar el resultado codifiqué los porcentajes con una escala de color.

Chrome search tool.
Después de observar los datos ningún caracter excede un 15%
de frecuencia en las obras seleccionadas, la escala tiene
un margen para preveer futuras comparaciones.   

William Shakespeare

Según la metodología planteada veríamos la idea así: Si el mismísimo Shakespeare usara este teclado para escribir Hamlet su teclado se vería así:

Hamlet keyboard
Conteo de caracteres para la obra Hamlet, sin incluir espacios.
Infografía: Marco Hernández.

Hamlet Keyboard
Conteo de caracteres para la obra Hamlet, incluyendo espacios.
Infografía: Marco Hernández.

De la misma forma podríamos comparar los teclados de distintos genios literarios que hicieron aportes a la cultura mundial, evidentemente cada uno tenía implícito un defecto: El Idioma, por la conformación normal de las palabras en español, o inglés las obras naturalmente tendrán una cuota más alta de ciertas vocales y/o consonantes, pero aún con esa limitación podemos ver algunas pequeñas variantes dentro de sus propias obras:

Hamlet vs Romeo and Juliet keyboard
Romeo y Julieta versus Hamlet, según los conteos en los textos originales en inglés.
Infografía: Marco Hernández.


Miguel de Cervantes

Para muchos el libro más importante e influyente de la historia literaria, para mi pequeño experimento un reto. La cantidad de caracteres en las versiones digitales de este libro representaron un trabajo especial, no es suficiente tener una cantidad de caracteres superior a 755 mil sino que además está fragmentado en dos secciones para sumar una barbaridad de más de un millón y medio de letras para un solo libro... Justo cuando pensé tener al 75% el análisis un comentario de un colega me puso a dudar:
"Claro, muy interesante la idea… pero es un análisis con la lectura moderna del quijote o es un análisis con la obra original, ya sabe, con el texto tal como escribió en un principio."
Tenía mucho sentido, estaba viendo el análisis de una obra adaptada a nuestra lengua moderna, así que el monstruoso análisis dio inicio nuevamente para probar que tanta diferencia existía entre ambas versiones.
Teclado de Don Quijote de la Mancha
Conteo de caracteres para la obra
Don Quijote de la Mancha (Versión moderna), sin incluir los espacios.
Infografía: Marco Hernández.
Conteo de caracteres para la obra
Don Quijote de la Mancha (Versión original), sin incluir los espacios.
Infografía: Marco Hernández.


La conclusión final del los Quijotes


Aunque hay entre ambas versiones una diferencia de 935.333 caracteres al hacer el análisis porcentual las diferencias son mínimas. Aunque el argumento inicial que plateaba la duda es completamente válido, en un cuota de un millón seiscientos mil caracteres de la obra original no hay mayor ingerencia cuanto evolucionó el texto. 


Gabriel García Márquez

Un escritor un poco más cercano a nuestra época sería una referencia para ver que tan variables serían las concentraciones de las letras en las obras más representativas del castellano moderno:
Teclado de el amor en los tiempos del cólera
Conteo de caracteres para la obra El amor e]n los tiempos del cólera, incluyendo espacios.
Infografía: Marco Hernández.
Teclado del Amor en los tiempos del cólera
Conteo de caracteres para la obra El amor en los tiempos del cólera, sin incluir espacios.
Infografía: Marco Hernández.


Que tan variables son las obras de un escritor… pues bien para poder comparar la forma en la que se escriben las obras (al menos estas dos de Márquez), es necesario tener más próximo el gráfico de comparación:

Versus
Conteo de caracteres para la obra El amor en los tiempos del cólera
comparada con Cien años de soledad, sin incluir espacios.
Infografía: Marco Hernández.
Esto desde la perspectiva relativa, ya que si vemos los números totales podríamos ver algunas diferencias en la cantidad de caracteres empleados, veamos el gráfico entonces: 


Caracteres en las obras de Gabriel García Márquez
Caracteres absolutos en las obras
El amor en los tiempos del cólera
y Cien años de soledad.
Infografía: Marco Hernández.


Herman Melvilla

Quizá a muchos su nombre no suene tan popular como los pesos pesados que acabo de presentarles antes, no obstante su obra quizá si sea más fácil de reconocer. Para quienes hasta acá no saben quien es este personaje, se trata del autor de la ballena blanca y el atormentado marinero Ismael en la obra titulada "Moby-Dick".

Moby Dick Keyboard
Conteo de caracteres para la obra Moby Dick, en su texto original en inglés, sin incluir espacios.
Infografía: Marco Hernández.

Moby Dick es uno de los libros más extensos que elegí para este análisis con 954.156 caracteres en total. Basados en los datos de su frecuencia, podemos hacer una interpretación más sencilla para su comprensión usando una cuota porcentual
Porcentaje de frecuencia de caracteres en Moby Dick.
Basado en el texto original en inglés, sin incluir espacios.
Infografía: Marco Hernández.


Del detalle y la curiosidad al absoluto de las obras


Una vez procesada la información y con sus deducciones adquiridas, podemos entraren el campo de las curiosidades, tales como que, en estas obras el caracter más común es la letra "e", cada una de estas obras registró el uso de la letra "e" por encima de un 10% del total del texto.
En el caso de Hamlet, la letra "z" es la menos común, con tan solo un 0,002% de uso en todo el texto; El Quijote moderno, contienen una dualidad de caracteres "ajenos" a esta lectura, las letras "k" y "w" tan solo aparecen una vez en todo el texto, representando esto apenas el 0,0001% del total de la obra:


El quijote de la Mancha (Parte Uno versión moderna):

Aquí está don Kirieleison de Montalván, valeroso caballero, y su hermano Tomás de Montalván y el caballero Fonseca, con la batalla que el valiente de Tirante hizo con Alano…
…todas acuchilladas, y unos corpiños de terciopelo verde guarnecidos con unos ribetes de raso blanco, que se debieron de hacer, ellos y la saya, en tiempo del rey Wamba.
Es interesante también, comparar el absoluto de caracteres entre sí, si bien algunas de estas obras fueron escritas para representaciones teatrales cortas en comparación con las novelas clásicas como el Quijote, si da una magnitud de que estamos comparando, y además porqué se comparan en cantidades relativas al total de cada contenido.


Compilado de libros
Caracteres totales para las obras Don Quijote de la Mancha, Moby Dick, El amor en los tiempos del cólera, Cien años de soledad, Hamlety Romeo y Julieta; cada uno agrupado por recurrencia de vocales y consonantes destacando la mayor cuota.
Infografía: Marco Hernández.


Otro detalle que me pareció interesante fue la comparación de promedios de las obras según su lenguaje, agrupando los textos en inglés y español obtuve este gráfico, la mitad de abajo de cada tecla es el promedio de caracteres para las obras en inglés, la otra mitad de cada tecla en español. 



Usos de caracteres en Lenguajes en inglés y español
Promedio de caracteres agrupando las obras por lenguaje (inglés o español).
Infografía: Marco Hernández.

Este ejercicio por extraño que parezca resultó muy interesante, invertí una cantidad de tiempo que a ciencia cierta no puedo recordar, sin embargo bastó con momentos aislados de algunos meses para completar el análisis y su representación, creo que podría verlo como un pasatiempos para esos momentos en los que parece que no hay nada productivo en que matar el tiempo, espero que al igual que yo hallan podido disfrutar de esta divagación en torno al mundo de la literatura y los datos que puede generar.



No hay comentarios:

Publicar un comentario