martes, 24 de enero de 2012

Análisis de los libros escaneados por Google

"Gracias a los 15 millones de libros escaneados por Google Books y de la adictiva herramienta
"n-gramas de Google Labs" que te permite buscar palabras en una base de datos del aproximadamente 4% de todos los libros publicados, Aiden y Michel nos muestran en esta charla TED algunas de los datos sorprendentes que podemos aprender partiendo de 500.000 millones de palabras...
Michel y Aiden ayudaron a crear el Visor Ngram, un modelo n-gram que analiza en los libros de la biblioteca digital de Google los patrones culturales de la lengua a lo largo de 200 años. Herramienta que sirvió para investigaciones que fueron capaces de predecir el efecto de la Primavera Árabe y de calcular el lugar donde se ocultaba Bin Laden con un error de apenas 200 km."

No hay comentarios:

Publicar un comentario