América Latina y el Caribe

  • Obstáculos que presenta el Big data para el desarrollo

    Jan Piotrowski

    18/04/14

De un vistazo

  • Big data constituye un reto de gestión y análisis incluso para mundo desarrollado

  • Asociaciones con industria privada ayudarían a cerrar brecha de habilidades

  • Hacer mejor uso de datos existentes, como registros telefónicos, podría ser productivo

Para que el Big data ayude al desarrollo se necesitará crear capacidades humanas y técnicas, dice Jan Piotrowski.
 
Cada dos días se crean más datos que en toda la historia de la humanidad hasta el año 2003, información suficiente para llenar una pila de DVD de ida y vuelta a la luna.
 
Pero un subproducto de esta montaña de datos —y testimonio de nuestros estilos de vida cada vez más digitalizados— es la evidencia de los hábitos y preferencias de la gente, evidencia que se puede aprovechar para revelar patrones y brindar nuevos conocimientos para la práctica del desarrollo.
 
Mucho se ha hablado sobre el uso de fuentes tales como las redes sociales y las noticias públicas, los datos de las empresas privadas, de satélites y sensores de carreteras, y de los informes de colaboración masiva para impulsar el desarrollo. Incluso las Naciones Unidas han llamado a una ‘revolución de datos’ para apoyar los nuevos objetivos de desarrollo, de manera que los profesionales del desarrollo sostenible puedan hacer un mejor seguimiento de los avances, integrar las evidencias en la toma de decisiones y ofrecer más transparencia.
 
Pero extraer las tendencias ocultas en los datos requiere habilidad, y aún se desconoce si los países en desarrollo y las organizaciones de desarrollo tienen la capacidad de interpretar el llamado Big data por sí mismos.
 
“En este momento, la explosión del Big data ha superado de lejos nuestra capacidad de darle sentido en todos los países, pero sobre todo en los países más pobres que ya adolecen de capacidad humana y técnica”, admite Claire Melamed, jefa del programa de crecimiento, pobreza  y desigualdad del Instituto de Desarrollo de Ultramar con sede en el Reino Unido.
 
“Todos estamos corriendo para ponernos al día con la tecnología”, añade.
 
La pregunta es cuál es la mejor manera de recuperar el terreno; cuáles son los vacíos en la capacidad que se requiere llenar, cuáles son los usos potenciales y las limitaciones, y quiénes son los actores principales que necesitan apoyo para que esto ocurra.
 
Complementario, pero problemático
 
Un informe reciente del Consejo Económico y Social de las Naciones Unidas que analizó 107 oficinas nacionales de estadística (ONE) mostró que estas ven los proyectos de Big data como un complemento, no un sustituto de los métodos tradicionales de recolección, como las encuestas. [1] Esto va en la misma línea de las opiniones de organizaciones líderes de Big data, como Pulso Global, iniciativa de la ONU que investiga las maneras de usar Big data para el desarrollo.
 
El informe también muestra que más de la mitad de los estados del mundo tiene planes para explorar nuevos usos de los datos administrativos, como los registros de impuestos, aduanas y seguridad social. Las redes sociales, las búsquedas por Internet y el seguimiento por GPS (siglas en inglés de Sistema de Posicionamiento Global) también son una prioridad en la agenda.
 
Filipinas, por ejemplo, tiene pensado usar los datos de las transacciones para estimar la contribución económica de las tasas de penetración de las tecnologías de información y comunicación (TIC). Y las redes sociales ya están siendo usadas por los gobiernos de Ghana y de México para rastrear las percepciones y la credibilidad pública de sus administraciones.
 
Pero la encuesta de la ONU también encontró que los gobiernos tienen una serie de problemas para implementar los proyectos de Big data. Las preocupaciones incluyen asuntos legales sobre la privacidad y acceso a los datos, la falta de capacidad humana y de infraestructura de escala de las TIC para cubrir las demandas de los grandes conjuntos de datos.
 
Por ejemplo, la oficina de estadísticas de Kenia —uno de los líderes africanos en tecnologías de información— carece de la experiencia para capacitar a su personal en el uso de Big data, y del conocimiento de la tecnología necesaria para el análisis, señala el informe de UNESCO.
 
La falta de dinero es otro problema, especialmente en los países en desarrollo, ya que la proporción de ayuda exterior dedicada a los programas estadísticos se redujo a la mitad entre 2011 y 2012, llegando a 0.16 por ciento, según el informe 2013 del Consorcio de Estadísticas para el Desarrollo del Siglo 21 (PARIS21). [2]

“La explosión del Big data ha superado de lejos nuestra capacidad de darle sentido en los países más pobres que ya adolecen de capacidad humana y técnica”.

Claire Melamed, Instituto de Desarrollo de Ultramar

Jon Gosier, jefe ejecutivo del Grupo D8A, empresa que ofrece herramientas para la planificación de ciudades basándose en el seguimiento de los movimientos de las personas, confirma que el enorme entorno de datos ha sobrepasado a muchos gobiernos.
 
“El verdadero problema es que los gobiernos están nadando en más datos de los que jamás han tenido pero su personal carece de la capacidad de poder hacer algo con ellos”, confiesa a SciDev.Net.
 
Aunque esta brecha en la capacidad afecta a todos los países, en el mundo en desarrollo es mucho más difícil encontrar personas con las capacidades estadísticas, de programación y diseño necesarias para darle sentido a la información.
 
Comprometer al sector privado
 
Gosier dice a SciDev.Net que si los gobiernos desean ver que el Big data sea usado para el desarrollo, su mejor apuesta podría ser permitir que el sector privado realice el trabajo preparatorio. Deberían reconocer, subraya, que tendrán dificultades para competir con las empresas creadas para hacer ese trabajo.
 
Kenia, por ejemplo, mediante subsidios gubernamentales y programas de incubación, ha construido una masa crítica de actividad de tecnologías de la información en el sector privado, según Gosier, y el país es el centro para el desarrollo de los sistemas de Big data.
 
Casi la mitad de los negocios del país que han implementado iniciativas de grandes datos depende del talento interno en lugar del importado o migrante, de acuerdo con la encuesta IDG Connect en empresas de Kenia y Nigeria. [3] Sin embargo, la capacidad dista aún de ser suficiente, pues solo el 23 por ciento de esas empresas tiene personal capacitado para tratar con las demandas que genera el Big data, precisa el informe.
 
John Quinn, científico de datos en Pulso Global, afirma que este déficit de competencias en África se extiende a los círculos académicos del continente. El interés académico en Big data aún es relativamente bajo, pero desde que asumió una cátedra en la Universidad de Makerere de Uganda en 2007, ha visto que las competencias en análisis de datos e informática de los estudiantes y del personal han mejorado rápidamente.
 
“Por el momento hay necesidad de importar talentos pero eso está cambiando rápidamente”, comenta a SciDev.Net.
 
La brecha digital
 
Pero no es solo la falta de capacidad humana la que obstaculiza el desarrollo del Big data. En África, así como en otras regiones en desarrollo, hay conexiones irregulares a Internet, suministros intermitentes de energía y escasa llegada de los cables de alta capacidad, afirma Quinn. Esto significa que muchas personas simplemente no están representadas en los datos recogidos de manera digital. 
 
El último dato de la International World Stats, empresa de investigación de mercado en línea, señala que menos del 16 por ciento de africanos tiene acceso a Internet. Además, según la Encuesta de Empresas realizada por el Banco Mundial, los países del sub Sahara africano sufren cortes de energía cada cuatro días en promedio, con una duración de cinco horas cada uno. Esto es 25 por ciento más frecuente y casi el doble de tiempo que el promedio total de los 135 países en desarrollo investigados. [4]
 
Los relativamente escasos volúmenes de Big data generados en los países de África, comparados con los países desarrollados, significa que los centros de datos en el extranjero actualmente pueden satisfacer las necesidades de almacenamiento del continente. Sin embargo, a medida que los volúmenes aumenten, Quinn piensa que los países pueden necesitar considerar también construir sus propios sitios de almacenamiento.
 
Vanessa Frías-Martínez, de la Escuela de Estudios de la Información en la Universidad de Maryland, Estados Unidos, ve la escasa tasa de penetración de Internet como una limitación para las estrategias de Big data en el mundo en desarrollo. No se trata solamente de escasez de datos, como los de las redes sociales, que es un problema, sino del hecho de que son poco representativos.
 
Salvo excepciones, como Indonesia, donde el uso de las redes sociales es alto, las pocas personas que usan Internet regularmente en los países en desarrollo son predominantemente jóvenes y adineradas, dice. Por lo tanto, cualquier intento de sacar conclusiones generales sobre el estado de la ‘población de Internet’ será sesgado.
 
Los peligros de sacar conclusiones de datos poco representativos se ilustran con un intento de aplicar Google Flu Trends a Bolivia —un ejercicio de mapeo de los Estados Unidos basado en las búsquedas sobre la gripe en Internet—, señala Frías-Martínez. Los intentos para determinar la prevalencia de la gripe a partir de la actividad digital en Bolivia fracasaron porque su población depende de los médicos o curanderos tradicionales para diagnosticar la gripe, en contraste con el alto número de estadounidenses que lo hacen en línea.
 
Esto podría constituir un ejemplo de la “arrogancia del Big data” que David Lazer, de la Universidad Northeastern de los Estados Unidos y sus colegas señalaron en una reciente crítica de Google Flu Tracker en Science. [5] Esto es  “asumir que Big data es un sustituto y no un complemento de la recolección y análisis tradicional de datos”, escribieron. Ellos encontraron  también que Google Flu Tracker sobreestimó los casos de gripe en los Estados Unidos.
 
“Hay una gran cantidad de potencial aquí, pero también hay un gran potencial de cometer errores”, declaró Lazer al Washington Post.
 
¿Datos más fáciles de aprovechar?
 
Pero los desafíos de la brecha digital se pueden eludir con otras fuentes de datos. Por ejemplo, los registros de datos de llamadas (CDR por sus siglas en inglés) —que dan la ubicación, el número de destino, la duración y el gasto de la información generada por las llamadas de teléfonos celulares— están mucho más disponibles en algunos países, informa  Frías-Martínez.
 
Dar a los investigadores un mayor acceso a los CDR desde una amplia variedad de ubicaciones y empresas, potencialmente desde un repositorio digital, podría ayudar a generar Big data para la investigación del desarrollo, opina. Los patrones de movimiento de la población que los CDR pueden demostrar ya han ayudado a rastrear los brotes de malaria en Kenia y la migración de emergencia luego del terremoto de Haití en 2010, y se está intentando utilizarlos para planeamiento de infraestructura en Costa de Marfil. [6]
 
“Hasta ahora hemos estado trabajando como investigadores en nuestros propios sitios, con nuestras propias bases de datos pequeñas”, reconoce. “Si realmente queremos avanzar en esto tiene que haber una infraestructura que nos permita acceder en tiempo real de manera que todos podamos colaborar como una comunidad”.
 
Sin embargo, Frías-Martínez, que anteriormente realizó minería de datos para una multinacional de las telecomunicaciones, duda que las empresas flexibilicen sus preocupaciones sobre la privacidad y la competencia comercial.
 
“Lo que nos está impidiendo (establecer un repositorio) es convencer a las compañías de telecomunicaciones a que compartan sus datos”, explica. “Ellas ven los datos de los CDR como una ventaja competitiva, por lo que será difícil”, reflexiona.
 
I-Sah Hsieh, gerente mundial para el desarrollo internacional en SAS, empresa especializada en análisis de Big data, es más positivo. Dice que hay ejemplos del sector de seguros y de la industria farmacéutica —un convenio de 2013 entre los grupos farmacéuticos comerciales de Estados Unidos y Europa ha liberado significativamente el acceso de los investigadores a los datos de ensayos clínicos— donde la información comercial ha sido compartida.
 
Y el experimento Naranja (Orange) en Costa de Marfil mostró la utilidad de los datos de  los teléfonos celulares para varias iniciativas de desarrollo.
 
Incluso sin colaboración de la industria, puede haber “increíbles ideas” tan solo haciendo mejor uso de los grandes repositorios de información que ya poseen los gobiernos de las bases de datos inconexas, subraya.
 
“El primer paso para dar alto valor al Big data es sincronizar y enlazar esas bases de datos y después pensar en combinarlas con las montañas de datos de las redes sociales y la web”, refiere a SciDev.Net.
 
La falta de personal capacitado para hacer frente de manera competitiva a grandes conjuntos de datos ciertamente es un tema importante, añade, pero la tecnología que correlaciona los enlaces entre enormes cantidades de datos hará “analíticas a las masas”, precisa. Ayudar a los legos a analizar los datos puede liberar a los especialistas para realizar tareas más demandantes, prosigue.
 
Las barreras que enfrenta el Big data para convertirse en una herramienta útil para el desarrollo son numerosas y grandes. Pero no son insuperables. Con la comunidad de desarrollo agrupada en torno a la llamada revolución de datos de la ONU, no hay razón para creer que el Big data no pueda cumplir su promesa en los años venideros.
 
La versión original de este artículo se publicó en la edición global de SciDev.Net
 
Este artículo forma parte del Especial sobre Big data para el desarrollo