02/05/2024

Taiwan Today

Taiwán Hoy

GRAN FUTURO PARA LOS DATOS MASIVOS

01/07/2015
Una representación visual de los resultados de un proyecto de análisis de datos masivos para identificar botnets, redes de computadoras infectadas con un soporte lógico malicioso. (Foto cortesía de NCHC)
El Centro Nacional para Computación de Alto Rendimiento y la Universidad de Soochow están colaborando en un proyecto pionero para la educación e investigación en datos masivos.

Hubo un tiempo en un pasado no tan distante en que la informática era un bien muy escaso. Pero, no ahora. Desde el inicio de la era digital, los gobiernos, organizaciones y personas particulares han estado produciendo cantidades cada vez más grandes de datos, incluso con mayor rapidez. “Cada aparato móvil, cada computadora de escritorio y cada red en cada edificio de oficinas en el mundo está constantemente creando y comunicando datos”, explica Hsu Chin-hsiung, profesor del Departamento de Ingeniería Financiera y Matemática Actuarial de la Universidad de Soochow, en la ciudad de Taipei. “Durante la última mitad de siglo, a medida que la tecnología de computación se ha vuelto cada vez más prevalente en casi todos los aspectos de nuestras vidas, nuestra capacidad para acumular rápidamente datos nos ha conllevado a significativos cambios en cómo analizamos y utilizamos la información”.

El crecimiento exponencial, y la disponibilidad de la información nos han conllevado al surgimiento de datos masivos, que se refiere a las series de datos tan grandes y complejos que se necesitan nuevos enfoques y tecnologías a fin de extraerlos para el conocimiento. El análisis informático de datos masivos ha evolucionado a paso rápido en los últimos años y ya afecta en numerosos aspectos de la vida diaria, desde las prácticas comerciales hasta la planificación urbana.

Debido a la creciente importancia de este campo, varias universidades en Taiwan han creado clases e institutos de investigaciones sobre datos masivos en los últimos años. La Universidad Yuan Ze, en la norteña ciudad de Taoyuan, Taiwan, estableció un Centro de Innovación para Datos Masivos y Convergencia Digital el año pasado; y actualmente, el Instituto de Estadísticas de la Universidad Nacional Chiao Tung, en la norteña ciudad de Hsinchu; y el Departamento de Estadística de la Universidad Nacional Chengchi, en Taipei, ofrecen cursos sobre datos masivos.

Mientras tanto, Soochow juega un papel de liderazgo en la promoción de las investigaciones de datos masivos en Taiwan. En 2012, dicha universidad estableció el Centro para Análisis e Investigaciones de Datos Masivos; y el año pasado, inauguró su Escuela de Administración de Datos Masivos. La escuela, la primera dedicada exclusivamente a dicha disciplina en el sistema de educación terciaria del país, se encuentra actualmente reclutando estudiantes de pregrado y de postgrado a tiempo parcial para sus programas inaugurales durante el año académico 2015-2016. Más aún, tiene planes de ofrecer cursos de postgrado a tiempo completo una vez que los estudiantes en su clase de licenciatura inicial hayan completado sus estudios.

Un vídeo de promoción sobre el establecimiento de la escuela señala que más de 2,5 quintillones de bytes de datos se producen a nivel mundial diariamente, y mientras esta información pareciera al azar e incomprensible, los expertos pueden usarla para predecir los hechos fututos y descubrir relaciones causales ocultas. “Una considerable cantidad de investigaciones sobre datos masivos enfoca en la predicción de eventos, tales como los desastres naturales o por causas humanas, los ciclos de vida de los productos, o el auge y caída de industrias”, señala Pan Wei-ta, rector de la Universidad de Soochow, en el vídeo.

La capacidad para identificar patrones en los sistemas complejos tiene grandes repercursiones en una variedad de áreas. Por ejemplo, los análisis de datos masivos pueden ayudar a los planificadores urbanos a entender cómo se desarrollarán los patrones de tráfico, ayudando a prevenir accidentes y congestiones; así como ofrecer a la policía información más precisa acerca de dónde deben asignar a los agentes encargados del control de tránsito, dice Hsu.

Los datos masivos cubren una significativa cantidad de campos académicos, requiriendo que investigadores posean una variedad de conocimientos interdisciplinarios. “En esencia, los datos masivos constituyen la ciencia de recolectar, clasificar, examinar e interpretar grandes bancos de juegos de datos”, explica Hsu, quien funge como director ejecutivo del Centro para Análisis e Investigaciones de Datos Masivos de Soochow, y encabeza la oficina preparatoria para la creación de la Escuela de Administración de Datos Masivos.

El profesor explica que el programa de pregrado de cuatro años de la escuela ofrecerá cursos que cubren una gama de campos, tales como ciencia analítica, sistemas informáticos, matemáticas y estadísticas. “Los estudiantes recibirán un entrenamiento de base amplia durante los primeros tres años de estudios”, dice. “También hemos establecido acuerdos de cooperación con un número de empresas, de manera que en su último año la mayoría de los estudiantes puedan obtener experiencia de trabajo y descubrir cómo los datos masivos son utilizados en situaciones del mundo real”.

Hsu señala que a los estudiantes se les requerirá afinar sus habilidades de comunicación y presentación ya que el análisis informático de datos masivos es un campo complejo y los investigadores necesitan aprender cómo presentar los resultados e implicaciones de su trabajo a los líderes empresariales y encargados de la toma de decisión política. “Los científicos de los datos masivos deben ser capaces de comunicarse efectivamente para asegurar que los clientes aprovechen los beneficios completos de sus investigaciones”, dice.

Los esfuerzos de Soochow para desarrollar sus capacidades de investigaciones en datos masivos recibieron un impulso masivo a inicios de este año cuando logró un acuerdo de colaboración con una de las más avanzadas instituciones científicas de la nación. En enero, la universidad firmó un memorándum de entendimiento sobre cooperación académica e investigación en datos masivos con los Laboratorios Nacionales de Investigaciones Aplicadas (NARL, siglas en inglés). Con fondos provenientes en su mayoría del Ministerio de Ciencia y Tecnología (MOST, siglas en inglés), los NARL consisten de 11 organizaciones, incluyendo el Centro Nacional de Computación de Alto Desempeño (NCHC, siglas en inglés), que tiene su sede en el Parque Científico de Hsinchu, en el norte de Taiwan.

El rector de la Universidad de Soochow, Pan Wei-ta (tercero a la izquierda, primera fila); el presidente de los NARL, Lo Ching-hua (cuarto a la izquierda, primera fila); el director general del NCHC, Shieh Ce-kuen (tercero a la derecha, primera fila); y el profesor Hsu Chin-hsiung (derecha), posan después de la ceremonia de firma de un memorándum de entendimiento de cooperación en datos masivos en la universidad en Taipei. (Foto cortesía de la Universidad de Soochow)

Según el acuerdo, el NCHC pondrá a la disposición de sus instalaciones de computación al Centro para Análisis e Investigaciones de Datos Masivos de Soochow, y a la Escuela de Administración de Datos Masivos, además de suministrar personal docente a los nuevos programas académicos de la universidad. En su discurso durante la ceremonia de firma del memorándum en la Universidad de Soochow, el presidente de los NARL, Lo Ching-hua, destacó que si bien la organización está cooperando activamente con instituciones terciarias en una variedad de áreas, este acuerdo marca la primera vez en que colabora con una universidad en investigaciones sobre datos masivos. Esta acción “es una piedra angular en el desarrollo de este campo en Taiwan”, afirmó.

El acuerdo es muy significativo para el centro y la escuela de Soochow, ya que ofrecerá para estudiantes y miembros de la facultad acceso a considerables recursos de computación que se requieren para realizar análisis de datos masivos. Fundado en 1991, el NCHC es el único centro de supercomputación a nivel nacional en Taiwan. Fue desarrollado conjuntamente por el Ministerio de Educación y el Consejo Nacional de Ciencias, que fue reorganizado en el MOST a inicios del año pasado como parte de un programa de reestructuración gubernamental, con el fin de promover los descubrimientos científicos y la innovación tecnológica mediante el suministro de servicios de supercomputación a los sectores académicos e industriales de Taiwan. Desde inicios de los años 2000, el NCHC ha desarrollado y construido su serie de computadoras Formosa. También es el hogar de la supercomputadora Avanzada de Superagrupación Paralela de Gran Escala, que ha sido apodada como Windrider y fue construida en cooperación con el gigante de las computadoras en Taiwan, Acer Inc.

El Gobierno de la República de China (RDCh) se encuentra actualmente promoviendo un posterior desarrollo y utilización de los recursos de datos masivos en la nación. En enero, el Ministerio de Economía anunció que iniciará este año un proyecto de cuatro años por 38,7 millones de dólares estadounidenses que en sus etapas iniciales comisionará a dos organizaciones de investigaciones patrocinadas por el Gobierno –el Instituto para Investigaciones en Tecnología Industrial y el Instituto de la Industria Informática– para que investiguen las aplicaciones y tendencias de los datos masivos.

Las medidas del Gobierno de la RDCh para apoyar el crecimiento del sector de los datos masivos están dirigidas por el viceprimer ministro, Chang San-cheng, quien ha jugado un papel fundamental en el desarrollo de la infraestructura de la red y la supercomputación de Taiwan. Un ex profesor de Ingeniería Civil en la Universidad Nacional de Taiwan, en Taipei, Chang ayudó a fundar el NCHC y fungió como su primer director de 1991 a 1997, antes de trabajar para Acer y Google Inc.

En 2012, Chang fue designado ministro sin Cartera y ayudó a supervisar las iniciativas gubernamentales para el desarrollo de la industria de tecnología informática y de comunicaciones (ICT, siglas en inglés). Subsecuentemente, fue nombrado como el primer ministro a cargo del MOST antes de asumir a su actual cargo en diciembre pasado. Como Viceprimer Ministro, Chang coordina los esfuerzos de los ministerios gubernamentales y la comunidad académica para promover el uso del análisis informático de datos masivos en los sectores público y privado.

El director general del NCHC, Shieh Ce-kuen, es actualmente responsable de proseguir con los esfuerzos de su antecesor para desarrollar las capacidades de supercomputación en Taiwan, que serán cruciales para el avance de las investigaciones en datos masivos en la nación. Shieh destaca que mientras el centro continua ofreciendo servicios de supercomputación a los académicos en campos tales como las ciencias biomédicas y la ingeniería; también se encuentra ocupado preparando las instalaciones y herramientas necesarias para la efectiva investigación en datos masivos. “Si bien seguimos comprometidos a fortalecer constantemente nuestras capacidades de computación”, explica Shieh, “el enfoque actual de ayudar al procesamiento de datos masivos requiere una reorientación de nuestros planes de desarrollo y arreglos presupuestarios”.

Tsai Jyun-hwei, uno de los dos subjefes del NCHC, señala que los datos masivos constituyen un área relativamente nueva, y “estamos haciendo esfuerzos significativos para asegurar que nos mantengamos a la par con los últimos avances en este campo”. El explica que si bien el centro ha realizado intercambios y programas de colaboración con el sector académico en forma regular durante muchos años, llevar a cabo las investigaciones sobre datos masivos requerirá la adopción de nuevos enfoques en áreas tales como almacenaje de datos y desarrollo de soporte lógico (software). Mientras el NCHC trabajaba en el pasado mayormente en proyectos de ciencias aplicadas y físicas, los investigadores en Soochow esperan usar las instalaciones de computación de alto rendimiento para los análisis de datos masivos en campos que se encuentran dentro de las ciencias sociales, tales como economía y estudios legales.

El NCHC y el plan de la Escuela para Administración de Datos Masivos enfocan sus proyectos de colaboración iniciales en el estudio de asuntos de atención a largo plazo de la sociedad que envejece de Taiwan, los mecanismos para la administración de riesgos de desastre, y el desempleo entre los graduados universitarios. Shieh señala que al realizar estudios de esta naturaleza se requiere de conocimientos para la administración de datos especializados. Por algo, la privacidad se ha convertido en un asunto crucial cuando se trata de enormes cantidades de datos que podrían contener información personal.

“Cuando se realizan análisis de datos masivos, la información en los juegos de datos individuales podrían no contener detalles privados sensitivos”, observa Hsu. “Sin embargo, al realizar un análisis cruzado de numerosos juegos de datos, algunas veces se revela una significativa cantidad de información personal acerca de los individuos”. Debido a los posibles impactos que tales investigaciones puedan tener sobre la privacidad, el profesor desearía ver procesos tales como la de-identificación –una práctica usada para prevenir que la identidad de una persona se encuentre enlazada con los datos– sean incorporados en las leyes del caso, incluyendo la Ley para la Protección de la Información Personal.

Los gastos en servicios, soporte físico y soporte lógico relacionados con los datos masivos en el mundo entero alcanzará 125 mil millones de dólares estadounidenses en 2015, según la empresa de investigación de mercado de Estados Unidos, International Data Corporation. Taiwan, que ha sido por mucho tiempo un actor clave en el sector de ICT a nivel mundial, se encuentra bien situada para sacar ventajas de las numerosas oportunidades comerciales en este campo que se desarrolla rápidamente, dice Shieh. Por otro lado, Hsu hace hincapié en la importancia de formar recursos humanos capacitados, señalando que la experiencia en datos masivos es actualmente muy solicitada por la industria de ICT. “En el futuro, los científicos de los datos masivos podrán ser certificados por gobiernos a través de contables, abogados y actuarios”, señala el profesor. “En vista del enorme potencial comercial de la analítica de datos masivos y las contribuciones que puede hacer a la toma de decisiones públicas, no debemos perder más tiempo sino que debemos desarrollar una suficiente base de talentos en esta área”.

Popular

Más reciente