05/05/2024

Taiwan Today

Taiwán Hoy

Novedoso adelanto en el campo de la Informática

01/05/1986
Foto de HSIEH KUO-CHENG Panorámica del equipo, en el laboratorio de procesamiento de imágenes.
¿Una computadora que lee, procesa y almacena caracteres chinos escritos a mano? Suena cual si fuese una fantasía hecha realidad extraída de un cuento de ciencia ficción. Sin embargo, es algo ya existente y "la quinta generación" de computadoras en chino estará quizás en el mercado dentro de dos ó tres años. Mientras tanto, se encuentra en proceso el surgimiento de esta próxima generación, en un laboratorio del Departamento de Ingeniería Electrónica de la Universidad Nacional Tsinghua, de la República de China, localizado en "la Ciudad Científica" de Hsinchu: Los inventores -el profesor Hsu Wen-hsing, diez estudiantes graduados universitarios y seis no graduados- han trabajado allí por un período de entre 1 a 3 años. Hasta hoy en día, sus esfuerzos están descritos en 10 artículos, uno preparado específicamente para las personas ajenas al asunto y con bastante terminología técnica, para que sea realmente comprensible para las personas no expertas. Sin embargo, lo que se trata de dejar claro con una cuidadosa ojeada al equipo dentro del laboratorio es "alimentar" una computadora con caracteres escritos a mano; en este caso, puesto o sencillamente escrito enfrente de una cámara o sustituir el uso rutinario de un teclado, una entrada directa de una cámara y otros aparatos. La computadora, en cambio, debe aprender a "leerlo" o "entenderlo" . "Después de diez años de investiga­ción, me di cuenta finalmente que sería como llegar a un callejón sin salida el expandir la entrada por medio del teclado", explicó el profesor Hsu. Después de dos años de investigación en el Japón, trajo a su "lector óptico de caracteres" a la República de China, el único lugar en el mundo que realiza un verdadero desarrollo en dicho esfuerzo. Las primeras cuatro generaciones de computadoras en chino, ligadas todas a la entrada del teclado, han probado desde hace mucho tiempo que los caracteres del idioma chino pueden manejarse realmente por computadoras, algo que hasta pocos algunos años se consideraba casi imposible. Actualmente las avanzadas computadoras en idioma chino tienen evidentes limitaciones, pero son comparables a los sistemas manejados en los programas en idioma inglés. Desde hace mucho tiempo el principal proveedor mundial de esas computadoras en chino ha sido IBM, ¿quién otro podría ser? Su computadora modelo 5550 fue diseñada para almacenar 1.000 caracteres comúnmente usados, directamente dentro de su propio sistema. Sin embargo, más recientemente, Multitech, una división de Sertek Internationol Inc. de Taiwan anunció un asombroso adelanto: "la quinta generación" de computadoras en chino. Utilizando trocitos ROM (read-only memory) o sea leer solamente la memoria; este diseño único (modelo DCS-570) puede manejar 30.000 caracteres por segundo. Tal velocidad permite la presentación a la manera de texto, lo que constituye un gran paso hacia adelante en la computación no solamente en chino, sino que en cualquier idioma ideográfico no europeo. Sin embargo, ¿qué pasa con el callejón sin salida de la entrada al teclado identificado por el profesor Hsu? Por su­ puesto, la principal limitación consiste en la completa multiplicidad y complejidad de los caracteres chinos, debido a que cada carácter es generalmente de una sola palabra. Considerando las 26 palabras del alfabeto latino, el chino tiene aproximadamente 50.000 caracteres (desde luego, no todos ellos son de uso común). Para poder leer un periódico, deben conocerse aproximadamente 2.000 palabras y para poder recibir educación universitaria, aproximadamente 5.000. Poner en cifras y unir un número suficiente de caracteres o partes del mismo de un teclado de tamaño razonable, es algo insuperable, un hecho que está en contra del verdadero uso común de las máquinas de escribir de caracteres chinos, mucho antes que las computadoras estuvieran en uso general. De todas formas, el profesor Hsu llegó finalmente a la conclusión de que la escritura a mano prevalecerá dentro de los chinos, no solamente debido a las limitaciones del teclado de la computadora, sino que porque la escritura china es la personificación de la cultura china, combinando la belleza artística de la forma con las complejas expresiones de significado, enraizadas en la historia china antigua. Por lo tanto -dice- el reconocimiento de la computadora de los caracteres escritos a mano, constituye un verdadero desafío para los diseñadores de computadoras en chino de hoy en día. Las dificultades son evidentes, empezando con los caracteres pobremente escritos y terminando con la necesaria simplificación de los caracteres que resulten demasiado complejos. Además está el problema del estilo personal de escritura de cada persona, algo que los chinos admiran y que se esfuerzan en llegar a alcanzar. Podría parecer una broma, pero él dice que podríamos ver finalmente el desarrollo de computadoras programadas individualmente, para reconocer la escritura personal del operador, que sería como tener una secretaria-robot personal. Sin embargo en la actualidad, en su laboratorio la tarea consiste aún en enseñarle a la computadora a leer apropiadamente o para ser más exacto, encontrar la mejor forma de enseñarle a la computadora a empezar y luego cómo mejorar su consiguiente promedio de reconocimiento y velocidad en conjunto. Hasta ahora, la "computadora para estudiantes" puede "reconocer" sólo un carácter chino en 20 segundos, con el 94,3 por ciento de exactitud. Pero ésto, dice Hsu, está muy lejos de la expectativa eventual. De los antecedentes experimentales ya construidos, sostiene que por lo menos 50 caracteres deben ser reconocidos en un segundo. Eso bate el récord de logros de entrada al teclado, que es de 40 caracteres por minuto. Obviamente, las adaptaciones de la computadora a los caracteres escritos a mano constituye una tarea más difícil que las formas impresas estandarizadas. Para cuando la computadora pueda estar organizada para acoplarse bien con la escritura manual, las adaptaciones de la computadora para imprimir caracteres chinos serán más avanzadas. Fang-Hsuan Cheng, estudiante de doctorado, enfoca la cámara hacia un tablero con algunos caracteres chinos escritos en él. Instantáneamente el monitor refleja los mismos caracteres. Sí, la computadora ha leído y presentado realmente los caracteres, pero están un poco fuera de forma y quizás demasiado estilizados. El profesor Hsu explica ahora "el procesamiento de imágenes", "la extracción de trazos", "la extracción de radicales" y "la combinación de radicales", lo que resulta un tipo de ejercicio similar al "divide y vencerás": tomando por separado los caracteres de acuerdo con las reglas de escritura, o escribiéndolos al revés, del final al principio. Por ejemplo, tomando el carácter para "palabra" (言); es uno de los más sencillos y está compuesto únicamente por ocho trazos. La computadora tiene que contar los trazos, luego determinar la extensión, dirección y posición de cada uno de ellos para poder reconocer la palabra misma. Los caracteres más difíciles, en dos partes complejas, son trabajados en primer lugar, a través de la parte llamada "el radical"; la computadora extrae primero esa porción y examina su posición, dirección y extensión. Debido a que un gran número de caracteres compuestos comparten los mismos radicales, usándolos como referencia, se hace posible identificar más rápidamente un mayor número de caracteres. Por ejemplo, se necesitan por lo menos 2.000 "modelos de referencia" radicales para reconocer 13.000 caracteres. "Algunos de nuestros soportes físicos (hardware) están ya muy viejos y necesitan que se les reemplace", indicó Hsu, señalando hacia una computadora en medio de un montón de equipo. El grupo parecería estar bastante desorganizado para una persona ajena al asunto. Básicamente, existían solamente cuatro "partes" en ese sistema. La primera, la cámara, que parece una cámara de video; la segunda, un procesador de imágenes; la tercera, un par de computadoras y la cuarta, un monitor. ¿Llegará un día este "lector óptico de caracteres" a ser lo suficientemente eficiente para que la entrada al teclado sea totalmente obsoleta? De ninguna manera, dice Hsu. El teclado, aparte de ser más exacto, es potencialmente más rápido que la escritura a mano; por ejemplo, un operador de teclado con experiencia, puede escribir un promedio de 50 palabras por minuto, mientras que la pluma más rápida de una secretaria no puede escribir más que 40 palabras legibles por minuto. El teclado se adapta bien a la rutina y continuará siendo muy útil. Pero para la mayoría de chinos, la pluma y el papel continuarán siendo los principales elementos de comunicación por escrito, pero en el futuro podrán encontrar también los sistemas computarizados de "lectura óptica". □

Popular

Más reciente