¿Por qué son tan pocas las fuentes compatibles con Unicode? ¿Es el gran volumen de caracteres el problema?

En realidad, hay muchas fuentes compatibles con Unicode. La mayoría de las fuentes modernas son compatibles con Unicode.

No es difícil cumplir con Unicode: un archivo TTF u OTF solo necesita contener una tabla cmap que asigne puntos de código Unicode (como U + 0065) a glifos (como “A”).

El cumplimiento de Unicode no significa admitir todos los caracteres en Unicode. Simplemente significa poder buscar los caracteres admitidos por el punto de código Unicode.

Quizás lo que está pensando es una fuente que cubra todos los puntos de código Unicode en lugar de solo ser compatible. Esos son realmente raros: actualmente hay un total de 136,755 caracteres definidos, y se agregan nuevos cada año.

Hacer una fuente implica dibujar una imagen para cada carácter, y si bien hay algunos accesos directos que ahorran tiempo para algunos caracteres (la “i” minúscula turca sin un punto se puede hacer simplemente eliminando el punto de una “i” de puntos regular) esencialmente se reduce a dibujar 136,765 caracteres.

Digamos que usted es el artista más rápido del mundo y conoce todos los sistemas de escritura para cada idioma hablado en el mundo (incluidos los históricos) y puede dibujar un personaje en 3 minutos … trabajando 8 horas al día sin fines de semana o días festivos, tomaría 3 años para hacer una fuente. Para entonces, probablemente se hayan agregado al estándar un par de decenas de miles de nuevos personajes.

En realidad, es posible pasar más de un día trabajando con UN solo personaje, ajustándolo para que se vea bien tanto en la impresión como en la pantalla, ajustándolo para diferentes tamaños y resoluciones. Ajustándolo para tener un contraste consistente con otros caracteres en la fuente.

Como puede imaginar, construir una fuente de alta calidad que cubra completamente Unicode es una tarea enorme. No estoy seguro de que tales fuentes existan, y no hay mucho valor en la creación de tales fuentes, por lo que no hay mucha motivación para que las empresas inviertan en ellas.

Más bien, el enfoque moderno es construir una familia de fuentes compatibles que cubran familias de idiomas particulares. Esencialmente, varias fuentes en la misma familia de fuentes , donde el sistema operativo puede seleccionar desde la base apropiada en el punto de código. Esto significa que no tiene un solo archivo masivo para actualizar cada vez que hay un cambio.

Una de esas familias de fuentes es Noto, que consta de más de 100 fuentes que cubren los 93 scripts en Unicode. Pero no es que aunque todos los guiones estén cubiertos, no todos los caracteres estén cubiertos: Noto cubre aproximadamente 64,000 caracteres. Eso es MUCHO pero aún menos de la mitad del estándar Unicode actual. Google y Adobe han estado trabajando en la familia Noto durante años.

Espero que eso te ayude a darte una idea del alcance de dicho proyecto. ¡Unicode es enorme!

Sí, creo que es la cantidad de trabajo involucrado. Agregar decenas de miles de ideogramas para chino y algunos otros idiomas es un gran esfuerzo para obtener poco o ningún retorno. Los emoji son otro desperdicio ridículo del espacio Unicode.

Además, una fuente que admite todos los caracteres Unicode es enorme, una docena de megabytes o más. Tengo Bitstream Cyberbit, que era una fuente bastante completa a la vez, y tiene 12.7 MB (100 veces más grande que la mayoría de las fuentes profesionales), y Unicode es más grande ahora.