¿Qué son los caracteres ASCII y Unicode?

El material informático está compuesto de números. En los viejos tiempos, solo podía almacenar un número de 0 a 255 en un byte (lugar) de memoria de la computadora. Se decidió que todo lo que se podía ver en la pantalla de una computadora (y algunos caracteres de formato) debería estandarizarse, y ASCII es esa lista.

A = 65
B = 66
a = 97
b = 98

Etcétera. Incluía todos los símbolos normales del teclado, mayúsculas y minúsculas, y como mencioné, el formato (final de línea, retroceso, tabulación, etc.).

Y solo hay 255 espacios para hacer esto (256 si incluye cero).

Como puede imaginar, con todos los idiomas del mundo, todas las letras y símbolos no cabían en 255 espacios, por lo que Unicode comenzó como dos espacios juntos, lo que da 65535 posibilidades (dos bytes). Los primeros 256 lugares de Unicode son los mismos que ASCII, para facilitar el cambio.

En 1996, expandieron Unicode a más de un millón de espacios, ¡suficiente para todos!

Originalmente escrito para “¿Por qué necesitamos Unicode en lugar de ASCII?”

A continuación encontrará las principales diferencias enumeradas entre Unicode y ASCII que encontré en un interesante artículo que estaba leyendo:

  1. ASCII usa una codificación de 8 bits, mientras que Unicode usa una codificación de bits variable.
  2. Unicode está estandarizado mientras que ASCII no.
  3. Unicode representa la mayoría de los idiomas escritos en el mundo, mientras que ASCII no.
  4. ASCII tiene su equivalente dentro de Unicode.

Unicode también puede representar idiomas regionales, los guiones para los cuales están muy lejos de Latin Roots & Scripts. Una de las mayores ventajas de Unicode es que el contenido representado en dicho sistema de codificación de bits se puede convertir fácilmente a Braille y Speech, lo que hace que la literatura esté disponible incluso para un grupo más amplio de personas de lo que hemos aceptado como norma.

Muchas empresas de soluciones de publicación digital alientan a los autores y editores a publicar libros electrónicos en Unicode para mantener la capacidad de búsqueda y el dinamismo de su contenido.

Ya he discutido esto aquí Unicode | ¿Qué y por qué?