11

Normalizar texto en Python

 2 years ago
source link: https://carlosvin.github.io/langs/es/posts/normalize-text-py/
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

Normalizar texto en Python

Evitar problemas con textos que contienen caractéres no ASCII

En muchos idiomas, como es el caso del español, hay caracteres que no tienen representación ASCII, como por ejemplo la á, que sí que tiene representación en Unicode.

Para evitar problemas o por simplificar, se ha dado una equivalencia entre los caracteres Unicode y los ASCII. A continuación os pondré un trozo de código en Python que hace esta conversión.

  1. Especificamos la forma normal que aplicamos en la normalización. En este caso NFKD. Más información sobre Tipos de formas normales.

  2. Confertimos el resultado de la normalización a ASCII. En caso de que un carácter sea erróneo simplemente será ignorado.

Ejecutando la función

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK