Normalizar texto en Python
source link: https://carlosvin.github.io/langs/es/posts/normalize-text-py/
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
Normalizar texto en Python
Evitar problemas con textos que contienen caractéres no ASCII
En muchos idiomas, como es el caso del español, hay caracteres que no tienen representación ASCII, como por ejemplo la á, que sí que tiene representación en Unicode.
Para evitar problemas o por simplificar, se ha dado una equivalencia entre los caracteres Unicode y los ASCII. A continuación os pondré un trozo de código en Python que hace esta conversión.
-
Especificamos la forma normal que aplicamos en la normalización. En este caso
NFKD
. Más información sobre Tipos de formas normales. -
Confertimos el resultado de la normalización a ASCII. En caso de que un carácter sea erróneo simplemente será ignorado.
Recommend
About Joyk
Aggregate valuable and interesting links.
Joyk means Joy of geeK