 2 years ago
How can i filter the non alphanumerical characters out of a string, but keep the accents untouched ?


$string = "présentation d'un texte, avec des accents (en français!) & autres..."

Should be replaced by:

$string = "présentation dun texte avec des accents en français  autres"

You can try this regex:

$str = "présentation d'un texte, avec des accents (en français!) & autres...";
echo preg_replace('/[^\p{L}\s\p{N}]+/u', '', $str);
//=> présentation dun texte avec des accents en français  autres

Character class [^\p{L}\s\p{N}]+ means match 1 or more of characters are NOT:

  1. unicode letters
  2. unicode digits
  3. space

/u flag is for matching unicode letters.

