gravatar

Convertir codigo HTML a caracteres ASCII españoles

En java puede utilizar este programa para convertir texto con caracteres españoles en código HTML hacia los caracteres conocidos de la escritura castellana.


public class Convertir {

public static void main(String[] args) {

String stringHTML = "A B<b>C</b><br />DE";
String converted = convert(stringHTML);
System.out.println(stringHTML);
System.out.println(converted);
System.out.println(converted.replaceAll("</?\\w++[^>]*+>", ""));
}

static String convert(String in) {
return in.replace("&amp;","&")
.replace("&nbsp;"," ")
.replace("&lt;","<")
.replace("&gt;",">")
.replace("&ntilde;","ñ")
.replace("&Ntilde;","Ñ")
.replace("&aacute;","á")
.replace("&eacute;","é")
.replace("&iacute;","í")
.replace("&oacute;","ó")
.replace("&uacute;","ú")
.replace("&iquest;","¿")
.replace("&iexcl;","¡")
.replace("&quot;","\"")
.replace("&#039;","'");
}
}
El resultado de este programa es lo siguiente:

A&amp;nbsp;B&lt;b&gt;C&lt;/b&gt;&lt;br /&gt;DE
A B<b>C</b><br />DE
A BCDE