मैं http://www.latijnengrieks.com/vertaling.php?id=5368 से सामग्री को पार्स करने के लिए JSoup का उपयोग कर रहा हूं। यह एक तृतीय पक्ष वेबसाइट है और उचित एन्कोडिंग निर्दिष्ट नहीं करता है।JSoup वर्ण एन्कोडिंग समस्या
Aeneas dwaalt rond in Troje en zoekt Cre?sa. Cre?sa is echter op de vlucht gestorven Plotseling verschijnt er een schim. Het is de schim van Cre?sa. De schim zegt:'De oorlog woedt!' Troje is ingenomen! Cre?sa is gestorven:'Vlucht!' Aeneas vlucht echter niet. Dan spreekt de schim:'Vlucht! Er staat jou een nieuw vaderland en een nieuw koninkrijk te wachten.' Dan pas gehoorzaamt Aeneas en vlucht.
वहाँ है किसी भी तरह से:
public class Loader {
public static void main(String[] args){
String url = "http://www.latijnengrieks.com/vertaling.php?id=5368";
Document doc;
try {
doc = Jsoup.connect(url).timeout(5000).get();
Element content = doc.select("div.kader").first();
Element contenttableElement = content.getElementsByClass("kopje").first().parent().parent();
String contenttext = content.html();
String tabletext = contenttableElement.html();
contenttext = Jsoup.parse(contenttext).text();
contenttext = contenttext.replace("br2n", "\n");
tabletext = Jsoup.parse(tabletext.replaceAll("(?i)<br[^>]*>", "br2n")).text();
tabletext = tabletext.replace("br2n", "\n");
String text = contenttext.substring(tabletext.length(), contenttext.length());
System.out.println(text);
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}
}
इस निम्नलिखित उत्पादन देता है: मैं डेटा लोड करने के लिए निम्न कोड का उपयोग कर रहा हूँ? अंक आउटपुट में मूल (ü) फिर से हो सकता है?
Jsoup को पार्स किया जा सकता है चीजों को बचा लिया। आप आउटपुट को कैसे देख रहे हैं? एक कंसोल विंडो में? एक फ़ाइल में लिखा पाठ? –
अंतिम आउटपुट एक Android TextView में हो जाएगा, लेकिन यह एक कंसोल विंडो है, और एंड्रॉयड logcat ही परिणाम दे दी है। – Hihaatje
बलस का आपका जवाब है। –