Neulich (lies "1997") braucht ich mal einen Konverter, der aus einer HTML-Datei eine einigermassen lesbare ASCII-Textdatei macht. Alle Konverter, die ich auf diversen CDs fand, taugten nix. Die meisten konnten nicht mal die Umlaute rückwandeln oder auch nur ein bischen formatieren.
Also selberschreiben. Dabei kam dann nach kurzer Zeit ein Kommandozeilenprogramm heraus, welches nicht besonders toll ist, aber für fast alle HTML-Seiten brauchbare Ergebnisse liefert.
Aufruf:html2txt filename.html filename.txtoder auch komplett mit Eingabeumleitung:
html2txt <filename.html >filename.txt
RunterladenHier kann man html2txt für einige Betriebssysteme runterladen. html2txt ist natürlich GPL. Weitere Versionen wird es wohl nicht mehr geben - inzwischen gibt es genug Alternativen. |
DownloadHere you can download html2txt (it's freeware). Choose one of the following according to the operating system you use. |
Source / Quelltext | |||
Linux - Konsole | use Lynx -d | ||
OS/2 - Konsole | Version 1.31 | 2.Aug.97 | ca. 21k |
DOS | Version 1.31 | 2.Aug.97 | ca. 21k |
Win32 - Konsole | Version 1.31 | 2.Aug.97 | ca. 28k |