Neue Trennmuster für LaTeX und oOO

21. November 2007

Die Trennmuster, die für die Silbentrennung mittels Liangs Algorithmus in Programmen wie LaTeX und OpenOffice gebraucht werden, sind wegen der Revision der Deutschen Rechtschreibung nicht mehr aktuell und bedürfen einer Überarbeitung.

Nun hat sich ein kleines Grüppchen gebildet, das es sich zum Ziel gesetzt hat, genau diese Arbeit zu übernehmen.

Grob gesagt geht es darum, sämtliche Wörter aus zwei riesigen Wortlisten mit total 2-3 Millionen Einträgen zu trennen und aus diesen getrennten Wörtern dann neue Trennmuster zu berechnen. Ich schreibe das hier, weil ich es übernommen habe, das Webinterface und die Datenbank im Hintergrund aufzusetzen, damit möglichst viele Leute mithelfen können.

Dikussionen sind auf http://groups.google.de/group/trennmuster-opensource zu verfolgen und der aktuelle Stand des Webinterfaces ist auf http://www.mnn.ch/opendehyph/index.php zu sehen.

Silbentrennung in HTML und JavaScript

16. January 2007

Durch einen kleinen Zufall bin ich auf die Möglichkeit gestossen, über das shy-Zeichen Worttrennungen in HTML zu veranlassen (ausser in Firefox; ausnahmsweise unterstützt der das einmal als einziger Brower nicht).Ich habe unter Silbentrennung einen längeren Artikel dazu geschrieben - und natürlich ein Script, welches mit Liangs-Algorithmus und den Trennmustern aus der TeX-Disribution eine automatische Silbentrennung clientseitig durchführt. Für ein schöneres Web!