In der deutschen Sprache gibt es einerseits sehr lange Worte und andererseits viele Möglichkeiten, diese zu trennen. Das Wort Silbentrennung
beispielsweise kann so getrennt werden: Sil-ben-trenn-ung
. In einem Fließtext können so leider eher unschöne Trennungen auftreten, die zwar grammatikalisch korrekt sind, das Erfassen des Wortes durch den Leser aber schwierig machen: Sil-bentrennung
, oder Silbentren-nung
. Dabei gibt es eigentlich nur eine Möglichkeit, das Wort sinnvoll zu trennen, nämlich zwischen den beiden Worten, aus denen es sich zusammen setzt: Silben-trennung
.
Unsaubere Trennungen können mitunter sogar zu Missverständnissen führen, z.B. bei Nonnenklo-ster
anstatt Nonnen-kloster
oder Urin-stinkt
anstatt Ur-instinkt
.
Leider verfügen Layoutprogramme wie Adobe InDesign, Quark XPress oder Affinity Publisher bis heute über keine Möglichkeit, solche Trennungen automatisiert vorzunehmen. Auch Browser sind hier bis heute eher unterentwickelt; noch nicht einmal Silbentrennung allgemein wird von allen Browsern gleichermaßen unterstützt, ganz zu schweigen von Feineinstellungen dazu.
Hyphenizer verfügt über drei interne Trenn-Algorithmen, die in der Lage sind, jedes Wort in seine Bestandteile zu zerlegen.
Die von Hyphenizer vorgeschlagenen Trennungen lassen sich am besten durch bedingte Trennungen (sogenannte Soft Hyphens) integrieren. So kann jedes Layout-Programm und jeder Browser dort trennen, wenn es nötig wird, und das Wort anderenfalls belassen wie es ist.
Wie ein bestimmtes Wort getrennt wird, kann variieren. Zum Beispiel wird Bodensee
von Hyphenizer getrennt in Boden-see
. Bei Bodenseefelchen
wird dann als optimale Trennmöglichkeiten nicht etwa Boden-see-felchen
vorgeschlagen, sondern Bodensee-felchen
.
Testen Sie hier den Hyphenizer im Browser. Die folgenden Textfelder enthalten einen Beispieltext, der mit und ohne Trennungen sowie mit und ohne Unterstützung des Hyphenizer dargestellt wird. Sie können die Textrahmen verkleinern und vergrößern.
Das Gesetz verpflichtet Personen und Unternehmen, verursachte Schäden zu ersetzen. Dabei gibt es keine Entschädigungsobergrenze. Ein Schaden kann schnell in die Tausende gehen. Somit riskiert man im Schadenfall sein gesamtes Unternehmen. Die Betriebshaftpflichtversicherung leistet bei berechtigten Forderungen und wehrt unberechtigte Forderungen für Sie ab. Sie ist somit für Ihren Betrieb von essenzieller Wichtigkeit.
Das Gesetz verpflichtet Personen und Unternehmen, verursachte Schäden zu ersetzen. Dabei gibt es keine Entschädigungsobergrenze. Ein Schaden kann schnell in die Tausende gehen. Somit riskiert man im Schadenfall sein gesamtes Unternehmen. Die Betriebshaftpflichtversicherung leistet bei berechtigten Forderungen und wehrt unberechtigte Forderungen für Sie ab. Sie ist somit für Ihren Betrieb von essenzieller Wichtigkeit.
Das Gesetz verpflichtet Personen und Unternehmen, verursachte Schäden zu ersetzen. Dabei gibt es keine Entschädigungsobergrenze. Ein Schaden kann schnell in die Tausende gehen. Somit riskiert man im Schadenfall sein gesamtes Unternehmen. Die Betriebshaftpflichtversicherung leistet bei berechtigten Forderungen und wehrt unberechtigte Forderungen für Sie ab. Sie ist somit für Ihren Betrieb von essenzieller Wichtigkeit.
Das Gesetz verpflichtet Personen und Unternehmen, verursachte Schäden zu ersetzen. Dabei gibt es keine Entschädigungsobergrenze. Ein Schaden kann schnell in die Tausende gehen. Somit riskiert man im Schadenfall sein gesamtes Unternehmen. Die Betriebshaftpflichtversicherung leistet bei berechtigten Forderungen und wehrt unberechtigte Forderungen für Sie ab. Sie ist somit für Ihren Betrieb von essenzieller Wichtigkeit.
Websites, die mit Kiwa erstellt werden, können die Hyphenizer REST API über die Kiwa Hyphenizer Library für Composer implementieren.
Für das Austauschen der getrennten Worte mit JavaScript gibt es die Kiwa Hyphenizer Library für Node.
Zurzeit arbeiten wir an einer Implementierung des Hyphenizer für Adobe InDesign.
Der Hyphenizer kann auch in SiteFusion integriert werden. Bitte kontaktieren Sie uns, wenn Sie sich für eine Integration interessieren.
Hyphenizer wurde bereits in der Layout-Automatisierungs-Software ManyPrint Solutions implementiert und kann dort verwendet werden.
Hyphenizer verfügt über eine REST API, über die Worttrennungen angefragt werden können. Sie befindet sich unter api.hyphenizer.com.
Für die Verwendung der REST API ist ein API-Token notwendig.
Zwei Bestandteile des Response sind zu beachten:
score
gibt in Prozent wieder, wie sicher die Trennung ist. Trennungen mit einem Score von mehr als 50 % können meist bedenkenlos verwendet werden. Trennungen mit einem geringen Score werden intern weiter verarbeitet und können zu einem späteren Zeitpunkt erneut abgefragt werden.approved
steht für die manuelle Validierung durch einen Menschen. Dies ist die höchste Form von Qualitätskontrolle. Trennungen, bei denen approved
mit true
versehen wurde, können bedenkenlos verwendet werden. Sie haben dann auch einen Score von 100 %.hasTypo
gibt eine Rückmeldung darüber, ob das Wort als Rechtschreibfehler markiert wurde. Damit kann der Hyphenizer auch zur Fehlerkorrektur verwendet werden.Beispiel-Request zum Wort Bodenseefelchen
: https://api.hyphenizer.com/v2/words/Bodenseefelchen?token={API_TOKEN}
Die Antwort erfolgt via JSON und sieht so aus:
{
"status": 200,
"messages": [],
"payload": {
"Bodenseefelchen": [
{
"hyphenation": "Bodensee|felchen",
"score": 100,
"approved": true,
"hasTypo": false,
}
]
}
}
Wenn der Hyphenizer nach den Trennmöglichkeiten eines Wortes angefragt wird, wird in der internen Datenbank nach bereits hinterlegten Trennmöglichkeiten nachgesehen. Handelt es sich um ein bisher unbekanntes Wort, werden drei Trennalgorithmen nacheinander abgearbeitet, bis das angefragte Wort in seiner Zusammensetzung verarbeitet und semantische Trennungen erkannt wurden. Nach der einmaligen Verarbeitung wird das Wort in der Datenbank hinterlegt, sodass bei einer erneuten Abfrage das Ergebnis ohne erneutes Hinzunehmen der Trennalgorithmen zurückgegeben werden kann. Die erkannten Trennungen werden anschließend manuell validiert und dann als approved
markiert. Der Hyphenizer kann also alle erdenklichen Worte verarbeiten, unabhängig davon, ob sie bereits bekannt oder noch unbekannt sind.
Kontaktieren Sie uns jetzt, um den Hyphenizer in Ihr Projekt zu integrieren.