Aller au contenu principal
Kostenloses Werkzeug · Redaktionelle Inhalte

Duplicate-Content-Detektor

2 URLs einfügen: das Tool lädt beide Seiten, extrahiert redaktionellen Text, vergleicht via 4-Wort-Shingles. Zur Prüfung, ob Inhalt kopiert wurde.

2 URLs vergleichen

Ähnlichkeit
0
Wörter URL 1
0
Wörter URL 2
0
Shingles URL 1
0
Shingles URL 2

Häufig gestellte Fragen

Wie funktioniert es technisch? +

Das Tool tokenisiert den Text beider Seiten (Chrome entfernt, Kleinschrift, ohne Akzente), generiert dann Shingles (Sequenzen von 4 aufeinanderfolgenden Wörtern). Der Jaccard-Score ist das Verhältnis gemeinsame Shingles / gesamte Shingles. ≥ 85% = identisch (reines Copy-Paste). 50-85% = Quasi-Duplikat. 20-50% = abgeleitet (Paraphrase). < 20% = original.

Warum 4-Gramme? +

Der 4-Wort-Shingle ist akademischer Standard zur Duplikat-Erkennung (Broder 1997). Zu kurz (2-3 Wörter) fängt Rauschen. Zu lang (8-10) und leichte Paraphrase bricht alle Shingles. 4-Gramme erfassen ganze Sätze.

Was wenn die Seite aus einer anderen Sprache übersetzt ist? +

Das Tool erkennt nur wortwörtliche Duplikation. DE→EN Übersetzung wird nicht geflaggt — by design, sonst False-Positives auf mehrsprachigen Sites. Für Übersetzungs-Kopie braucht es mehrsprachiges Embedding.

Mein Inhalt und ein Konkurrent bei 35% — schlimm? +

Oft nicht. Bei Nischenthema zitieren zwei Artikel dieselben Fakten — 30% kohärent. Rote Flagge über 60%: Satzstrukturen selbst recycelt. Bei >70% auf einem originalen Artikel die geteilten Shingles prüfen, oft Boilerplate.

Einzigartiger Inhalt verdient einzigartige Platzierung

Wenn wir einen Originalartikel im Stringer-Netzwerk schreiben, schreiben wir ihn einmal und veröffentlichen exklusiv. Keine Syndication, keine Duplikation.