Homoglyph Converter — Unicode opschonen
Conversie is de beste inspanning: in kaart gebrachte confusables en NFKC-vouwing zijn deterministisch, maar sommige legitieme Unicode wordt niet gemarkeerd.
Plakken of typen: de resultaten worden bijgewerkt terwijl u typt (licht gedebounced voor lange invoer).
Verdachte tekens in de oorspronkelijke weergave zijn onderstreept en voorzien van het label 'verdacht'. naast de accentkleur.
Er zijn nog geen tekens om te analyseren. Plak de tekst hierboven om een overzicht van de homogliefen en confusables te zien.
Detecteer visueel verwarrende Unicode-tekens en zet ze om naar veiliger ASCII of genormaliseerd Unicode. Gratis in de browser.
Wat deze homoglyph-converter doet
Een homoglyph-converter detecteert Unicode-tekens die op gewone Latijnse letters of cijfers kunnen lijken (confusables) en laat zien hoe ze zijn genormaliseerd of vervangen. U kunt ook Generate homoglyphs uitvoeren om deterministische parodie-achtige tekenreeksen op te bouwen uit gewone ASCII om te testen. Deze gratis confusables converter en Unicode confusable checker draait volledig in uw browser. Gebruik het als Unicode-normalisatietool, spoof-tekstopschoonprogramma of lookalike-tekenconverter voor beveiliging en moderatie.
Hoe u deze Unicode-normalisatietool gebruikt
- Plak of typ de tekst die u wilt inspecteren in het invoergebied.
- Kies Leesbare Unicode behouden, Strict ASCII Fallback of Homoglyphs genereren, afhankelijk van of u geplakte tekst opschoont of testvoorbeelden bouwt op basis van ASCII.
- Vergelijk het origineel (met highlights) en de uitvoer naast elkaar; bekijk de analysetabel voor codepunten en redenen.
- Gebruik Uitvoertekst kopiëren om het resultaat te kopiëren, of Wissen om te resetten.
Conversiemodi: leesbare Unicode versus Unicode naar ASCII versus genereren
- Behoud van leesbare Unicode past eerst de gebundelde verwarringskaart toe en vervolgens NFKC-normalisatie wanneer een teken wordt gewijzigd. De uitvoer kan nog steeds niet-ASCII-letters bevatten die niet zijn gemarkeerd.
- Strikte ASCII Fallback gebruikt dezelfde detectieregels, maar geeft de voorkeur aan ASCII-vervangingen van de kaart. Personages die niet op de kaart staan, blijven zoals ze zijn, tenzij NFKC ze wijzigt; deze modus is strenger en beter voor workflows voor het opschonen van spoofteksten.
- Homogliefen genereren laat uw invoer van links naar rechts lopen en vervangt elke ASCII-letter of -cijfer door een enkele deterministische homoglief uit dezelfde gebundelde kaart (inverse van opschonen). Tekens zonder gekozen vervanger blijven ASCII.
Wat hier als verdacht geldt
In opschoonmodi wordt een teken gemarkeerd als bekend is dat het verward kan worden met een gedefinieerde vervanging, of als NFKC-normalisatie het verandert (bijvoorbeeld cijfers over de volledige breedte). In de genereermodus markeert “verdacht” elke positie waar een ASCII-letter of -cijfer is vervangen. Dit is geen volledige Unicode-beveiligingsaudit, maar alleen deterministische regels.
Veelvoorkomende gebruiksscenario's
- Het controleren van vervalste gebruikersnamen, domeinen of homoglyph-aanvallen in geplakte tekenreeksen.
- Moderatie en vertrouwen-en-veiligheidsbeoordeling van lookalike karaktertrucs.
- Foutopsporing door ontwikkelaars van coderingsproblemen naast een homoglyph-detectorweergave.
Beperkingen en veiligheidsopmerkingen
De gebundelde kaart omvat algemene Cyrillische, Griekse en volledige lookalikes - niet elke Unicode is verwarrend. De genereermodus is alleen bedoeld voor geautoriseerde tests; gebruik het niet om mensen te misleiden of beveiligingen te omzeilen. De resultaten zijn deterministisch en niet op ML gebaseerde risicoscores. Combineer altijd met menselijke beoordeling bij beslissingen waarbij veel op het spel staat.
Privacy
Alle detectie en conversie worden lokaal in JavaScript uitgevoerd nadat de pagina is geladen. Er wordt geen tekst naar een server gestuurd voor verwerking.
Veelgestelde vragen
Wat is een homoglief?
Een homoglief is een teken dat lijkt op een ander teken uit een ander script of een andere codering, zoals een Cyrillische “а” die lijkt op de Latijnse “a”. Aanvallers gebruiken ze in vervalste domeinen, gebruikersnamen en berichten. Deze tool geeft die tekens weer met codepunten en vervangingen.
Hoe verschilt dit van Unicode-normalisatie?
Unicode-normalisatie (bijvoorbeeld NFKC) vouwt compatibiliteit en breedtevarianten op een standaardmanier. Deze tool combineert NFKC met een kleine, expliciete, verwarrende kaart, zodat je ziet waarom elk teken werd gemarkeerd - handig als je verder gaat dan een gewone Unicode-normalisatietool.
Zal de strikte ASCII-modus legitieme niet-Engelse tekst veranderen?
Strikte ASCII Fallback vervangt tekens die voorkomen in de gebundelde, verwarrende kaart of veranderen onder NFKC. Andere niet-ASCII-letters blijven ongewijzigd. Legitieme tekst kan nog steeds veranderen als deze deze toegewezen tekens bevat, dus bekijk de analyselijst.
Wordt mijn sms naar een server verzonden?
Nee. Nadat de pagina is geladen, gebruiken detectie en conversie alleen JavaScript. Deze confusables-converter uploadt uw geplakte tekst niet voor analyse.
Kan dit elke spoof detecteren?
Nee. De dekking is deterministisch en op kaarten gebaseerd, en niet op machine learning. Het helpt bij algemene, op elkaar lijkende karaktertrucs, maar is geen volledige beveiligingsaudit.
Wat doet de modus Homogliefen genereren?
Het vervangt ASCII-letters en cijfers in uw invoer door deterministische lookalikes uit dezelfde gebundelde kaart die wordt gebruikt voor het opschonen - handig voor het bouwen van testreeksen in geautoriseerde omgevingen (bijvoorbeeld moderatie QA). Het is niet bedoeld voor het nabootsen van identiteit of het omzeilen van beveiligingen.