mardi 19 juillet 2011

Privacy characters


Je n’aime pas et je n’ai jamais aimé l’idée d’être indexé par mon identité sur le web (ou ailleurs) et ainsi d’être inventoriable malgré moi.  Les raisons de cette méfiance sont sans doute à chercher dans le champ psychanalytique mais qu’importe, ce sentiment d’intrusion potentielle et permanente dans ma vie privée me dérange. Certes on peut me demander  « qu’est ce que tu as à cacher après tout ?», mais est-ce parce qu’on a rien à cacher qu’on a besoin de tout montrer ? On a beau aimer communiquer et échanger sur le web on peut tout simplement ne pas aimer  l’idée d’être archivé puis retrouvé par une simple requête via un moteur de recherche.
 Je m’en suis donc longtemps tenu à 2 attitudes sur le web jusqu’à présent soit la publication sous différents pseudos, pour brouiller les pistes,  soit l’absence de publication. La première solution a rapidement tendance à conduire à une forme de schizophrénie numérique assez pénible (mais parfois nécessaire)  et la seconde solution réduit dramatiquement les possibilités d’échanges.
Si on veut vraiment intervenir anonymement  rien de mieux que le pseudo avec des infos d’identification réelles erronées mais parfois il serait bien pratique de pouvoir être identifié par un lecteur humain tout en échappant  aux algorithmes d’indexation utilisés par les moteurs de recherche.
Ma dernière idée sur le sujet consiste à utiliser une forme de cryptage non visuel par l’usage d’homoglyphes  présents dans les tables Unicode.
Exemple :
le mot Privacy est formé de lettres appartenant à la 1ère table d’Unicode (latin de base » d’Unicode e sur Google : About 6,520,000,000 results (0.30 seconds) ]
Alors que le mot rivacy  dont le  provient de la table « Latin étendu additionnel » donne sur Google : « your search - rivacy - did not match any documents. »
Tandis que le  rivacy dont le Ῥ  provient de la table  Grec étendu et donne :« About  73 results (0.11 seconds)» ces résultats n’ayant rien à voir avec les premiers.
Bref vous avez compris l’idée générale…
Et ainsi il existe des dizaines de lettres d’apparence identiques ou très semblables (homoglyphes) qui reposent sur des codes  en fait différents.
Il serait assez facile de réaliser un petit programme qui générerait une « traduction invisible » d’un texte donné avec  un choix aléatoire de de caractères choisis dans des tables d’équivalences homoglyphes … ce qui permettrait de compliquer un peu (et provisoirement parce que ce serait facilement contournable pour les moteurs mais la marginalité d’une problématique peut être une protection) le travail des algorithmes d’indexation  mais aussi de personnaliser un peu nos textes avec des équivalences homoglyphes qui n’appartiennent  qu’à nous comme avec une écriture manuscrite.
Paradoxalement ce jeu de codes (ie une combinaison personnelle des tables Unicode) en devenant une « signature glyphologique »  deviendrait elle-même un vecteur d’identification.
Je ne sais pas si des programmes de ce type existent déjà pour transcoder visuellement en Unicode si vous en connaissez je suis preneur.

Aucun commentaire:

Enregistrer un commentaire