Windows 10 Insider Preview Build 18875 (20H1)
I episode 9 av den andre sesongen av Log Horizon, da ...
Shiroe døde og dukket opp på den uoffisielle 14. serveren til Elder Tale, testserveren, som var satt til å være på Månen i stedet for på Jorden,
... han sjekket plasseringen og dialogen var for det meste forvrengt, lagret for stedets navn Mare Tranquillitatis.
Kan den forvrengte teksten dekrypteres, eller er det bare søppel?
Ja, den forvrengte teksten er resultatet av mojibake, der originalteksten på japansk, kodet i Shift-JIS-koding, blir dekodet av Windows-1256-koding.
Hvis du noen gang åpner en japansk webside eller tekstfil kodet i Shift-JIS-koding (2-byte tegnsett) under noen vestlig koding i Windows (1-byte tegnsett), vil du se høy frekvens av ��
sammenkoblet med et annet tegn i den resulterende visningen. Siden jeg observerer at det er arabiske tegn i bildet, brukte jeg en av de eksisterende tekstfilene mine som er kodet i Shift-JIS og prøvde å åpne den med arabisk (Windows) koding i nettleseren, og jeg fant ut at arabisk (Windows) eller vestlig koding har samme kartlegging for ��
og ��
(som er en annen vanlig karakter i den sammenfiltrede teksten).
Etter å ha sammenlignet med det riktig gjengitte posisjonsstatusvinduet og noen gjetninger, klarte jeg å dekode den forvrengede teksten til riktig japansk tekst (parentesene og er lagt til for tydelighet og ikke dekodet fra forvrengt tekst):
������������������ ��������������� ��������������� ��������������� ������������ ���������������/��������������������������� ��������������� ������������������������ ������������������������ ���������������/������������ ���������������/������������
Oversettelse:
Moon Server Moon Server Isolated zone/No monster PVP allowed Special skills allowed Entry restriction/Restricted Exit restriction/Restricted
blindtarm
For å kryssjekke resultatet kan du bruke følgende stykke Python 3-kode:
garbled = '��T��[��o��[\n������T��[��o��[\n��]��[�����\n������T��[��o��[\n����������\n�����������]��[�����/������������X��^��[��o��������������\n���������������\n�����������s������������\\���������\n��@���S��������Z��g���p��������\\\n��@��i����������������/�����������\xa0�����\n��@�������o�����������/�����������\xa0�����' print(garbled.encode('Windows-1256').decode('Shift-JIS'))
Nedenfor er kun visning kilde1 av mojibake for sammenligning med bildet:
1 Teksten nedenfor inneholder U + 200E Venstre-til-høyre-merke for å forhindre at arabiske tegn gjengir høyre mot venstre og endrer formene basert på deres posisjon. Et annet problem som forhindrer rett kopiering, skyldes tilstedeværelsen av U + 00A0 No-Break Space, som konverteres til plass når den kopieres fra nettleseren.
�����T��������[��������o��������[��� ���������������T��������[��������o��������[��� �����]��������[�������������� ���������������T��������[��������o��������[��� ���������������������� ��������������������������]��������[��������������/������������������������������X��������^��������[��������o����������������������������������� ��������������������������������� ��������������������������s������������������������������\������������������������ �����@���������S��������������������Z��������g���������p��������������������\��� �����@��������i�������������������������������������/��������������������������������������������� �����@�������������������o��������������������������/���������������������������������������������
1 - "PvP tillatt": Huh. Lurer på om det ender opp med å bli viktig.