Iso 8859 1 windows 1251

The string seems to be double-encoded: first the original Windows-1251 has been mis-interpreted as ISO-8859-1, then those mis-interpreted characters are themselves turned into their UTF-8 equivalents.

The fact that you can have the «wrong» text as visible characters along with the «correct» text indicates your system works in UTF-8 or some other Unicode character set, and that the string has been converted to Unicode in its mis-interpreted form.

Try decoding it this way:

echo 'Ïåðåïðîøèòü Ñûðîåæêèíà' | iconv -f utf-8 -t iso-8859-1 | iconv -f windows-1251 -t utf-8
Перепрошить Сыроежкина

If those characters were actually in their native 8-bit encoding, the string would be displayed something like this on an UTF-8 system: «����������� ����������». Any ISO-8859-1 (or any 8-bit character set) characters with the high bit set are likely to produce an «invalid encoding» result when interpreted as UTF-8. Unicode has a special display symbol, «�», for «this character has been encoded in a broken way».

If your system was actually using ISO-8859-1, you would see the string as ‘Ïåðåïðîøèòü Ñûðîåæêèíà’ — but then it would be impossible to display «Перепрошить Сыроежкина» in the same terminal window, because ISO-8859-1 does not include Cyrillics at all.

The website you linked probably sees the incoming string as UTF-8, and assumes that this conversion was just a part of the communication between the browser and the web server, and just identifies the other misinterpretation.

Студворк — интернет-сервис помощи студентам

Здравствуйте, спарсиг инфу с сайта в кодировке iso-8859-1.

Так по крайней мере определил онлайн-кодировщик.

Пытался перекодировать разными способами

Python
1
2
3
4
5
6
url=self.session.get("http://www.heroeswm.ru/map.php")
html=url.text
soup = BeautifulSoup(html, 'html.parser')
table=soup.find('table', class_='wb')
a=table.find('a').text
print(a)

Вывод: Ðóäíèê
Оригинальное слово — Рудник

Пробовал decode, encode в разные кодировки, пробовал в байты переводить и кодировать, все равно всякие иероглифа, подскажите как быть

Использую Python 3.4

Version: 20230216
By the same author: Virtour.fr — visites virtuelles

Универсальный декодер — конвертер кириллицы

Результат

[Результат перекодировки появится здесь…]

Гостевая книга

Поставьте ссылку на наш сайт!

<a href=»https://2cyr.com/decode/»>Универсальный декодер кириллицы</a>

Custom Work
For a small fee I can help you quickly recode/recover large pieces of data — texts, databases, websites… or write custom functions you can use (invoice available).
FAQ and contact information.

О программе

Здравствуйте! Эта страница может пригодиться, если вам прислали текст (предположительно на кириллице), который отображается в виде странной комбинации загадочных символов. Программа попытается угадать кодировку, а если не получится, покажет примеры всех комбинаций кодировок, чтобы вы могли выбрать подходящую.

Использование

  • Скопируйте текст в большое текстовое поле дешифратора. Несколько первых слов будут проанализированы, поэтому желательно, чтобы в них содержалась (закодированная) кириллица.
  • Программа попытается декодировать текст и выведет результат в нижнее поле.
  • В случае удачной перекодировки вы увидите текст в кириллице, который можно при необходимости скопировать и сохранить.
  • В случае неудачной перекодировки (текст не в кириллице, состоящий из тех же или других нечитаемых символов) можно выбрать из нового выпадающего списка вариант в кириллице (если их несколько, выбирайте самый длинный). Нажав OK вы получите корректный перекодированный текст.
  • Если текст перекодирован лишь частично, попробуйте выбрать другие варианты кириллицы из выпадающего списка.

Ограничения

  • Если текст состоит из вопросительных знаков («???? ?? ??????»), то проблема скорее всего на стороне отправителя и восстановить текст не получится. Попросите отправителя послать текст заново, желательно в формате простого текстового файла или в документе LibreOffice/OpenOffice/MSOffice.
  • Не любой текст может быть гарантированно декодирован, даже если есть вы уверены на 100%, что он написан в кириллице.
  • Анализируемый и декодированный тексты ограничены размером в 100 Кб.
  • Программа не всегда дает стопроцентную точность: при перекодировке из одной кодовой страницы в другую могут пропасть некоторые символы, такие как болгарские кавычки, реже отдельные буквы и т.п.
  • Программа проверяет максимум 8280 вариантов из двух и трех перекодировок: если имело место многократное перекодирование вроде koi8(utf(cp1251(utf))), оно не будет распознано или проверено. Обычно возможные и отображаемые верные варианты находятся между 32 и 255.
  • Если части текста закодированы в разных кодировках, программа сможет распознать только одну часть за раз.

Условия использования

Пожалуйста, обратите внимание на то, что данная бесплатная программа создана с надеждой, что она будет полезна, но без каких-либо явных или косвенных гарантий пригодности для любого практического использования. Вы можете пользоваться ей на свой страх и риск.

Если вы используете для перекодировки очень длинный текст, убедитесь, что имеется его резервная копия.

Переводчики

Русский (Russian) : chAlx ; Пётр Васильев (http://yonyonson.livejournal.com/)

Страница подготовки переводов на другие языки находится тут.

Что нового

October 2013 : I am trying different optimizations for the system which should make the decoder run faster and handle more text. If you notice any problem, please notify me ASAP.

На английской версии страницы доступен changelog программы.

Вернуться к кириллической виртуальной клавиатуре.

Skip to content

Время от времени приходится сталкиваться с текстом в непонятной кодировке, типа такого:

Ëþäè â Ãðîóâëåíäå, ìàëåíüêîì (ïî ìåðêàì Êàëèôîðíèè) ãîðîäêå â øåñòüñîò æèòåëåé, âûõîäèëè íà óëèöû, ñòîÿëè ïåðåä ñâîèìè äîìàìè ñ öâåòàìè íà ïîäîêîííèêàõ è ñìîòðåëè, êàê ýòîò ïèðîêóìóëþñ âûðàñòàåò âûøå Ñüåððû-Íåâàäû. ß è ñàìà ñòîÿëà òàì â áëàãîãîâåíèè è óæàñå è ïîíèìàëà áåç âñÿêèõ ñëîâ, ÷òî åñëè íå ïîéäåò äîæäü, òî ñëåäóþùèå ïîæàðû áóäóò åù¸ óæàñíåå, à åñëè äîæäè âñ¸ æå ïîéäóò è îêàæóòñÿ ñëèøêîì îáèëüíûìè, òî ýòî ñîææ¸ííûå ãîðíûå ñêëîíû ñìîåò íàâîäíåíèÿìè. Âñ¸ áûëî áóêâàëüíî íà ãðàíè êàòàñòðîôû. Íî ðÿäîì áûëè öâåòû â ãîðøêàõ, è íåîáîææ¸ííûå ñîñíû, è òðóùèåñÿ î íîãè ñîáàêè, è ðåñòîðàí, îòêðûòûé äëÿ óæèíà; è ÷óâñòâîâàëîñü, ÷òî âñå íà óëèöå âçäûõàþò ñ áëàãîäàðíîñòüþ çà òî, ÷òî âñ¸ ýòî ó íèõ åù¸ åñòü. Õîòÿ áû íåíàäîëãî (Äèàíà Ìàðêóì, Äåñÿòûé îñòðîâ).

Если текст маленький, то поможет онлайн-декодер, а если текст большой — поможет текстовый редактор. Я использую Sublime Text, подозреваю что этот трюк возможен и в других текстовых редакторах, которые умеют работать с разными кодировками.

В любом случае, начните с онлайн-декодера, чтобы понять с какими кодировками нужно работать. Раскодируйте фрагмент текста и запомните направление декодирования (в нашем случае: ISO-8859-1 → Windows-1251):

Исправление кодировки (шаг 0)

Вся дальнейшая работа будет проходить в текстовом редакторе.

Шаг 1. Создайте обычный пустой текстовый файл, сохраните его с кодировкой Western (ISO 8859-1):

Исправление кодировки (шаг 1)

Шаг 2. Скопируйте текст с кракозябрами и вставьте его в созданный файл:

Исправление кодировки (шаг 2)

Шаг 3. Сохраните файл (Ctrl + S).

Шаг 4. Откройте файл с кодировкой Cyrillic (Windows 1251):

Исправление кодировки (шаг 4)

Шаг 5. Наслаждайтесь результатом:

Исправление кодировки (шаг 5)

Тот же текст в читаемом виде.

За последние 24 часа нас посетили 18708 программистов и 1277 роботов. Сейчас ищут 546 программистов …


  1. Grechka

    Grechka
    Активный пользователь

    С нами с:
    7 июл 2008
    Сообщения:
    11
    Симпатии:
    0
    Адрес:
    Москва

    Здравствуйте всем, кажите пожалуйста, перекодировал с iso-8859-1 на Win-1251
    но все такие показывает русский букв квадратики.
    Вот сам код который написан на шаблоне.

    <?xml version=»1.0″ encoding=»iso-8859-1″ ?>

    Как правильно писать чтобы русские буквы отображались?


  2. Kreker

    С нами с:
    8 апр 2007
    Сообщения:
    5.433
    Симпатии:
    0

    А как конвертировали? Может проблема в базе, может в движке, а может и на выводе.


  3. Grechka

    Grechka
    Активный пользователь

    С нами с:
    7 июл 2008
    Сообщения:
    11
    Симпатии:
    0
    Адрес:
    Москва

    скорее всего в движке, потому, что поменял кодировку все равно квадратики показываеть.


  4. [vs]

    Команда форума
    Модератор

    С нами с:
    27 сен 2007
    Сообщения:
    10.547
    Симпатии:
    625


  5. Grechka

    Grechka
    Активный пользователь

    С нами с:
    7 июл 2008
    Сообщения:
    11
    Симпатии:
    0
    Адрес:
    Москва

    был такой кодировка<?xml version=»1.0″ encoding=»iso-8859-1″?>
    сделал так
    <?xml version=»1.0″ encoding=»Windows-1251″?>
    где моя ошибка скажите ребят!


  6. Kreker

    С нами с:
    8 апр 2007
    Сообщения:
    5.433
    Симпатии:
    0

    Это называется не перекодировал, а объявил браузеру о другой кодировке.
    Ошибка в движке, либо базе. В админке движка скорее всего можно выставить другую кодировку, но в базе придется вручную (и конвертировать через iconv or convert_cyr_string все данные).


  7. Grechka

    Grechka
    Активный пользователь

    С нами с:
    7 июл 2008
    Сообщения:
    11
    Симпатии:
    0
    Адрес:
    Москва

    Kreker
    Спасибо ща попробую сделать, не закройте тему елси, что отпишу!


  8. niteus

    niteus
    Активный пользователь

    С нами с:
    25 окт 2008
    Сообщения:
    4
    Симпатии:
    0

    проблема с кодировкой XML

    Ребята пожалуйста помогите. Есть шаблон сайта под XML Как там поменять кодировку???? Когда пишешь русскими буквами появляютя ироглифы. в исходнике поменял <?xml version=»1.0″ encoding=»UTF-8″ ?> на <?xml version=»1.0″ encoding=»windows-1251″ ?> и ничего. То что написано выше я так и не понял. Спасайте Plizzzz


  9. Kreker

    С нами с:
    8 апр 2007
    Сообщения:
    5.433
    Симпатии:
    0

    niteus
    А база точно не в UTF?


  10. niteus

    niteus
    Активный пользователь

    С нами с:
    25 окт 2008
    Сообщения:
    4
    Симпатии:
    0

    Не знаю. А как проверить? и что вообще делать. Вроде как XML. Помогите плиззз. За ранее спасибо


  11. Salvador095

    Salvador095
    Активный пользователь

    С нами с:
    8 ноя 2008
    Сообщения:
    5
    Симпатии:
    0

  • Is pnkbstra explicitly allowed c windows system32 pnkbstra exe no
  • Is not a supported wheel on this platform windows
  • Ipv4 подключение без доступа к сети windows 10
  • Irbis tw80 прошивка windows 10 скачать
  • Irql not less or equal 0x0000000a windows 10