The string seems to be double-encoded: first the original Windows-1251 has been mis-interpreted as ISO-8859-1, then those mis-interpreted characters are themselves turned into their UTF-8 equivalents.
The fact that you can have the «wrong» text as visible characters along with the «correct» text indicates your system works in UTF-8 or some other Unicode character set, and that the string has been converted to Unicode in its mis-interpreted form.
Try decoding it this way:
echo 'Ïåðåïðîøèòü Ñûðîåæêèíà' | iconv -f utf-8 -t iso-8859-1 | iconv -f windows-1251 -t utf-8
Перепрошить Сыроежкина
If those characters were actually in their native 8-bit encoding, the string would be displayed something like this on an UTF-8 system: «����������� ����������». Any ISO-8859-1 (or any 8-bit character set) characters with the high bit set are likely to produce an «invalid encoding» result when interpreted as UTF-8. Unicode has a special display symbol, «�», for «this character has been encoded in a broken way».
If your system was actually using ISO-8859-1, you would see the string as ‘Ïåðåïðîøèòü Ñûðîåæêèíà’ — but then it would be impossible to display «Перепрошить Сыроежкина» in the same terminal window, because ISO-8859-1 does not include Cyrillics at all.
The website you linked probably sees the incoming string as UTF-8, and assumes that this conversion was just a part of the communication between the browser and the web server, and just identifies the other misinterpretation.
Здравствуйте, спарсиг инфу с сайта в кодировке iso-8859-1.
Так по крайней мере определил онлайн-кодировщик.
Пытался перекодировать разными способами
Python | ||
|
Вывод: Ðóäíèê
Оригинальное слово — Рудник
Пробовал decode, encode в разные кодировки, пробовал в байты переводить и кодировать, все равно всякие иероглифа, подскажите как быть
Использую Python 3.4
Version: 20230216
By the same author: Virtour.fr — visites virtuelles
Универсальный декодер — конвертер кириллицы
Результат
[Результат перекодировки появится здесь…]
Гостевая книга
Поставьте ссылку на наш сайт! <a href=»https://2cyr.com/decode/»>Универсальный декодер кириллицы</a> |
Custom Work For a small fee I can help you quickly recode/recover large pieces of data — texts, databases, websites… or write custom functions you can use (invoice available). FAQ and contact information. |
О программе
Здравствуйте! Эта страница может пригодиться, если вам прислали текст (предположительно на кириллице), который отображается в виде странной комбинации загадочных символов. Программа попытается угадать кодировку, а если не получится, покажет примеры всех комбинаций кодировок, чтобы вы могли выбрать подходящую.
Использование
- Скопируйте текст в большое текстовое поле дешифратора. Несколько первых слов будут проанализированы, поэтому желательно, чтобы в них содержалась (закодированная) кириллица.
- Программа попытается декодировать текст и выведет результат в нижнее поле.
- В случае удачной перекодировки вы увидите текст в кириллице, который можно при необходимости скопировать и сохранить.
- В случае неудачной перекодировки (текст не в кириллице, состоящий из тех же или других нечитаемых символов) можно выбрать из нового выпадающего списка вариант в кириллице (если их несколько, выбирайте самый длинный). Нажав OK вы получите корректный перекодированный текст.
- Если текст перекодирован лишь частично, попробуйте выбрать другие варианты кириллицы из выпадающего списка.
Ограничения
- Если текст состоит из вопросительных знаков («???? ?? ??????»), то проблема скорее всего на стороне отправителя и восстановить текст не получится. Попросите отправителя послать текст заново, желательно в формате простого текстового файла или в документе LibreOffice/OpenOffice/MSOffice.
- Не любой текст может быть гарантированно декодирован, даже если есть вы уверены на 100%, что он написан в кириллице.
- Анализируемый и декодированный тексты ограничены размером в 100 Кб.
- Программа не всегда дает стопроцентную точность: при перекодировке из одной кодовой страницы в другую могут пропасть некоторые символы, такие как болгарские кавычки, реже отдельные буквы и т.п.
- Программа проверяет максимум 8280 вариантов из двух и трех перекодировок: если имело место многократное перекодирование вроде koi8(utf(cp1251(utf))), оно не будет распознано или проверено. Обычно возможные и отображаемые верные варианты находятся между 32 и 255.
- Если части текста закодированы в разных кодировках, программа сможет распознать только одну часть за раз.
Условия использования
Пожалуйста, обратите внимание на то, что данная бесплатная программа создана с надеждой, что она будет полезна, но без каких-либо явных или косвенных гарантий пригодности для любого практического использования. Вы можете пользоваться ей на свой страх и риск.
Если вы используете для перекодировки очень длинный текст, убедитесь, что имеется его резервная копия.
Переводчики
Русский (Russian) : chAlx ; Пётр Васильев (http://yonyonson.livejournal.com/)
Страница подготовки переводов на другие языки находится тут.
Что нового
October 2013 : I am trying different optimizations for the system which should make the decoder run faster and handle more text. If you notice any problem, please notify me ASAP.
На английской версии страницы доступен changelog программы.
Вернуться к кириллической виртуальной клавиатуре.
Skip to content
Время от времени приходится сталкиваться с текстом в непонятной кодировке, типа такого:
Ëþäè â Ãðîóâëåíäå, ìàëåíüêîì (ïî ìåðêàì Êàëèôîðíèè) ãîðîäêå â øåñòüñîò æèòåëåé, âûõîäèëè íà óëèöû, ñòîÿëè ïåðåä ñâîèìè äîìàìè ñ öâåòàìè íà ïîäîêîííèêàõ è ñìîòðåëè, êàê ýòîò ïèðîêóìóëþñ âûðàñòàåò âûøå Ñüåððû-Íåâàäû. ß è ñàìà ñòîÿëà òàì â áëàãîãîâåíèè è óæàñå è ïîíèìàëà áåç âñÿêèõ ñëîâ, ÷òî åñëè íå ïîéäåò äîæäü, òî ñëåäóþùèå ïîæàðû áóäóò åù¸ óæàñíåå, à åñëè äîæäè âñ¸ æå ïîéäóò è îêàæóòñÿ ñëèøêîì îáèëüíûìè, òî ýòî ñîææ¸ííûå ãîðíûå ñêëîíû ñìîåò íàâîäíåíèÿìè. Âñ¸ áûëî áóêâàëüíî íà ãðàíè êàòàñòðîôû. Íî ðÿäîì áûëè öâåòû â ãîðøêàõ, è íåîáîææ¸ííûå ñîñíû, è òðóùèåñÿ î íîãè ñîáàêè, è ðåñòîðàí, îòêðûòûé äëÿ óæèíà; è ÷óâñòâîâàëîñü, ÷òî âñå íà óëèöå âçäûõàþò ñ áëàãîäàðíîñòüþ çà òî, ÷òî âñ¸ ýòî ó íèõ åù¸ åñòü. Õîòÿ áû íåíàäîëãî (Äèàíà Ìàðêóì, Äåñÿòûé îñòðîâ).
Если текст маленький, то поможет онлайн-декодер, а если текст большой — поможет текстовый редактор. Я использую Sublime Text, подозреваю что этот трюк возможен и в других текстовых редакторах, которые умеют работать с разными кодировками.
В любом случае, начните с онлайн-декодера, чтобы понять с какими кодировками нужно работать. Раскодируйте фрагмент текста и запомните направление декодирования (в нашем случае: ISO-8859-1 → Windows-1251):
Вся дальнейшая работа будет проходить в текстовом редакторе.
Шаг 1. Создайте обычный пустой текстовый файл, сохраните его с кодировкой Western (ISO 8859-1):
Шаг 2. Скопируйте текст с кракозябрами и вставьте его в созданный файл:
Шаг 3. Сохраните файл (Ctrl + S).
Шаг 4. Откройте файл с кодировкой Cyrillic (Windows 1251):
Шаг 5. Наслаждайтесь результатом:
Тот же текст в читаемом виде.
За последние 24 часа нас посетили 18708 программистов и 1277 роботов. Сейчас ищут 546 программистов …
-
Grechka
Активный пользователь- С нами с:
- 7 июл 2008
- Сообщения:
- 11
- Симпатии:
- 0
- Адрес:
- Москва
Здравствуйте всем, кажите пожалуйста, перекодировал с iso-8859-1 на Win-1251
но все такие показывает русский букв квадратики.
Вот сам код который написан на шаблоне.<?xml version=»1.0″ encoding=»iso-8859-1″ ?>
Как правильно писать чтобы русские буквы отображались?
-
- С нами с:
- 8 апр 2007
- Сообщения:
- 5.433
- Симпатии:
- 0
А как конвертировали? Может проблема в базе, может в движке, а может и на выводе.
-
Grechka
Активный пользователь- С нами с:
- 7 июл 2008
- Сообщения:
- 11
- Симпатии:
- 0
- Адрес:
- Москва
скорее всего в движке, потому, что поменял кодировку все равно квадратики показываеть.
-
Команда форума
Модератор- С нами с:
- 27 сен 2007
- Сообщения:
- 10.547
- Симпатии:
- 625
-
Grechka
Активный пользователь- С нами с:
- 7 июл 2008
- Сообщения:
- 11
- Симпатии:
- 0
- Адрес:
- Москва
был такой кодировка<?xml version=»1.0″ encoding=»iso-8859-1″?>
сделал так
<?xml version=»1.0″ encoding=»Windows-1251″?>
где моя ошибка скажите ребят! -
- С нами с:
- 8 апр 2007
- Сообщения:
- 5.433
- Симпатии:
- 0
Это называется не перекодировал, а объявил браузеру о другой кодировке.
Ошибка в движке, либо базе. В админке движка скорее всего можно выставить другую кодировку, но в базе придется вручную (и конвертировать через iconv or convert_cyr_string все данные). -
Grechka
Активный пользователь- С нами с:
- 7 июл 2008
- Сообщения:
- 11
- Симпатии:
- 0
- Адрес:
- Москва
Kreker
Спасибо ща попробую сделать, не закройте тему елси, что отпишу! -
niteus
Активный пользователь- С нами с:
- 25 окт 2008
- Сообщения:
- 4
- Симпатии:
- 0
проблема с кодировкой XML
Ребята пожалуйста помогите. Есть шаблон сайта под XML Как там поменять кодировку???? Когда пишешь русскими буквами появляютя ироглифы. в исходнике поменял <?xml version=»1.0″ encoding=»UTF-8″ ?> на <?xml version=»1.0″ encoding=»windows-1251″ ?> и ничего. То что написано выше я так и не понял. Спасайте Plizzzz
-
- С нами с:
- 8 апр 2007
- Сообщения:
- 5.433
- Симпатии:
- 0
niteus
А база точно не в UTF? -
niteus
Активный пользователь- С нами с:
- 25 окт 2008
- Сообщения:
- 4
- Симпатии:
- 0
Не знаю. А как проверить? и что вообще делать. Вроде как XML. Помогите плиззз. За ранее спасибо
-
Salvador095
Активный пользователь- С нами с:
- 8 ноя 2008
- Сообщения:
- 5
- Симпатии:
- 0