Непонятные символы в текстовом документе

Действительно, иногда при открытии какой-нибудь интернет-странички вместо текста показываются различные «крякозабры» (как я их называю), и прочитать это нереально.

Неправильная кодировка текста

Чтобы получить исходный текст, есть несколько вариантов:

  1. Наиболее трудоемким способом является осуществление попыток открыть файл в различных кодировках. Зайдя в текстовый редактор, потребуется выбрать пункт «Открыть как» и повторять эти действия до того момента, пока вы не получите необходимый результат. Мы не советуем использовать этот способ, но он может пригодиться тем людям, которые не хотят использовать специальные программы или онлайн сервисы.
  2. Если вам часто приходится сталкиваться с иероглифами вместо текста, можете скачать специальные текстовые редакторы, поддерживающие функцию определения типа кодировки. Например, можете воспользоваться AkelPad.
  3. Последний вариант является самым простым и быстрым. Чтобы получить исходный текст из закодированного документа, вы можете использовать онлайн редакторы. На сайтах и можно абсолютно бесплатно раскодировать любой текст. Многие пользователи считают такой способ не безопасным, поэтому предпочитают использовать другие варианты. В правилах использования обоих этих сайтов написано, что раскодированная информация представляется вам приватно, и никто не сможет получить к ней доступ. Так ли это на самом деле неизвестно, но в большинстве случаев требуется, перевести не очень важные документы, поэтому мы пользуемся этими сайтами.

Чтобы с кодировкой происходило как можно меньше проблем, вы можете настроить некоторые параметры своей системы. В частности, указать во всех клиентах, браузере и прочих программах получения информации, кодировку win1251.

Вам также будет интересно: — Создание плавающего меню — Пресс-релизы как эффективная реклама — Как сделать форму обратной связи

Иероглифы вместо русских букв, вместо текста квадратики, что делать?

Иногда при открытии скачанного или скопированного с другого ПК текстового файла, он не подлежит прочтению. Все буквы заменяются на иероглифы, символы, квадратики или иные нечитаемые знаки.

Бывает, что буквы и цифры узнаваемы, но стоят на произвольных местах, что делает текст бессвязным и не читаемым. Такая проблема возникает не только в документах, но и в браузерах при открытии некоторых страниц.

Дело тут в кодировке, ее нужно либо снять, либо изменить.

Текстовые документы

Именно в документах Ворда, Блокнота и т.п. такая кодировка встречается чаще всего. Кодировка – набор знаков, благодаря которым происходит печать текста на определенном алфавите. Теоретически, любой документ сохраняется в различных шифрованиях, но пользователи почти никогда не прибегают к таким действиям.

Потому, если Вы видите вместо букв вопросительные знаки и т.п., то маловероятно, что это сделано намеренно. Скорее всего, ввиду системного сбоя у пользователя, создавшего документ, он сохранился не в той кодировки. Кроме того, дело может быть и в сбои на Вашем ПК, в результате чего файл не открывается правильно.

Наиболее часто проблема возникает при использовании Блокнота. Также встречается в файлах php, css, info и подобных текстовых. Гораздо реже в Ворде. Кроме того, путаница с шифрованием встречается в браузере, там Вы также можете увидеть кракозябры вместо русских букв. В последнем случае избавиться от нее особенно трудно.

Notepad +++

Самый простой способ открыть документ Блокнот, где вместо букв квадратики – применить сторонний софт. Популярен Notepad+++. Это тот же Блокнот, но обладающий дополнительными функциями. Имеет следующие преимущества:

  1. Распространяется бесплатно;
  2. Как и Ворд, имеет кнопку отмены последнего действия;
  3. Поддерживает одновременную работу с несколькими файлами;
  4. Позволяет изменить или выбрать шифрование.
  5. Автоматически дописывает тексты;

Чтобы иероглифы вместо русских букв преобразовались, откройте документ Блокнота в данной программе. В ленте меню сверху найдите вкладку Кодировки. Нажмите на нее. Откроется меню с перечислением всех их типов. Не всегда очевидно, какой именно тип шифрования применялся, потому, чтобы выбрать правильный для перекодировки, нужно попробовать несколько. Текст пред этим выделите.

По мере применения кодировок, символы в документе могут меняться (по одному нажатию в меню) или оставаться неизменными. В результате, после применения определенной, текст станет читаемым.

Bred 3

Программа аналогична предыдущей. Представляет собой Блокнот с расширенными возможностями. Успешно применяется вместо стандартного Блокнота Виндовс. Кодировки представлены в отдельной вкладке в верхнем меню. Откройте документ, в котором видны лишь текстовые значки или иероглифы, выделите текст, и пробуйте менять шифрования по очереди. В результате текст станет читаемым.

Поддерживает множество, даже редких, форматов. Работает со старой DOS- кодировкой, которую не открывают современные программы. Работает на Windows 8, 8.1, 10.

Иногда кодировка появляется и в документах Ворд. Иногда причиной того, что в ворде появились непонятные символы, является то, что у Вас на ПК установлен старый Ворд (до 2007 года), а документ создан в более поздних версиях софта.

Чаще всего, такие «новые» файлы просто не открываются в старой версии, но иногда открываются в странной кодировке. Чтобы понять, так ли это, посмотрите в Свойствах файла, какой он имеет формат. «Новые» документы имеют формат docx. Преобразование файла в word до старого формата невозможно.

Лучше установить обновление на MS Word. Изменить формат текстового документа на читаемый не сложно.

  • Еще до открытия файла, софт «понимает», что в нем проблема. При двойном клике на него Ворд откроет окно, где спросит – в какой кодировке открыть файл. Чтобы изменить кодировку текста в word, выполните алгоритм;
  • Попробуйте кодировку, предложенную программой;
  • Если не сработало, кликайте по очереди на предлагаемые типы;
  • Пробуйте менять типы кодировки и алфавит, типы кириллицы;
  • Как только текст станет читаемым нажмите ОК.

Иногда возникает проблема другого характера. Вы набираете текст в Ворде или Блокноте и замечаете, что на клавиатуре вместо букв печатаются цифры. Проблема связана с режимом Num Look и возникает на некоторых ноутбуках. Посмотрите на клавиатуру.

Если на кнопках в правой части, кроме букв написаны и цифры, а вверху присутствует кнопка num lk, значит ноутбук оснащен данным режимом и Вы случайно включили. Для отключения нажмите кнопку Num Look или Fn+F11.

Набор цифр прекратится, появятся буквы в привычном виде.

Иероглифы в браузере

Иногда при открытии страницы в браузере Вы видите текст в кодировке. Это квадратики вместо букв в Опере, непонятные символы в Хроме и т.п. Причина — нарушение кодировки в браузере. Сбои происходят редко и виноваты в них разработчики. Но устранить сбой можно самостоятельно.

Если у Вас Хром, то пройдите по пути Настройки — Инструменты — Кодировки. Наведите на него указатель, откроется меню с кодировками. Если установлен параметр «Автоматически», измените на «Windows 1251». Если установлен другой параметр, замените на Windows 1251. Если он не помог открыть, установите «Автоматически» или перепробуйте кодировки по очереди.

В Опере нужно пройдите в главное меню в верху окна и оттуда – в Настройки. Нажмите на Веб – сайты и найдите раздел Отображение. Кликайте по Настройке шрифтов и внизу открывшегося окна находите чек – бокс. В нем выбирайте Windows 1251. Это универсальный параметр отображении русских шрифтов, какой бы браузер не использовался.

В Firefox пройдите по пути Главное меню браузера — Настройки — Содержимое — Дополнительно. Как и для Оперы, в чек — боксе внизу открывшегося окна, выбирайте нужную кодировку.

Теперь вы знаете, что делать, если вместо текста иероглифы.

Исправляем иероглифы на текст

Браузер

Вообще, раньше Internet Explorer часто выдавал подобные крякозабры, современные же браузеры (Chrome, Яндекс-браузер, Opera, Firefox) — довольно неплохо определяет кодировку, и ошибаются очень редко. Скажу даже больше, в некоторых версиях браузера уже убрали выбор кодировки, и для «ручной» настройки этого параметра нужно скачивать дополнения, или лезть в дебри настроек за 10-ток галочек…

И так, предположим браузер неправильно определили кодировку и вы увидели следующее (как на скрине ниже)…

Неправильно выбранная кодировка

Чаще всего путаница бывает между кодировками UTF (Юникод) и Windows-1251 (большинство русскоязычных сайтов выполнены в этих кодировках).

Поэтому, я рекомендую в ручном режиме попробовать их обе. Например, чтобы это сделать в браузере Firefox, нужно:

  1. нажать левый ALT — чтобы сверху показалось меню. Нажать меню «Вид»;
  2. выбрать пункт «Кодировка текста», далее выбрать Юникод. Вуаля — иероглифы на странички сразу же стали обычным текстом (скрин ниже)!

Смена кодировки в Firefox

Еще один совет: если в браузере не можете найти, как сменить кодировку (а дать инструкцию для каждого браузера — вообще нереально!), я рекомендую попробовать открыть страничку в другом браузере. Очень часто другая программа открывает страницу так, как нужно.

Текстовые документы

Очень много вопросов по крякозабрам задаются при открытии каких-нибудь текстовых документов. Особенно старых, например при чтении Readme в какой-нибудь программе прошлого века (например, к играм).

Разумеется, что многие современные блокноты просто не могут прочитать DOS’овскую кодировку, которая использовалась ранее. Чтобы решить сию проблему, рекомендую использовать редактор Bread 3.

Попробуйте открыть в Bred 3 свой текстовый документ (с которым наблюдаются проблемы). Пример показан у меня на скрине ниже.

Иероглифы при открытии текстового документа

Далее в Bred 3 есть кнопка для смены кодировки: просто попробуйте поменять ANSI на OEM — и старый текстовый файл станет читаемым за 1 сек.!

Исправление иероглифов на текст

Для работы с текстовыми файлами различных кодировок так же подойдет еще один блокнот — Notepad++. Вообще, конечно, он больше подходит для программирования, т.к. поддерживает различные подсветки, для более удобного чтения кода.

Пример смены кодировки показан ниже: чтобы прочитать текст, достаточно в примере ниже, достаточно было сменить кодировку ANSI на UTF-8.

Смена кодировки в блокноте Notepad++

WORD’овские документы

Очень часто проблема с крякозабрами в Word связана с тем, что путают два формата Doc и Docx. Дело в том, что с 2007 Word (если не ошибаюсь) появился формат Docx (позволяет более сильнее сжимать документ, чем Doc, да и надежнее защищает его).

Так вот, если у вас старый Word, который не поддерживает этот формат — то вы, при открытии документа в Docx, увидите иероглифы и ничего более.

Решения есть 2:

  1. скачать на сайте Microsoft спец. дополнение, которое позволяет открывать в старом Word новые документы. Только из личного опыта могу сказать, что открываются далеко не все документы, к тому же сильно страдает разметка документа (что в некоторых случаях очень критично);
  2. использовать аналоги Word (правда, тоже разметка в документе будет страдать);
  3. обновить Word до современной версии.

Так же при открытии любого документа в Word (в кодировке которого он «сомневается»), он на выбор предлагает вам самостоятельно указать оную. Пример показан на рисунке ниже, попробуйте выбрать:

  1. Widows (по умолчанию);
  2. MS DOS;
  3. Другая…

Переключение кодировки в Word при открытии документа

Окна в различных приложениях Windows

Бывает такое, что какое-нибудь окно или меню в программе показывается с иероглифами (разумеется, прочитать что-то или разобрать — нереально).

Могу дать несколько рекомендаций:

  1. Руссификатор. Довольно часто официальной поддержки русского языка в программе нет, но многие умельца делают руссификаторы. Скорее всего, на вашей системе — данный руссификатор работать отказался. Поэтому, совет простой: попробовать поставить другой;
  2. Переключение языка. Многие программы можно использовать и без русского, переключив в настройках язык на английский. Ну в самом деле: зачем вам в какой-то утилите, вместо кнопки «Start» перевод «начать»?
  3. Если у вас раньше текст отображался нормально, а щас нет — попробуйте восстановить Windows, если, конечно, у вас есть точки восстановления (подробно об этом здесь — );
  4. Проверить настройки языков и региональных стандартов в Windows, часто причина кроется именно в них.

Языки и региональные стандарты в Windows

Чтобы открыть меню настроек:

  • нажмите Win+R;
  • введите , нажмите Enter.

— язык и регион. стандарты

Проверьте чтобы во вкладке «Форматы» стояло «Русский (Россия) // Использовать язык интерфейса Windows (рекомендуется)» (пример на скрине ниже).

Формат — русский // Россия

Во вкладке местоположение поставьте расположение Россия.

Местоположение — Россия

И во вкладке дополнительно установите язык системы на «Русский (Россия)». После этого сохраните настройки и перезагрузите ПК. Затем вновь проверьте, нормально ли отображается интерфейс нужной программы.

Текущий язык программ

И напоследок, наверное, для многих это очевидно, и все же некоторые открывают определенные файлы в программах, которые не предназначены для этого: к примеру в обычном блокноте пытаются прочитать файл DOCX или PDF. Естественно, в этом случае вы вместо текста будут наблюдать за крякозабрами, используйте те программы, которые предназначены для данного типа файла (WORD 2007+ и Adobe Reader для примера выше).

Виды кодировок текста

А их, в общем-то, хватает.

  • ASCII

Одной из самых “древних” считается американская кодировочная таблица (ASCII, читается как “аски”), принятая национальным институтом стандартов. Для кодировки она использовала 7 битов, в первых 128 значениях размещался английский алфавит (в нижнем и верхнем регистрах), а также знаки, цифры и символы. Она больше подходила для англоязычных пользователей и не была универсальной.

  • Кириллица

Отечественный вариант кодировки, для которого стали использовать вторую часть кодовой таблицы – символы с 129 по 256. Заточена под русскоязычную аудиторию.

  •  Кодировки семейства MS Windows: Windows 1250—1258.

8-битные кодировки, появились как следствие разработки самой популярной операционной системы, Windows. Номера с 1250 по 1258 указывают на язык, под который они заточены, например, 1250 – для языков центральной Европы; 1251 – кириллический алфавит.

  • Код обмена информацией 8 бит – КОИ8

KOI8-R, KOI8-U, KOI-7 – стандарт для русской кириллицы в юникс-подобных операционных системах.

  • Юникод (Unicode)

Универсальный стандарт кодирования символов, позволяющий описать знаки практически всех письменных языков. Обозначение “U+xxxx” (хххх – 16-ричные цифры). Самые распространенные семейства кодировок UTF (Unicode Transformation Format): UTF-8, 16, 32.

Виды кодировок текста

В настоящее время, как говорится, “рулит” UTF-8 – именно она обеспечивают наилучшую совместимость со старыми ОС, которые использовали 8-битные символы. В UTF-8 кодировке находятся большинство сайтов в сети Интернет и именно этот стандарт является универсальным (поддержка кириллицы и латиницы).

Разумеется, я привел не все виды кодировок, а только наиболее ходовые. Если же Вы хотите для общего развития знать их все, то полный список можно отыскать в самом браузере. Для этого достаточно пройти в нем на вкладку “Вид-Кодировка-Выбрать список” и ознакомиться со всевозможными их вариантами (см. изображение).

Думаю возник резонный вопрос: “Какого лешего столько кодировок?”. Их изобилие и причины возникновения можно сравнить с таким явлением, как кроссбраузерность/кроссплатформенность. Это когда один и тот же сайт сайт отображается по-разному в различных интернет-обозревателях и на различных гаджет-устройствах. Кстати у сайта "Заметки " с этим, как Вы заметили всё в порядке :).

Виды кодировок текста

Все эти кодировки – рабочие варианты, созданные разработчиками “под себя” и решение своих задач. Когда же их количество перевалило за все разумные пределы, а в поисковиках стали плодиться запросы типа: “Как убрать кракозябры в браузере?” — разработчики стали ломать голову над приведением всей этой каши к единому стандарту, чтобы, так сказать, всем было хорошо. И кодировка Unicode, в общем-то, это “хорошо” и сделала. Теперь если такие проблемы и возникают, то они носят локальный характер, и не знают как их исправить только совсем непросвещенные пользователи (впрочем, часто беда с кодировкой и отображением сайтов появляется из-за того, что веб-мастер указал на стороне сервера некорректный формат, и приходится переключать кодировку в браузере).

Ну вот, собственно, пока вся «базово необходимая» теория, которая позволит Вам “не плавать” в кодировочных вопросах, теперь переходим к практической части статьи.

Виды кодировок текста
1 Звезда2 Звезды3 Звезды4 Звезды5 Звезд (Пока оценок нет)
Загрузка...
Понравилась статья? Поделиться с друзьями:
Adblock
detector