То, что отображается в виде текста на экране, фактически сохраняется в текстовом файле в виде числовых значений. Компьютер преобразует числовые значения в видимые символы. Для этого используется стандарт кодирования.
Кодировка — это схема нумерации, согласно которой каждому текстовому символу в наборе соответствует определенное числовое значение. Кодировка может содержать буквы, цифры и другие символы. В различных языках часто используются разные наборы символов, поэтому многие из существующих кодировок предназначены для отображения наборов символов соответствующих языков.
‘
Различные кодировки для разных алфавитов
Сведения о кодировке, сохраняемые с текстовым файлом, используются компьютером для вывода текста на экран. Например, в кодировке «Кириллица (Windows)» знаку «Й» соответствует числовое значение 201. Когда вы открываете файл, содержащий этот знак, на компьютере, на котором используется кодировка «Кириллица (Windows)», компьютер считывает число 201 и выводит на экран знак «Й».
Однако если тот же файл открыть на компьютере, на котором по умолчанию используется другая кодировка, на экран будет выведен знак, соответствующий числу 201 в этой кодировке. Например, если на компьютере используется кодировка «Западноевропейская (Windows)», знак «Й» из исходного текстового файла на основе кириллицы будет отображен как «É», поскольку именно этому знаку соответствует число 201 в данной кодировке.
‘
Юникод: единая кодировка для разных алфавитов
Чтобы избежать проблем с кодированием и декодированием текстовых файлов, можно сохранять их в Юникоде. В состав этой кодировки входит большинство знаков из всех языков, которые обычно используются на современных компьютерах.
Так как Word работает на базе Юникода, все файлы в нем автоматически сохраняются в этой кодировке. Файлы в Юникоде можно открывать на любом компьютере с операционной системой на английском языке независимо от языка текста. Кроме того, на таком компьютере можно сохранять в Юникоде файлы, содержащие знаки, которых нет в западноевропейских алфавитах (например, греческие, кириллические, арабские или японские).
Кодировка текста – это схема нумерации символов, в которой каждому символу, цифре или знаку присвоено соответствующее число. Кодировку используют для сохранения и обработки текста на компьютере. Каждый раз при сохранении текста в файл он сохраняется с использованием определенной схемы кодирования, и при открытии этого файла необходимо использовать такую же схему, иначе восстановить исходный текст не получится. Самыми популярными кодировками для кириллицы сейчас являются UTF-8, Windows-1251 (CP1251, ANSI).
Для того чтобы программа смогла правильно открыть текстовый файл, иногда приходится вручную менять кодировку, перекодируя текст из одной схемы в другую. Например, не редко возникают проблемы с открытием файлов CSV, XML, SQL, TXT, PHP.
В этой небольшой статье мы расскажем о том, как изменить кодировку текстового файла на UTF-8, Windows-1251 или любую другую.
Блокнот Windows
Если вы используете операционную систему Windows 10 или Windows 11, то вы можете изменить кодировку текста с помощью стандартной программы Блокнот. Для этого нужно открыть текстовый файл с помощью Блокнота и воспользоваться меню «Файл – Сохранить как».
В открывшемся окне нужно указать новое название для файла, выбрать подходящую кодировку и нажать на кнопку «Сохранить».
К сожалению, для подобных задач программа Блокнот часто не подходит. С ее помощью нельзя открывать документы большого размера, и она не поддерживает многие кодировки. Например, с помощью Блокнота нельзя открыть текстовые файлы в DOS 866.
Notepad++
Notepad++ (скачать) является одним из наиболее продвинутых текстовых редакторов. Он обладает подсветкой синтаксиса языков программирования, позволяет выполнять поиск и замену по регулярным выражениям, отслеживать изменения в файлах, записывать и воспроизводить макросы, считать хеш-сумы и многое другое. Одной из основных функций Notepad++ является поддержка большого количества кодировок текста и возможность изменения кодировки текстового файла в UTF-8 или Windows 1251.
Для того чтобы изменить кодировку текста с помощью Notepad++ файл нужно открыть в данной программе. Если программа не смогла правильно определить схему кодирования текста, то это можно сделать вручную. Для этого нужно открыть меню «Кодировки – Кириллица» и выбрать нужный вариант.
После открытия текста можно изменить его кодировку. Для этого нужно открыть меню «Кодировки» и выбрать один из вариантов преобразования. Notepad++ позволяет изменить текущую кодировку текста на ANSI (Windows-1251), UTF-8, UTF-8 BOM, UTF-8 BE BOM, UTF-8 LE BOM.
После преобразования файл нужно сохранить с помощью меню «Файл – Сохранить» или комбинации клавиш Ctrl-S.
Akelpad
Akelpad (скачать) – достаточно старая программа для работы с текстовыми файлами, которая все еще актуальна и может быть полезной. Фактически Akelpad является более продвинутой версией стандартной программы Блокнот из Windows. С его помощью можно открывать текстовые файлы большого размера, которые не открываются в Блокноте, выполнять поиск и замену с использованием регулярных выражений и менять кодировку текста.
Для того чтобы изменить кодировку текста с помощью Akelpad файл нужно открыть в данной программе. Если после открытия файла текст не читается, то нужно воспользоваться меню «Файл – Открыть».
В открывшемся окне нужно выделить текстовый файл, снять отметку «Автовыбор» и выбрать подходящую кодировку из списка. При этом в нижней части окна можно видеть, как будет отображаться текст.
Для того чтобы изменить текущую кодировку текста нужно воспользоваться меню «Файл – Сохранить как» и сохранить документ с указанием новой схемы кодирования.
В отличие от Notepad++, текстовый редактор Akelpad позволяет сохранить файл в практически любой кодировке. В частности, доступны Windows 1251, DOS 886, UTF-8 и многие другие.
Посмотрите также:
- Чем открыть PDF файл в Windows 7 или Windows 10
- Как перевернуть страницу в Word
- Как копировать текст с помощью клавиатуры
- Как сделать рамку в Word
- Как сделать буклет в Word
Автор
Александр Степушин
Создатель сайта comp-security.net, автор более 2000 статей о ремонте компьютеров, работе с программами, настройке операционных систем.
Остались вопросы?
Задайте вопрос в комментариях под статьей или на странице
«Задать вопрос»
и вы обязательно получите ответ.
Реклама. АО «ТаймВэб». erid: 2W5zFHQ6b9r
Каждый сталкивался с ситуацией, когда текст в документе Word превращался в набор непонятных символов. Обычно причина кроется в неправильной кодировке – способе, которым компьютер сохраняет и отображает текст. Это особенно актуально при работе с файлами, созданными на других устройствах или в старых программах. Давайте разберемся, что такое кодировка и как исправить проблемы с помощью ее изменения.
Что такое кодировка
Кодировка – это стандарт, который связывает символы алфавита с их цифровыми представлениями в компьютере. Она определяет, как текст сохраняется в файле и как его видят пользователи. Например, популярные кодировки UTF-8 и Windows-1251 используются для разных языков и областей.
Если документ открывается некорректно, проблема часто связана с несоответствием кодировки файла и настроек Word. В результате буквы превращаются в абракадабру или вовсе исчезают. Изменение кодировки помогает восстановить текст и вернуть его читаемость.
Комьюнити теперь в Телеграм
Подпишитесь и будьте в курсе последних IT-новостей
Подписаться
Меняем кодировку при открытии документа
Иногда Word не понимает кодировку, в которой был создан файл. Это часто случается с документами, полученными из других систем или из архивов. Чтобы решить проблему, можно включить настройку, позволяющую выбирать кодировку при открытии. Она поможет Word правильно интерпретировать текст и предложить подходящий вариант.
-
Для получения доступа к нужной функции ее необходимо активировать через настройки. Откройте текстовый редактор и на главной выберите раздел «Параметры».
-
В появившемся окне перейдите к категории с настройками «Дополнительно», прокрутите ее вниз и поставьте галочку возле пункта «Подтверждать преобразование формата файла при открытии».
-
Теперь каждый раз, когда вы будете открывать документы, формат которых отличается от привычного DOCX или DOT, на экране будет всплывать окно, позволяющее выбрать любую кодировку из доступных. Проверьте это, перейдя в раздел «Открыть».
-
Нажмите кнопку «Обзор», чтобы открыть «Проводник» для последующего выбора файлов.
-
Как уже было сказано выше, учитывайте исходный формат, поскольку нативные всегда имеют нужную кодировку. Например, поменять кодировку можно для того же TXT.
-
При открытии появится окно преобразования файла, где нужно выбрать его исходный формат. Оставьте его по умолчанию или отталкивайтесь от того, как именно был сохранен объект.
-
Переходя далее, вы получаете доступ к настройкам преобразования. Справа можно увидеть список со всеми доступными кодировками и выбрать требуемую. Нажмите «ОК», чтобы подтвердить преобразование и открытие документа.
Учитывайте, что при выборе неправильной кодировки можно получить отображение непонятных символов вместо букв во всем документе. Если это произошло, откройте его снова и повторите выбор, отмечая уже нужную кодировку или определяя подходящую путем перебора. Настройку подтверждения преобразования можно будет потом отключить, если вы часто работаете с разными форматами и не хотите видеть всплывающее окно каждый раз при открытии.
Меняем кодировку при сохранении документа
Если вы хотите отправить документ кому-то, кто пользуется другой системой, стоит убедиться, что он откроется корректно. Для этого можно сохранить файл в нужной кодировке. Word позволяет выбрать формат текста и самостоятельно указать кодировку при сохранении, что упрощает обмен документами.
-
Сначала откройте требуемый документ, перейдите на вкладку «Файл» и выберите действие «Сохранить как».
-
Для удобства используйте кнопку «Обзор», чтобы отобразить сохранение через «Проводник» и иметь возможность руками указать формат.
-
Окно преобразования появится в том случае, если вы выбираете текстовые форматы, отличающиеся от DOCX. Снова проведем демонстрацию на примере TXT.
-
После выбора данного формата на экране появится уже знакомое окно преобразования, где нужно выбрать удобную для вас кодировку и подтвердить экспорт.
Обращайте внимание на блок «Образец», где показано, как будет выглядеть текст в выбранной кодировке. Проблемные фрагменты всегда отмечаются красным, а также появляется дополнительное уведомление. Это позволит избежать ошибок при сохранении и указывать только те кодировки, которые совместимы с текстом.
Кодировка играет ключевую роль в том, как текст отображается на экране. Если вы научитесь работать с этим параметром в Word, сможете легко исправить ошибки отображения и подготовить документы для работы на любых устройствах. Тема кажется сложной только на первый взгляд – на практике всё довольно просто, нужно лишь разобраться с основными настройками.
При установке или использовании некоторых программ, а иногда и в интерфейсе системы некоторые пользователи могут столкнуться с тем, что вместо русских букв отображаются «кракозябры», «иероглифы», квадраты и знаки вопроса.
В этой инструкции подробно о том, как исправить отображение кириллицы в Windows 11 для конкретных программ или системы в целом.
Использование Юникод (UTF-8)
Прежде чем приступить, отмечу, что всё описанное ниже не относится к случаям, когда какой-то текстовый документ или сайт отображается неправильно. В этом случае причина, с большой вероятностью, в неверно определенной вашей программой для открытия файла или браузером кодировкой файла.
Для решения можно использовать текстовые редакторы с возможностью выбора кодировки (например, широкий набор поддерживаемых кодировок доступен в Sublime Text), расширения браузера для изменения кодировки или онлайн-сервисы для конвертации.
Если проблема с отображением кириллицы возникает в единичных программах, при этом речь идёт не о каком-то очень старом ПО, возможно, причина в настройках региональных стандартах, в частности, в функции использования символов Юникод (UTF-8). Для того, чтобы проверить, в этом ли дело, выполните следующие действия:
- Перейдите в Панель управления (можно использовать поиск на панели задач), откройте раздел «Региональные стандарты» и перейдите на вкладку «Дополнительно». Попасть на эту вкладку можно, с помощью клавиш Win+R и ввода команды
control intl.cpl,,1
- Нажмите кнопку «Изменить язык системы».
- Проверьте текущий язык системы (установите «Русский», если выбран другой) и состояние отметки «Использовать Юникод (UTF-8) для поддержки языка во всем мире». По умолчанию она снята. Если в вашем случае включена — попробуйте убрать и нажать «Ок», если же отключена, то наоборот.
Вам будет предложено перезагрузить компьютер — сделайте это, после чего проверьте, решилась ли проблема.
Кодовые страницы в реестре
В некоторых случаях, особенно когда ваша Windows 11 была русифицирована установкой языкового пакета (или у вас «сборка» на основе англоязычной версии системы), проблема с «иероглифами» может быть вызвана использованием не подходящих кодовых страниц.
Исправить ситуацию можно попробовать в реестре, однако предварительно я рекомендую создать точку восстановления системы.
Шаги будут следующими:
- Нажмите клавиши Win+R на клавиатуре, введите regedit и нажмите Enter
- Перейдите к разделу реестра
HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\Nls\CodePage
- Обратите внимание на параметр с именем ACP в правой панели редактора реестра и его значение. Если оно отличается от 1251 (обычно при проблемах значение бывает равным 1252), дважды нажмите по параметру и измените значение на 1251. После чего закройте редактор реестра и перезагрузите компьютер.
Второй вариант того же действия (менее желательный) — подмена файла кодовой страницы C:\Windows\System32\c_1252.NLS копией файла c_1251.NLS (при этом желательно сохранить резервную копию файла c_1252.NLS). Файлы защищены и потребуется стать владельцем и получить необходимые права. Если при этом что-то пойдёт не так, может потребоваться выполнить восстановление системных файлов Windows.
Дополнительные варианты
Некоторые дополнительные возможные способы решения проблемы с отображением русских букв в программах и системных элементах Windows:
- Если вы изменяли системные шрифты Windows 11 на более «красивые» проблема может быть вызвана тем, что в выбранном вами шрифте отсутствуют необходимые символы кириллицы (обычно в этом случае отображаются пустые квадраты). Решение — тем же способом, которым вы проделывали это изначально, вернуть стандартный системный шрифт (также, при наличии, можно использовать точки восстановления системы).
- Для некоторых старых программ может сработать запуск в режиме совместимости с версией Windows, для которой они были разработаны.