Текстовый файл

Те́кстовый файл (см. текст) является формой представления последовательности символов в компьютере. Каждый символ из используемого набора символов кодируется в виде одного байта, а иногда в виде последовательности подряд идущих двух, трёх и т.д. байтов.

Текстовые файлы разбиваются на строки (линии, англ. line). На современных платформах разбиение на строки кодируется управляющим символом перевода строки, а иногда последовательностью двух управляющих символов (на некоторых старых платформах разбиение на строки делалось иначе). Вообще, текстовые файлы могут содержать печатные символы, такие как буквы, цифры и знаки препинания и некоторое количество управляющих символов, таких как знаки табуляции и перевода строки.

Текстовым файлам противопоставляются двоичные (бинарные) файлы, в которых информация организована по иным принципам.

Бо́льшая часть компьютерного оборудования и программ не различают текстовые и двоичные файлы. Существует, однако, большое количество программ, предназначенных специально для обработки текстовых файлов или таких программ, которые по–разному обрабатывают текстовые и двоичные файлы. Многие сетевые протоколы, рассчитаны на работу только с текстовыми данными и не могут обрабатывать произвольную последовательность байтов. Программы для ручного набора текстовых файлов называются текстовыми редакторами.

Простой текст как основа для других форматов

Текстовые файлы часто используются для представления данных, которые сами не являются чисто текстовыми. В этом случае другие форматы файлов «надстраиваются» над простым текстом. Это обеспечивает удобство работы с данными на двух уровнях: например, файлы HTML и XML можно просматривать и редактировать с показом всего форматирования в режиме WYSIWYG, а можно их открыть в обычном текстовом редакторе и иметь доступ ко всем тонкостям языка разметки. При хранении данных в бинарном виде (как в Microsoft Word) можно работать только в режиме WYSIWYG.

Языки программирования почти исключительно используют простой текст в качестве основы. В частности, это позволяет использовать для обработки текстов программ разнообразные стандартные утилиты. Ранние интерпретаторы Бейсика сохраняли исходный код в своём собственном бинарном формате, но потом от этого отказались из-за очевидных неудобств.

Файлы конфигурации многих программ используют текстовый формат, даже если там хранятся числа и двоичные переключатели (да/нет). Хотя это вводит небольшое усложнение в программы из-за необходимости преобразования бинарных данных в текст и обратно, но зато намного упрощается отладка; кроме того, при необходимости можно подправить конфигурацию «вручную», без использования собственных средств настройки данной программы.

Расширения имён файлов

В Windows для текстовых файлов используется расширение «txt», тем не менее, многие файлы с другими расширениями могут оказаться текстовыми. Например, исходные коды, обычно, хранятся в файлах с расширениями, соответствующими языку программирования, на котором они написаны.

 
Начальная страница  » 
А Б В Г Д Е Ж З И Й К Л М Н О П Р С Т У Ф Х Ц Ч Ш Щ Ы Э Ю Я
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
0 1 2 3 4 5 6 7 8 9 Home