╒═══════════════════════════════════════╕
│             TextToSC,                 │
│  преобразователь форматов текстовых   │
│       файлов (несколько языков).      │
│     Также поддеpживаются формат,      │
│    используемый редактором миссий     │
│    StarCraft для русских текстов      │
│   (рус. SC, перев. студии Stream)     │
│          и транслитерация.            │
│  Стили перевода строк <LF>, <CRLF>    │
│                                       │
│    FreeWare (подробнее см. внизу)     │
└───────────────────────────────────────┘
   Версия 0.8.3 от 30 ноября 2014 года

ПОДДЕРЖИВАЕМЫЕ ЯЗЫКИ / КОДИРОВКИ:
 вост.-европейские (Win-1251, 866, 855, ISO-8859-5, ISO-IR-111,
               KOI8-R, Mac-Cyr, Mac-U, KOI8-U, KOI7);
 турецкий (Win-1254, 857, Mac-Turk, ISO-8859-9);
 зап.-европейские (Win-1252, 850, ISO-8859-1, ISO-8859-15,
               Mac-Roman).

ЯЗЫКИ ИНТЕРФЕЙСА:
 английский, русский.

Системные требования
────────────────────
ОС: Win9x/ME, WinNT/2000/XP или выше.
процессор 80386 или выше.


Интерфейс
─────────
Синтаксис вызова программы:
texttosc [_ключи_] [_файл1_ _файл2_]
 _ключи_  один или несколько ключей (СМ. НИЖЕ)
 _файл1_  короткое имя исходного файла;
 _файл2_  короткое имя файла, куда записать результат.
Bозвращает коды завершения:
 0 -файл преобразован; 1 -файл не преобразован.

ПРИМЕРЫ:
texttosc -koi8 -towin letter.eml "my letter.txt"
texttosc -1254 -tomacturk page.txt archive.txt
texttosc -iso8859_9 -to857 -src unix.c dos.c
texttosc -noenc -lf mywin.pl mybsd.pl
texttosc -1251 -tokoi8r -html myhome.htm myserver.htm

ВНИМАНИЕ:
файловые маски (*.txt и т. п.) НЕ допускаются

Список ключей командной строки (по категориям)
──────────────────────────────────────────────

═════Исходные кодировки (по ЯЗЫКАМ)═════

   =ВОСТ.-ЕВРОПЕЙСКИЕ (КИРИЛЛИЦА)=

 -dos или -866
   исходный файл в кодировке DOS 866;
 -w или -win
   Windows (1251);
 -koi8 или -koi8r
   KOI8;
 -855
   DOS 855;
 -koi7
   KOI7;
 -mac
   Mac-Cyr;
 -iso или -iso8859_5
   ISO 8859-5;
 -iso_ir_111 или -isoir111
   ISO-IR-111;
 -koi8u
   KOI8-U;
 -macu или -mac_u
   Mac-U;
 -sc
   из редактора миссий StarCraft;
 -u
   то же, что -koi8 (для совместимости с
   предыдущими версиями программы);

   =ТУРЕЦКИЙ=

 -857
   кодировка DOS-857;
 -1254
   Windows-1254;
 -iso8859_9
   ISO-8859-9;
 -macturk
   Mac-Turk;

   =ЗАП.-ЕВРОПЕЙСКИЕ=

 -850
   кодировка DOS-850;
 -1252
   Windows-1252;
 -iso8859_1
   ISO-8859-1;
 -iso8859_15
   ISO-8859-15;
 -macroman
   Mac-Roman;

по умолчанию принимается, что исходный файл в кодировке ДОС-866.

═════Выходные кодировки (по ЯЗЫКАМ)═════

   =ВОСТ.-ЕВРОПЕЙСКИЕ (КИРИЛЛИЦА)=

 -todos или -to866
   преобразовывать в формат 866 (DOS);
 -towin или -tow
   Windows 1251;
 -tokoi8 или -tokoi8r
   KOI8R;
 -to855
   DOS 855;
 -tokoi7
   KOI7;
 -tomac
   Mac-Cyr;
 -toiso или -toiso8859_5
   ISO 8859-5;
 -toiso_ir_111 или -toisoir111
   ISO-IR-111;
 -tokoi8u
   KOI8-U;
 -tomacu или -tomac_u
   Mac-U;
 -tosc
   в редактор миссий StarCraft;
 -translit или -totl
   в латиницу (транслитерация текста);
 -tou
   то же, что -tokoi8 (для совместимости
   c предыдущими версиями программы);

   =ТУРЕЦКИЙ=

 -to857
   в кодировку DOS-857;
 -to1254
   Windows-1254;
 -toiso8859_9
   ISO-8859-9;
 -tomacturk
   Mac-Turk;

   =ЗАП.-ЕВРОПЕЙСКИЕ=

 -to850
   в кодировку DOS-850;
 -to1252
   Windows-1252;
 -toiso8859_1
   ISO-8859-1;
 -toiso8859_15
   ISO-8859-15;
 -tomacroman
   Mac-Roman;

по умолчанию перекодирует в рус. StarCraft.

════Стили перевода строки════

 -lf
    <LF>, принятый в UNIX;
 -crlf
    <CR> <LF>, принятый в Windows;
 -noaltlf
   сохранить символы  <CR> и/или  <LF> так, как они присутствуют
   в исходном файле; отключает автоматический выбор стиля перевода
   строки;

по умолчанию перевода строки устанавливается исходя из
требуемой выходной кодировки.

════Режимы преобразования════

 -src
   режим преобразования исходных текстов программ;
         предохраняет от преобразования некоторых символов в символы
         двойных или одинарных кавычек (которые в языках программи-
         рования используются для обозначения строк/символов);
         этот ключ также следует использовать если Вы преобразуете
         некий текст, который будет вставлен в программу;
 -html
   режим HTML-совместимости;
         предохраняет от появления лишних угловых скобок,
         появления лишних или исчезновения нужных кавычек;
         также для символов, отсутствующих в выходной кодировке,
         старается найти подходящее HTML-обозначение (например,
         для значка параграфа- §);
         ИСПОЛЬЗУЙТЕ при обработке HTML-файлов, JavaScript и
         VBScript, PHP, серверных CGI скриптов;
 -dhcs
   запретить замену символов HTML-обозначениями;
         не позволяет заменять символы, отсутствующие в кодировке,
         на их HTML-обозначения;
         может быть использован с ключом -html (см. выше);
 -noenc
   не преобразовывать кодировку;
         этот ключ используйте ТОЛЬКО если вам нужно просто
         преобразовать стиль перевода строки (например, для
         CGI-программы - см. ключи -lf и -crlf) и не требуется
         изменять кодировку;
 -nta
   отключить анализатор текста;
         анализатор текста - это примочка, которая заменяет символы
         входного текста ориентируясь не только по их коду, но и,
         скажем, по предшествующим символам; пока он только при переко-
         дировании пытается заменять простые кавычки более
         красивыми открывающимися и закрывающимися, определяя сам
         где какие ставить; а с этим ключом все возможности анали-
         затора отключаются;
         препочителен для простого текста; исходные тексты программ
         лучше обрабатывать с ключом -src, а HTML-файлы и скрипты-
         с ключом -html (см. выше)
 -32
   не использовать служебные символы (с кодами  < 32);
         ключ запрещает замену некоторых символов кодировки
         Windows (таких как значок параграфа) аналогичными
         ДОС-овскими из числа служебных символов; аналогично
         и при обратном преобразовании;
         действует лишь с кодировкой DOS-866; во всех
         других случаях программа и сама оставляет символы с
         кодами <32 без изменений (кроме 13 и 10 - см. ключи
         -crlf, -lf и -noaltlf);
 -nstr
   не переводить символы в строки;
         ключ не позволяет заменять некоторые символы (которых
         нет в вых. кодироке) близкими по начертанию сочетаниями
         других символов; это может потребоваться если Вы не хотите
         чтобы выходной файл был больше входного;
         ЕСЛИ ВЫ ПРЕОБРАЗУЕТЕ ТЕКСТЫ НА ЮЖНОСЛАВЯНСКИХ ЯЗЫКАХ,
         то НЕ ИСПОЛЬЗУЙТЕ ЭТОТ КЛЮЧ, т. к. он может привести к
         потере некоторых символов (например, НЬ);
         при транслитерации этот ключ не работает;
 -nqt
   не преобразовывать твердый и мягкий знаки в апострофы;
         применяется только при транслитерации; эти символы будут
         транслитерироваться в буквы q соответствующего регистра;
 -pdt
   сохранять дату/время оригинального файла;
         устанавливает дату/время выходного файла такими же,
         как у входного файла (или сохраняет неизменённой дату
         файла, если один и тот же файл указан как входной
         и выходной);

═════Опции интерфейса══════

 -en
   сообщения программы по-английски;
 -rus
   сообщения программы по-русски;
 -ni
   не выводить сведения о версии;
 -? или /?
   помощь;


________Что нового в версии 0.8.3_______
        30.11.2014 (11/30/2014)
1. Скорректированы экраны помощи и файлы
   справки. Теперь нет смысла использовать
   короткие имена файлов, все длинные
   поддерживаются начиная с версии 0.8.2.

________Что нового в версии 0.8.2_______
        23.11.2014 (11/23/2014)
1. Переделано readme.
2. Программа перекомпилирована для Windows.
   DOS больше не поддерживается.

________Что нового в версии 0.8.1_______
        18.02.2003
1. Добавлен ключ -pdt для сохранения даты/
   времени оригинального файла.

________Что нового в версии 0.8_________
        06.12.2002
1. Убраны БАГИ: у версий 0.7- в кодировке
   КОИ8 перепутаны буквы "Ш" и "Щ", а в ко-
   дировке Mac-Cyrillic неверно обрабатыва-
   лись буквы "ё" и "я".
2. Автоматическая установка символов конца
   строки если не указаны ни ключ -lf, ни
   ключ -crlf. Устанавливает переводы по
    <CRLF> для OEM и Win кодировок и  <LF>
   для остальных. Возможность отключается
   ключом -noaltlf (тогда будут сохраняться
   все символы CR=13 и LF=10 исходного тек-
   ста- как делали предыдущие версии
   TextToSc). При транслитерации указывать
   ключ -noaltlf не нужно, т.к. кодировка
   и стиль перевода строки в этом случае не
   преобразуются.
3. Появился HTML-совместимый режим для пре-
   образования веб-документов. Соответ-
   ственно новые ключи: -html и -dhcs

________Что нового в версии 0.7_________
        07.11.2002
1. Теперь возможно задавать способ перевода
   строк в выходном файле:  <LF> или  <CRLF>
   независимо от того, какой был во входном.
   Ключи -lf и -crlf добавлены для этих це-
   лей. По умолчанию (если не задан ни один
   из них) программа оставляет все  <CR> и
    <LF> без изменений, как делали предыдущие
   версии.
2. Добавлен ключ -noenc для тех, кто только
   преобразует LF/CRLF стиль, а не кодировку.
   Полезно авторам CGI скриптов.
3. Убран идиотский глюк версии 0.6, из-за ко-
   торого многие символы преобразовывались
   неправильно (в версии 0.5 глюка не было).
4. Добавлена поддержка западно-европейских
   кодировок.
5. Исправлена ошибка версий 0.6-: преобразо-
   вание из формата Starcraft rus в любую
   кодировку неверно обрабатывало малую и
   большую буквы "ж".

________Что нового в версии 0.6_________
        31.07.2002
1. Добавлена поддержка ISO-IR-111, KOI8-U,
   Mac-U, КОИ7.
   Программа развивается в сторону поддержки
   МНОЖЕСТВА разных языков, поэтому ключ
   -nec теперь устарел.
2. "Новые" ключи -iso8859_5 -toiso8859_5
   для ISO. Старые -u -tou для КОИ8
   оставлены для совместимости с v 0.5-.
3. Новая функция - транслитерация (из
   кириллицы в латиницу).
4. Теперь программа старается правильно
   преобразовать все символы, наличествующие в
   выходной кодировке. Например, псевдографику
   в KOI8, 855 и 866; дополнительные символы в
   Mac и ISO и так далее.
5. Теперь интерфейс по умолчанию английский.
6. Добавлена поддержка кодировок турецкого
   языка.

________Что нового в версии 0.5_________
        29.07.2001
1. Теперь мы наконец преобразуем в любой
   из форматов, которые читаем.
2. Поддержка страницы 855 (старая ДОС),
   MAC, ISO добавлены.
3. Многоязычный интерфейс (пока русский
   и английский).
4. Анализатор текста и более аккуратная
   работа с записью в 1251.
5. Символы псевдографики из 866 в дру-
   гих кодировках заменяются близкими
   по виду (пока + - и |).

________Что нового в версии 0.4_________
        14.07.2001
1. Поддержка не только русских, но и дру-
   гих кирилллических символов (пока при
   преобразовании из кодировки Windows).
2. Поддержка преобразования множества
   дополнительных символов из кодировки
   Windows.
3. При преобразовании теперь символы могут
   заменяться группами (строками) если в
   требуемой кодировке нет нужного символа,
   поэтому файл на выходе может оказаться
   больше, чем на входе (можно отключить
   такую замену).
4. Новые режимы и ключи командной строки.
   Теперь по команде -? выдаётся только
   краткая справка, а остальное в файле
   README.TXT (его читаете сейчас).

________Что нового в версии 0.3_________
1. Теперь кодирует не только в StarCraft,
   но и в ДОС (для тех, кто StarCraft не
   любит).
2. Теперь понимает и кодировку КОИ8.
3. Теперь можно в качестве источника и
   приёмника задавать один и тот же файл,
   поэтому вместо использования файла
   wintosc.bat можно просто всё указать в
   командной строке (например, вместо коман-
   ды wintosc.bat sample.txt можно выполнить
   texttosc.com -w sample.txt sample.txt).
   Для тех же, кто не доверяет программе или
   желает сохранять резервные файлы я оста-
   вил файл wintosc.bat (как архаизм) и сде-
   лал файлы wintodos.bat и koitodos.bat.

______Версии 0.1 и 0.2____________
 Программа родилась когда я писал миссии
 для StarCraft на русском языке и захотел
 автоматизировать перекодировку текстов
 для них. Ну, и оказалось, что русская
 версия игры для кириллицы использует ка-
 кой-то извращённый клон кодировки 866.


__!!!___Баги___!!!__
╔═══════════════════════════╦═══════════════════════╦══════════════════════╗
║  Что за баг (описание)    ║ Кто обнаружил и когда ║   Принятые меры      ║
╠═══════════════════════════╬═══════════════════════╬══════════════════════╣
║ В версиях 0.7- русские    ║  Автор,               ║ Исправил в версии 0.8║
║буквы "Ш" и "Щ" в КОИ8 были║  6 декабря 2002       ║                      ║
║перепутаны, а буквы "ё" и  ║                       ║                      ║
║"я" неверно обрабатывались ║                       ║                      ║
║в кодировке Mac-Cyr        ║                       ║                      ║
╟───────────────────────────╫───────────────────────╫──────────────────────╢
║ В версиях 0.6- преобразо- ║  Автор, 6 ноября 2002 ║ Исправил в версии 0.7║
║вание из формата Starcraft ║                       ║                      ║
║в любую кодировку неверно  ║                       ║                      ║
║обрабатывало малую и боль- ║                       ║                      ║
║шую буквы "ж".             ║                       ║                      ║
╟───────────────────────────╫───────────────────────╫──────────────────────╢
║ В версии 0.6 многие из    ║  Александр Бахута,    ║ Исправлено в версии  ║
║символов кириллицы преобра-║  8 октября 2002       ║ 0.7                  ║
║зовывались неправильно, что║                       ║                      ║
║вообще сделало использова- ║                       ║                      ║
║ние этой версии почти не-  ║                       ║                      ║
║возможным                  ║                       ║                      ║
╟───────────────────────────╫───────────────────────╫──────────────────────╢
║ В версиях 0.5 и ранее не- ║  Автор 31 июля 2002   ║ Исправлено в версии  ║
║которые из расширенных     ║                       ║ 0.6                  ║
║(не русских) символов ки-  ║                       ║                      ║
║риллицы неверно преобразо- ║                       ║                      ║
║вывались в кодировки, от-  ║                       ║                      ║
║личные от DOS-866          ║                       ║                      ║
╟───────────────────────────╫───────────────────────╫──────────────────────╢
║ В версиях 0.3 и 0.4 из ко-║  Я (т. е. автор),     ║ Исправлено в версии  ║
║дировки КОИ8 не преобразо- ║  20 июля 2001 года    ║ 0.5                  ║
║вывается строчная буква ё  ║                       ║                      ║
╟───────────────────────────╫───────────────────────╫──────────────────────╣
║ Не знаю считать ли это ба-║   Автор при перекоди- ║ Сделана версия 0.4, в║
║гом, но до версии 0.4 про- ║  ровке пары текстов,  ║которой проблема для  ║
║грамма никак не обрабатыва-║  в которых эти самые  ║1251 устранена.       ║
║ла кучу символов кодировки ║  символы были в изо-  ║                      ║
║1251 (разные виды кавычек и║  билии (где-то июнь   ║                      ║
║проч.), что создавало такую║  или июль 2001 года)  ║ В версии 0.6 устране-║
║же кучу проблем. Аналогич- ║                       ║на окончательно       ║
║но с КОИ8 и прочими коди-  ║                       ║                      ║
║ровками.                   ║                       ║                      ║
╚═══════════════════════════╩═══════════════════════╩══════════════════════╝
БАГИ ПЕРЕЧИСЛЕНЫ ТОЛЬКО ДЛЯ ВЕРСИЙ, КОТОРЫЕ ПУБЛИЧНО РАСПРОСТРАНЯЛИСЬ
──────────────────────────────────────────────────────────────────────────
 ОБНОВЛЁННЫЙ СПИСОК сообщений о багах программы можно найти на
 http://super-m.savesoul.ru/support/
 или просто с моего сайта (см. ниже). Также он будет прилагаться к каждой
 новой версии программы.
──────────────────────────────────────────────────────────────────────────
Если к Вам попала какая-то версия программы и Вы нашли в ней бага,
то просьба прислать его описание (конечно, никто не просит Вас ставить
какие-то эксперименты).
    ╓───────────────────────────────────────────────────────┐
    ║   Сообщения о глюках (они же баги) / недоработках     │
    ║   принимаются автором с благодарностью.               │
    ╙────┬─────────────────────────────────────────┬────────┘
         │  Отзывы - также вещь хорошая и нужная.  │
       ╓─┴─────────────────────────────────────────┴───╖
 ┌───┐ ║  А новые, свежие и интересные идеи автор      ║
 │ ! │ ║  встречает с радостью! И готов их потихоньку  ║
 └───┘ ║  реализовывать.                               ║
       ╚═══════════════════════════════════════════════╝

╔╗ ======= ЭТА ПРОГРАММА - ПОЛНЫЙ FREEWARE =======
║║ Вы можете свободно распространять ее и использовать
║║ в некоммерческих целях.
╠╣ Коммерческое использование ТАКЖЕ свободное и не тре-
║║ бует оплаты.
╚╝ 

   Автор Михаил Шмелев,
     super-m@ya.ru
   Web-сайт:
     http://super-m.savesoul.ru/
   Исходный текст (доступ также свободный):
     http://super-m.savesoul.ru/source/texttosc.zip