Количество зарезервированных слов языка С невелико, однако это богатый и мощный язык. Чтобы описать интерпретатор полного С и его реализацию, понадобился бы значительно больший объем, чем одна глава. Интерпретатор Little C (Малый С) предназначен для интерпретации довольно узкого подмножества С, включающего, тем не менее, многие важные средства языка. При определении конкретного состава подмножества языка Little С использовались два главных критерия:
- Неотделимо ли данное средство от языка?
- Необходимо ли оно для демонстрации важных аспектов языка?
Например, такие средства, как рекурсивные функции, глобальные и локальные переменные удовлетворяют обоим критериям. Интерпретатор Little С поддерживает все три вида циклов (наличие всех их, конечно, не обязательно в соответствии с первым критерием, но необходимо в соответствии со вторым критерием). Однако оператор switch не включен в интерпретатор, потому что он не является обязательным (он красив, но не необходим) и не иллюстрирует ничего такого, что нельзя было бы проиллюстрировать с помощью оператора if (который включен в интерпретатор). Реализация оператора switch оставлена читателю в качестве самостоятельного упражнения.
Исходя из этих соображений, в интерпретатор Little С включены следующие средства языка:
- Параметризованные функции с локальными переменными
- Рекурсия
- Оператор if
- Циклы do-while, while и for
- Локальные и глобальные переменные типов int и char
- Параметры функций типов int и char
- Целые и символьные константы
- Строковые константы (ограниченная реализация)
- Оператор return (как со значением, так и без него)
- Ограниченный набор стандартных библиотечных функций
- Операторы +, -, *, /, %, <, >, <=, >=, ==, !=, унарный -, унарный +
- Функции, возвращающие целое значение
- Комментарии вида /*…*/
Хоть этот набор и кажется небольшим, однако для его реализации требуется довольно объемный исходный текст программы. Одна из причин этого заключается в том, что при выполнении программы непосредственной работе интерпретатора предшествует значительная подготовительная работа программы, что обусловлено структурированностью языка.
Ограничение языка Little C
Исходный текст программы интерпретатора Little С довольно длинный, фактически, длиннее, чем следовало бы помещать в книгу. С целью упрощения этого текста в грамматику Little С введены некоторые ограничения. Первое ограничение заключается в том, что телом операторов if, while, do и for может быть только блок, заключенный в фигурные скобки. Если телом является единственный оператор, он также должен быть заключен в фигурные скобки. Например, интерпретатор Little С не сможет правильно обработать следующий фрагмент программы:
for(a=0; a<10; a=a+1)
for(b=0; b<10; b-b+1)
for(c=0; с<10; с=с+1)
puts("привет");
if (...)
if (...) х = 10;
Этот фрагмент должен быть написан так:
for(a=0; a<10; a=a+1) {
for(b=0; b<10; b-b+1) {
for(c=0; с<10; с=с+1) {
puts("привет");
}
}
}
if (...) {
if (...) {
х = 10;
}
}
Благодаря этому ограничению интерпретатору легче найти конец участка программы, составляющего тело одного из операторов управления программой. К тому же, поскольку чаше всего операторы управления программой обрабатывают именно блок, это ограничение не выглядит слишком обременительным. При желании читатель может самостоятельно устранить это ограничение.
Другое ограничение заключается в том, что не поддерживаются прототипы функций. Предполагается, что все функции возвращают тип int, разрешен возвращаемый тип char, но он преобразуется в int. Проверка правильности типа параметра не выполняется.
Все локальные переменные должны быть объявлены в самом начале функции, сразу после открывающейся фигурной скобки. Локальные переменные не могут быть объявлены внутри какого-либо блока. Поэтому следующая функция в языке Little С является неправильной:
int myfunc()
{
int i; /* это допустимо */
if(1) {
int i; /* в языке Little С это не допустимо */
}
}
Здесь объявление переменной i внутри блока if для интерпретатора Little С является недопустимым. Требование объявления локальных переменных только в начале функции немного упрощает реализацию интерпретатора. Для читателя не составит большого труда устранить это ограничение.
И, наконец, последнее ограничение: определение каждой функции должно начинаться с зарезервированного слова char или int. Следовательно, интерпретатор Little С не поддерживает традиционное правило «int по умолчанию». Таким образом, следующее объявление является правильным:
int main()
{
/* ... */
}
однако следующее объявление в языке Little С неправильное:
main()
{
/* ... */
}
Отказ от правила «int по умолчанию» приближает Little С к языкам С99 и C++.