Ответы на вопросы по курсу "Системное программирование"

ОТВЕТЫ НА ВОПРОСЫ ПО КУРСУ "СИСТЕМНОЕ ПРОГРАММИРОВАНИЕ", 1997 г.
1. История развития ВТ в связи с историей развития системного программного
обеспечения.
Современные компьютерные системы наряду с прикладным ПО всегда содержат системное,
которое обеспечивает организацию вычислительного процесса. История системного
программного обеспечения связана с появлением первой развитой в современном понимании
ОС UNIX.
1965 - Bell labs разрабатывает операционную систему Multix - прообраз UNIX, имеющий
далеко не все части современной системы. До этого времени не существовало мобильных ОС
(переносимых на разные типы машин) и Multix также не был мобильной ОС.
1971 - написан UNIX для работы на мощнейшей платформе того времени PDP - 11
1977 - Становится переносимой системой, т.к. переписан на языке C (AT&T system V)
1981 - платформа Intel начинает резко наращивать свои возможности. Колоссальным
прорывом было создание 8088, затем 8086, 80286, etc. Появляется однопользовательская ОС
MS-DOS, на 10 лет ставшая стандартом де-факто для пользователей персональных
компьютеров. Но для машин с процессором Intel появляются и версии UNIX.
Конец 80 – начало 90 гг. – аппаратные средства резко увеличивают свою мощность.
Microsoft создает новую ОС Windows NT и появляется стандарт Win32. Позже появляется
Windows 95 – ОС для одного рабочего места, но имеющая многие возможности NT, призванная
вытеснить MS-DOS. Аппаратные средства позволяют создавать 64-битные версии такой ОС,
как UNIX, и в скором времени она появляется и используется на платформе Alpha фирмы
DEC. С наращиванием мощности аппаратных средств системное программное обеспечение
становится все более изощренным и имеющим большие возможности.
2. Общая классификация вычислительных машин. Современные архитектурные линии ЭВМ.
Системное ПО и его место в современной информатике.
ЭВМ являются преобразователями информации. В них исходные данные задачи
преобразуются в результат ее решения. В соответствии с используемой формой
представления информации машины делятся на два класса: непрерывного действия -
аналоговые и дискретного действия - цифровые. В силу универсальности цифровой формы
представления информации цифровые электронные вычислительные машины представляют собой
наиболее универсальный тип устройства обработки информации. Основные свойства ЭВМ -
автоматизация вычислительного процесса на основе программного управления, огромная
скорость выполнения арифметических и логических операций, возможность хранений
большого количества различных данных, возможность решения широкого круга
математических задач и задач обработки данных. Особое значение ЭВМ состоит в том, что
впервые с их появлением человек получил орудие для автоматизации процессов обработки
информации. Управляющие ЭВМ – предназначены для управления объектом или
производственным процессом. Для связи с объектом их снабжают датчиками. Непрерывные
значения сигналов с датчиков преобразуются с помощью аналогово-цифровых
преобразователей в цифровые сигналы, кот. вводятся в ЭВМ в соотв с алгоритмом упр-я.
После анализа сигналов формируются упр. воздействия, которые с пом. цифро-аналоговых
преобразователей преобразуются в аналоговые сигналы. Через исполнительные механизмы
изменяется состояние объекта.
Универсальные ЭВМ – предназначены для решения большого круга задач, состав которых
при разаработке ЭВМ не конкретизируется.
Пример современных архитектурных линий ЭВМ: персональные ЭВМ (IBM PC и Apple
Macintosh – совместимые машины), машины для обработки специфической информации
(графические станции Targa, Silicon Graphics), большие ЭВМ (мэйнфреймы IBM, Cray, ЕС
ЭВМ).
Общее назначение системного ПО - обеспечивать интерфейс между программистом или
пользователем и аппаратной частью ЭВМ (операционная система, программы-оболочки) и
выполнять вспомогательные функции (программы-утилиты) Современная операционная система
обеспечивает следующее:
1) Управление процессором путем передачи управления программам.
2) Обработка прерываний, синхронизация доступа к ресурсам.
3) Управление памятью.
4) Управление устройствами ввода-вывода.
5) Управление инициализацией программ, межпрограммные связи.
1) Управление данными на долговременных носителях путем поддержки файловой системы.
См. также стандарты в (1).
1. Общее понятие архитектуры. Принципы построения ВС 4-го поколения.
Архитектура – совокупность технических средств и их конфигураций, с помощью кото-
рых реализована ЭВМ. ЭВМ 4 поколения, имеет, как правило, шинную архитектуру, что озна-
чает подключение всех устройств к одной электрической магистрали, наз. шиной. Если уст-
ройство выставило сигнал на шину, другие могут его считать. Это свойство используется
для организации обмена данными. С этой целью шина разделена на 3 адреса – шина адреса,
шина данных и шина управляющего сигнала. Все современные ЭВМ также включают устройство,
наз. арбитром шины, которое определяет очередность занятия ресурсов шины разными уст-
ройствами. В PC распространены шины ISA, EISA, PCI, VLB.
ШИНА
2. Состав и функции основных блоков ВС: процессора, оперативной памяти, устройства
управления, внешних устройств.
Структурная схема машины фон Неймана:
Арифм.-логич.
уст-во
<----?
?---?
Уст-во
управления
<----?
?---?
Вн. уст-ва
| _
Оператив-
ная память
?--------
----------
+ |
--+
Процессор (ЦП) – устройство, выполняющее вычислительные операции и управляющее
работой машины. Содержит устройство управления, выбирающее машинные команды из памяти и
выполняющее их, и арифметико-логическое устройство, выполняющее арифметические и логи-
ческие операции. Работа всех электронных устройств машины координируется сигналами, вы-
рабатываемыми ЦП. В современных ПК процессор представлен одной СБИС, содержащей свыше
миллиона транзисторов.
Оперативная память – предназначена для хранения программ и данных, которыми они
манипулируют. Физически выполнена в виде некоторого числа микросхем. Логически ОП можно
представить как линейную совокупность ячеек, каждая из которых имеет свой номер, назы-
ваемый адресом. Время записи и чтения из ОП в современных машинах занимает доли микро-
секунды, а для других устройств это время в 10-1000 раз больше.
Внешние устройства – устройства ввода и вывода информации. Поскольку, как правило,
они работают значительно меделенне остальных, управляющее устройство должно приостанав-
ливать программу для завершения операции ввода-вывода с соответствующим устройством.
1. Программная модель ЭВМ. Основной командный цикл процессора. Понятие системы ко-
манд.
2. Адресация. Данные в ЭВМ: структура и форматы представления.
Адресация на примере процессора 8086.
Числа, устанавливаемые процессором на адресной шине, являются адресами, т.е. номера-
ми ячеек оперативной памяти, из которых необходимо считывать очередную команду или дан-
ные. Размер ячейки оперативной памяти составляет 8 разрядов, т.е. 1 байт. Поскольку
процессор использует 16-разрядные адресные регистры, то это обеспечивает ему доступ к
65536 (FFFFh) байт или 64К (1K=1024 байт) основной памяти. Такой блок непосредственно
адресуемой памяти называется сегментом. Любой адрес формируется из адреса сегмента
(всегда кратен 16) и адреса ячейки внутри сегмента (этот адрес называют смещением). На
компьютерах, оснащенных процессором 8086, оперативная память обычно имеет размер, рав-
ный 640К. Для того чтобы работать с памятью такого размера, процессор осуществляет пе-
ресчет адресов с помощью процедуры, называемой вычислением эффективного адреса
(рис.2.3).
Физический 20-разрядный адрес вычисляется сложением сдвинутого влево на 4 разряда 16-
разрядного адреса сегмента оперативной памяти со значением 16-разрядного смещения отно-
сительно начала этого сегмента. Используя 20-разрядные адреса, можно адресовать 1М опе-
ративной памяти ( 1M=1024K=1048576 байт). В программе на ассемблере полный адрес запи-
сывается в виде SSSS:0000, гдe SSSS значение сегмента; 0000 – значение смещения. Уча-
сток оперативной памяти размером 16 байт называется параграфом.
Данные в ЭВМ – подразделяются на числовые и нечисловые.
Числовые данные:
1) Целые типы – для представления целых чисел.
2) Вещественные типы – для представления рациональных чисел. Бывают:
а) с фиксированной точкой;
б) с плавающей точкой.
Нечисловые данные:
1) Логические данные – принимающие значение истина или ложь.
2) Строковые данные.
3) Множества.
4) Произвольные данные (текст, звук, графика).
1. Организация ввода-вывода, классификация внешних устройств.
Организация ввода-вывода в современных ЭВМ осуществлена с использованием прерываний.
Это связано с тем, что УВВ работают намного медленнее, чем процессор и оперативная па-
мять. Поэтому управляющее устройство должно приостанавливать выполнение программы и
ждать завершения операции ввода-вывода с внешним устройством. При выводе все результаты
выполненной программы должны быть выведены на ВУ, после чего процессор переходит к ожи-
данию сигналов от ВУ. При вводе, например, с клавиатуры получение значений нажатых кла-
виш осуществляется при поступлении прерывания от клавиатуры.
2. Системные особенности архитектур ЭВМ. Примеры эволюции современных ВК – IBM 370,
PDP11/VAX, Intel 80X86, RISC.
Системные особенности архитектур ЭВМ заключаются в отличиях аппаратных средств, на
которых реализована машина.
Единая система электронных вычислительных машин (ЕС ЭВМ, аналог IBM 370) представ-
ляет собой семейство программно-совместимых машин третьего поколения. Каждая и машин
семейства состоит из :
- процессора;
- оперативной памяти;
- каналов устройств, обеспечивающих операции обмена данными между памятью и внешними
устройствами независимо от процессора;
- набора внешних устройств ввода-вывода, выполняющих обмен информацией между внешними
носителями и каналами.
Для ЕС ЭВМ характерно наличие каналов - специализированных процессоров, позволяю-
щих освободить процессор от выполнения операций ввода-вывода и тем самым повысить ско-
рость обмена с внешними устройствами. В машинах семейства ЕС с помощью каналов обеспе-
чивается параллельная работа процессора и внешних устройств, а также параллельное вы-
полнение операций ввода-вывода с несколькими внешними устройствами.
В основу построения ЕС ЭВМ положен принцип модульности, позволяющий по желаланию поль-
зователя наращивать вычислительную мощность (заменять процессоры), расширять емкость
оперативной памяти, добавлять внешние устройства.
Машины имеют большие наборы команд, развитое системное программное обеспечение,
включающее трансляторы языков программирования Ассемблер, ФОРТРАН, ПЛ/1, КОБОЛ, АЛГОЛ,
ПАСКАЛЬ, операционные системы с различными функциональными возможностями.
Основная особенность управляющих вычислительных машин типа PDP-11 заключается в
том, что взаимодействие между всеми устройствами, входящими в состав комплексов , вклю-
чая процессор , и оперативным запоминающим устройством ( ОЗУ ) осуществляется при помо-
щи единого унифицированного интерфейса, получившего название "Oбщая шина" ( ОШ ). Oбщая
шина является каналом, через который передаются адреса, данные, управляющие сигналы на
все устройства комплекса, включая процессор и память. Физически ОШ представляет собой
высокочастотную магистраль передачи данных, состоящую из 56 линий.
Процессор использует установленный набор сигналов для связи с памятью и для связи
с внешними устройствами, благодаря чему в системе отсутствуют специальные команды вво-
да-вывода.
Все устройства комплекса подключаются в ОШ по единому принципу. Некоторым регист-
рам процессора, регистрам внешних устройств, которые являются источниками или приемни-
ками при передачи информации, на ОШ отводятся адреса. В программах адреса регистров
устройств рассматриваются как адреса ячеек памяти, что позволяет обращаться к ним с по-
мощью адресных инструкций. Так, программирование операций вывода данных на внешнее уст-
ройство практически сводится к пересылке этих данных по определенному адресу.
VAX – 11 – более развитая машина, чем PDP-11. Это 32-битовая машина с адресным
пространством свыше 4Г. Она по архитектуре похожа на PDP-11, но имеет 2 шинных адаптера
– адаптер общей шины и адаптер массовой шины. Все совместимые с общей шиной периферий-
ные устройства могут быть подключены к ней, тогда как высокоскоростные устройства могут
быть подключены к массовой шине через собственные контроллеры. VAX – сокр. от англий-
ских слов "виртуальное адресное расширение", т.е. машина имеет виртуальную память и
многозадачность.
Обычно персональные компьютеры IBM PC состоят из трех частей : - системного бло-
ка;
- клавиатуры;
- дисплея.
Системный блок содержит все основные узлы компьютера :
- электронные схемы, управляющие работой компьютера (микропроцессор, оперативная па-
мять, контроллеры устройств и т.д.);
- блок питания;
- накопители для гибких магнитных дисков;
- накопитель на жестком магнитном диске.
К системному блоку можно подключить ряд дополнительных устройств ввода - вывода. Кроме
клавиатуры и монитора такими устройствами являются:
- принтер - для вывода на печать текстовой и графической информации;
- мышь - устройство, облегчающее ввод информации в компьютер;
- стример - для хранения данных на магнитной ленте;
- модем - для обмена информацией с другими компьютерами через телефонную сеть;
- сканер - прибор для ввода рисунков и текстов в компьютер.
3. Двоичное кодирование информации. Представление элементарных типов данных:
натуральные числа, целые числа со знаком, числа с плавающей точкой.
Состояния "установлен" и "сброшен" соотв. 2 цифрам двоичной системы счисления,
фундаментальной для ЭВМ. Эти цифры называются битами. Двоичное кодирование – представ-
ление данных последовательностью битов. При двоичном кодировании числовой информации
степень двойки при каждой двоичной цифре на единицу больше, чем у предшествующей цифры.
Пример конструкции двоичного кода: 1012=(1*22)+(0*21)+(1*20)=510.
Таким образом осуществляется представление целых чисел без знака. Отрицательные
числа со знаком представляются в дополнительном коде – в форме дополнения до двух.
Чтобы найти двоичное представление отрицательного числа, надо взять его полжительную
форму, проинвертировать ее и добавить к полученному результату 1.
Числами с плавающей точкой называются числа вида x=M*Pq, где М – мантисса, P –
порядок, q – основание системы счисления. Нормализованная форма таких чисел:
M – дробное, |M| < 1.
Q – фиксировано.
P – целое число со знаком.
В машине в двоичных кодах хранится M и P. Порядок, как правило, выравнивается, т.е.
приводится к большему по модулю порядку, путем сдвига мантиссы вправо с меньшим поряд-
ком на кол-во разрядов, равное (Pmax-Pmin)log2Q.
4. Правила арифметических и логических операций с элементарными типами данных.
5. Свойства точности вычислений при работе с плавающей точкой. Приемы
программирования, обеспеч. необходимую точность вычислений.
При работе с плавающими числами следует иметь в виду, что результат не полностью
соответствует арифметике действительных чисел. Диапазон представления чисел: -
1*Qp относительная точность – это минимальное число x, при котором R*(1+x) будет иметь дру-
гой код, чем число R. Потеря точности связана с ситуацией поглощения меньших операндов
большими, которая в свою очередь связана с фиксированным размером мантиссы. Способ
увеличения точности – увеличение размера мантиссы (числа одинарной, двойной, повышенной
точности в языках высокого уровня). При программировании операций с плавающей точкой
многих проблем можно избежать, если правильно подобрать необходимые программисту типы
данных в зависимости от размерности и точности предполагаемо обрабатываемых
вещественных чисел. Некоторые ситуации приводят к ошибкам обработки таких чисел:
а) Поглощение меньших операндов большими.
б) Ситуация потери точности (lost precision). Данный эффект проявляется, когда
вычитаются 2 почти одинаковых числа.
в) Ситуация переполнения. В результате операции порядок превышает максимально
допустимое значение.
г) Ситуация обратная переполнению (underflow) – если порядок становится меньше мини-
мального значения.
д) Потеря значимости – если мантисса стала равна нулю при ненулевом порядке.
6. Представление нечисловой информации. Текстовые данные, символьные коды ASCII,
EBSDIC, UNICODE. Особенности кодирования русского алфавита.
Любой текст представляет собой послдовательность литер 0..9 A..Z a..z А..Я а..я. Набор
литер весьма широк за счет наличия национальных языков. Первые машины имели алфавит
только из цифр и латинских букв. Эти литеры образовали набор символов ASCII, EBSDIC. В
этих кодировках общее количество символов не превышает 128 (7 бит).
При представлении в памяти текст имеет вид последовательности байтов.
Способы представления текста
1. Фиксированная длина - |_|_|_|_|_|_|_|.
2. ASCIIZ - |_|_|_|_|_|_|0|. Конец такой строки обозначает зарезервированный символ (не
печатаемый). Получила широкое распространение благодаря языку C.
3. Variable Lenght - |x|_|_|_|_|_|. Строка содержит длину и последовательность байтов
этой длины. Распространено в языке PASCAL.
Для представления национальных языков, в частности русского, 128 символов в общем
случае недостаточно. Здесь используется:
1) Расширение ASCII – испольование 8 бита, теперь можно кодировать 256 символов;
2) UNICODE – использование 7 битов, но более чем 1 символа кодировки для представления
большего количества литер (например для совместимости с сетями, отсекающими 8-й бит
при передаче).
В настоящее время почти повсеместно используется 8-битовое кодирование символов. Кодо-
вая таблица – графическое представление символов, по которым можно определить код. Про-
блемы при представлении русского алфавита - а) необходимость сортировки по кодам; б)
при этом надо оставить на старых местах символы рисования рамок и заполнения (псевдо-
графики) для совместимости с иностранными программами. Русская кодировка – основная
ГОСТ – имела расположение символов по алфавиту, но в ней были смещены символы псевдо-
графики. В настоящее время исп. альтернативная кодировка ГОСТ – в ней псевдографика ос-
тавлена на старом месте, но малые буквы русского алфавита разорваны (160-175, 224-239,
240-241). Это немного затрудняет сортировку – единственный недостаток. Кроме того, есть
и другие кириллические кодировки – MIC, КОИ-8, ISO-8859, т.п.
1. Представление графической информации – растровое и векторное представления, разре-
шающая способность, полутоновые и цветные изображения, палитры.
Использование ЭВМ в автоматизированных системах управления, различных информацион-
но-вычислительных системах, системах коллективного пользования (см. гл. 13) требует их
укомплектования удобными средствами связи человека с машиной. Одним из таких средств
является устройство ввода-вывода с электронно-лучевой трубкой (ЭЛТ), называемое монито-
ром. В зависимости от типа монитора на экран может выводиться как алфавитно-цифровая,
так и графическая информация. Устройство вывода графической информации состоит из ви-
деопамяти (буфера образа), монитора и устройства сопряжения, передающего на монитор со-
держимое видеопамяти. В современных машинах первое и третье объединено в видеоадаптере.
При векторном представлении графической информации электронный луч на мониторе не-
прерывно пробегает между заданными точками, порождая отрезок – вектор. Такое представ-
ление наиболее удобно для изображений, состоящих из линий и простых геометрических фи-
гур. В этом случае векторное изображение легко масштабируется и требует малый объем па-
мяти для хранения.
Если изображение состорит из многих точек разных оттенков (полутоновое изображе-
ние), то векторный способ будет слишком сложен в реализации, и используется растровый
способ представления – разбиение изображения на мельчайшие "клетки" и вывод на экран
сетки точек – растра (bitmap). Разрешающая способность растра – величина, показывающая,
сколько точек может быть выведено на квадратную единицу изображения (ед. измерения –
dpi (точек на дюйм)). Для видеосистемы единицей измерения может быть размер выводимой
точки и общее количество пикселов, выводимое на экран монитора (например, 1024х768).
В случае монохромного изображения для кодирования 1 точки в буфере образа доста-
точно одного бита – светится или нет. В случае полутонового или цветного изображения
количество бит на точку буфера должно быть таково, чтобы представить все возможные цве-
та или оттенки. Например, 8 битами можно представить 256 цветов или оттенков. В таких
системах программист имеет доступ к палитре – ресурсу видеоадаптера, позволяющему уста-
навливать цвета или оттенки для каждого кода цвета.
2. Представление звуковой информации – общее понятие о дискретизации и квантовании
звуковых сигналов, точность представления звуковых колебаний.
Представление звуковой информации в ЭВМ:
а) Преобразование в цифровую форму с помощью аналого-цифрового преобразователя. При
этом звук превращается в цепочку импульсов, сост. из 8 или 16 бит (фактически в вектор
8-битовых ил 16-битовых чисел)
б) Дискретизация этого сигнала с постоянной частотой. Если например голос человека дис-
кретизируется с частотой 8КГц, используя 8 бит, на протяжении 10с, это займет 80К. По
дискретизированным значениям можно восстановить сигнал с заданной точностью и направить
его в цифро-аналоговый преобразователь. Усилив сигнал с выхода ЦАП, получим звук.
При малой частоте дискретизации часть данных теряется вследствие т.н. шума кван-
тования, и мы не можем достаточно точно воспроизвести данные. Закон Шеннона для дискре-
тизации: для достижения полного соответствия восстановленного сигнала исходному следует
дискретизировать последний с частотой, в 2 раза превышающей его максимальную частоту.
CD-проигрыватели работают с частотой 44KГц, и на такой частоте звук не теряет в качест-
ве.
Равномерная дискретизация – замена сигнала последовательностью его мнгновенных
значений, взятых через равные промежутки времени.
Квантование – разбиение функции сигнала через определенный шаг на интервалы -
уровни квантования и замена сигнала значениями, взятыми с этих интервалов.
Форматы хранения оцифрованного звука в файлах:
VOC – стандарт де-факто от Creative.
WAV – формат оцифрованного звука от Microsoft.
Layer 1, 2, 3 audio MPEG – эффективно закодированный (сжатый примерно в 10 раз) формат
хранения оцифрованного звука - сейчас приобретает наибольшее распространение.
3. Общее описание языка ASM. Типы данных. Оформление программ. Формат записи команд.
Ассемблер – машинно-ориентированный язык, имеющий 2 основных достоинства.
1)позволяет писать программы на уровне команд процессора 2)не требует знания этих ко-
манд, каждая из них заменяется удобной для запоминания мнемоникой – сокращением англий-
ских слов. Транслятор переводит мнемоники в их числовые эквиваленты.
Элементы языка: операторы (команды ассемблера + псевдооператоры макроассемблера),
операнды, выражения, константы, метки, комментарии.
Собственно команды ассемблера процессора – м.б. без операндов, с одним или двумя
операндами, использовать различные типы адресации (см. 19)
Псевдооператоры – 5 групп: определение идентификаторов (EQU), данных (DB), внешние
ссылки (PUBLIC, EXTRN), определение сегментов и подпрограмм (SEGMENT, PROC), управление
трансляцией (END).
Константы – м.б. числовые и литералы (последовательность букв, закл. в апострофы).
Комментарии – начинаются с символа ; и предназначены для улучшения читаемости
программы.
Метки – предназначены для организации переходов в программе. М.б. локальные и
глобальные. Представляют собой символьные имена, заканчивающиеся на :.
Типы данных языка.
Целые типы.
BYTE – байт (однобайтовое целое число, код символа, элемент строки)
WORD – слово (целое число со знаком или без знака)
DWORD – двойное слово, длинное целое
Указатели
Полный 32-битовый указатель или 16-битовое смещение.
Вещественные типы (типы мат.сопроцессора) – действительные числа длиной 32, 64, 80
бит.
Массивы
В ассемблере возможно объявление массивов чисел.
Перичислимые и составные типы
ENUM – набор значений, заним. определенное кол-во бит.
RECORD – запись с битовыми полями, каждое из которых имеет длину опр. количество
бит и инициализируется некоторыми значениями.
STRUC – структура, элемент содержащий 1 или более типов данных, называемых членами
структуры.
UNION (объединение) – то же самое, что и структура, за исключением того, что все
члены объединения занимают 1 и тот же участок памяти.
Формат команды языка:
[Метка:] мнемокод [операнд] [;комментарий]
По умолчанию заглавные и строчные буквы в языке не различаются.
Оформление программ:
[Общие для всех сегментов директивы]
...
Директива открытия сегмента
Текст программы или описание данных
Директива закрытия сегмента
... (может повторяться несколько раз в зависимости от числа сегментов)
Директива окончания программного файла
4. Константы, метки, условная компиляция.
Константы – м.б. числовые (десятичные, двоичные, шестадцатеричные)
ten EQU 10
antiten EQU –10
bitmask EQU 10001001b
video EQU 0A000h
и литералы – символьные
s EQU 'string data'
Метки – служат для присваивания имени команде языка ассемблера. Предназначены для
организации переходов в программе. Представляют собой символьные имена, заканчивающиеся
на :. Глобальные метки действуют во всей программе. Локальные – только внутри
подпрограммы.
Директивы условной трансляции предназначены для обозначения блока программного ко-
да, который включается в объектный файл только тогда, когда выполняется заданное усло-
вие. Cинтаксис:
Ifxxx
;операторы, помещаемые в файл при выполнении условия
ELSE
;операторы, помещаемые в файл, если условие не выполнено
ENDIF
Существуют также дрективы ELSEIF, которые позволяют создавать множественные конст-
рукции IF.
5. Компилятор ассемблер-программ, редактор связей (загрузчик).
Компилятор с ассемблера обрабатывает исходный код, преобразуя его в код команд на
машинном языке. Результат его работы называется объектным кодом. В объектном коде не-
обязательно находится весь код программы – в нем могут быть т.н. внешние ссылки на биб-
лиотечные процедуры или процедуры в других модулях, а также на данные.
Следующий шаг – создание исполняемой программы. Сборкой всех частей программы за-
нимается редактор связей. Он размещает все модули в памяти и настраивает адресные кон-
станты внутри них так, чтобы они соответствовали фактическому местоположению в памяти.
Редакторы бывают 3 разновидностей.
1) Загрузчик – загружает объектный модуль и передает управление на точку вхо-
да программы.
2) Компоновщик – формирует исполняемый файл, точно соответствующий образу
программы в памяти, привязывая его к абсолютным адресам.
3) Компоновщик, генерирующий псевдоперемещаемый код – записывает в исполняе-
мый файл таблицу перемещений (relocation table), где содержатся данные о ячейке
внутри кода, которая зависит от местоположения в памяти. Такой исполняемый файл
перед запуском программы требует настройки. Этим занимается операционная систе-
ма, в формате которой создается исполняемый модуль.
1. Основная память ЭВМ. Адресация, адресное пространство.
Число микросхем памяти, физически присутствующих в компьютере, определяет объем па-
мяти, которую можно использовать для программ и данных. Это число может меняться от ма-
шины к машине. Объем памяти обычно можно наращивать с помощью плат расширения, встав-
ляемых в специальные разъемы. Для процессора память - это не более чем несколько тысяч
8-разрядных ячеек, каждая из которых имеет уникальный адрес.
Говорят обычно не о физическом объеме памяти, а об адресуемой памяти. 8086 может ад-
ресоваться к 1024 К, то есть к 1048576 байтам памяти. Другими словами, это - макси-
мальное количество различных адресов и, следовательно, максимальное количество байт
данных, к которым может обратиться процессор.
Обращение к байту памяти производится с помощью 20-разрядного адреса. В схеме исполь-
зования памяти процессором 8086 адреса имеют "ширину" 20 бит, поскольку они передаются
по 20- разрядной шине адреса. Обычно адреса представляются в шестнадцатеричной системе
исчисления. Таким образом, допустимый диапазон адресов памяти - от ООООО до FFFFF в ше-
стнадцатеричной системе исчисления. При рассмотрении 1024 Кбайтного адресного про-
странства PC его делят на 16 блоков по 64 Кбайт и обозначают каждый из этих блоков ше-
стнадцатеричной цифрой, совпадающей со старшей цифрой адреса. Например, первые 64 Кбайт
памяти - блок О, адреса байтов этого блока от ООООО до OFFFF, последние 64 Кбайт - блок
F, адреса байтов этого блока от FOOOO до FFFFF.
Структура основной памяти, адресуемой 8086
F000
ПЗУ: BIOS, ROM-BASIC, диагностика
E000
Расширения ПЗУ
D000
Расширения BIOS
C000
Расширения BIOS
B000
Видеопамять
A000
Видеопамять
9000
ОЗУ
8000
ОЗУ
7000
ОЗУ
6000
ОЗУ
5000
ОЗУ
4000
ОЗУ
3000
ОЗУ
2000
ОЗУ
1000
ОЗУ
0000
ОЗУ; обычно здесь ПО ОС.
Теоретически, любая область памяти может представлять собой либо неизменяемое ПЗУ,
либо ОЗУ. Однако принято первые десять блоков (блоки с нулевого по девятый общим объе-
мом 640 Кбайт) заполнять оперативной памятью. Оперативная память в PC устанавливается
начиная с блока О и последовательно, без пропусков, наращивается до блока 9 включи-
тельно. Если не все десять блоков заполнены, то программы не должны использовать адреса
несуществующей памяти. Обращение по этим адресам может вызывать различные последствия
в зависимости от модели машины, однако обычно эта ошибка никак не обнаруживается и про-
грамма продолжает работу.
1. Общая структура машинных команд, адресность. Способы адресации операндов. Расслое-
ние памяти, выравнивание, кэш-память.
Общая структура машинных команд.
Операнды, которые используются в операторах ассемблера, могут быть регистром (г), адре-
сом памяти (mem), непосредственным значением, задаваемым прямо в операторе (imm), сег-
ментным регистром (sr). В связи с этим существуют различные форматы одних и тех же ко-
манд:
· первый и второй операнды - регистры. Результат помещается по адресу первого операнда.
Могут использоваться все регистры общего назначения.
· первый операнд - регистр, второй - адрес памяти. Результат помещается в регистр, ука-
занный в операторе, например:
mov ах, DATA ; в регистр АХ помещается содержимое поля DATA
· первый операнд - адрес памяти, второй - регистр. Результат помещается по тому адресу,
который используется в качество первого операнда.
· первый операнд - регистр, второй - непосредственные данные. Результат помещается в
регистр.
· первый операнд - адрес памяти, второй - непосредственные данные. Результат помещается
по указанному адресу.
· первый операнд - сегментный регистр, второй - регистр общего назначения. Результат
помещается в сегментный регистр, причем задание регистра CS в таком формате команды не
применяется.
· первый операнд - регистр общего назначения, второй - сегментный регистр. Результат
помещается в регистр общего назначения.
Команды, работающие с одним операндом, могут работать с регистрами общего назна-
чения, адресами памяти или с сегментными регистрами.
Способы адресации операндов. В программах на Assembler применяются следующие типы
адресации операндов:
· регистровая;
· прямая;
· непосредственная;
· косвенная;
· базовая;
· индексная;
· базово-индексная.
Регистровая адресация подразумевает использование в качестве операнда регистра
процессора, например: push DS mov BP,SP
При прямой адресации один операнд представляет собой адрес памяти, второй - ре-
гистр: mov DATA, АХ
Непосредственная адресация применяется, когда операнд длиной в байт или слово на-
ходится в ассемблерной команде: mov AX,4Ch
При использовании косвенной адресации исполнительный адрес формируется исходя из
сегментного адреса в одном из сегментных регистров и смещения в регистрах ВХ, ВР,SI или
DI, например: mov АL, [ВХ], mov АН, [SI].
В случае применения базовой адресации исполнительный адрес являетсй суммой значе-
ния смещения и содержимого регистра ВР или ВХ, например:
mov АХ, [ВР + 6]
mov [ВХ + Delta], АХ
При индексной адресации исполнительный адрес определяется как сумма значений ука-
занного смещения и содержимого регистра SI или DI так же, как и при базовой адресации,
например:
mov DX, [SI+5]
mov ES: [DI]+6, AL
Базово-индексная адресация подразумевает использование для вычисления испол-
нительного адреса суммы содержимого базового и индексного регистров, а также смещения,
находящегося в операторе, например:
mov ВХ, [BP][SI]
mov ES:[BX+DI],AX
Кэш-память – сверхоперативная память, обращение к которой намного быстрее, чем к
оперативной и в которой хранятся наиболее часто используемые участки последней. При об-
ращении к памяти сначала нужные данные ищутся в кэш-памяти. При отсутствии производится
обращение к оперативной памяти, в результате общее время доступа к памяти сокращается.
20. Состав типичных систем команд. Комплексный набор команд и RISC – процессоры.
21. Программно доступные ресурсы процессора. Управление последовательностью операций.
Условные и безусловные переходы. Понятие о механизме прерываний.
В процессоре, как правило, программно доступными являются большинство регистров – ячеек
памяти, расположенных непосредственно на процессоре. В 8086 недоступным для непосредст-
венного чтения и изменения является только счетчик команд IP. Остальные регистры 8088,
а также 8 регистров сопроцессора доступны программисту. Изменение последовательности
выполняемых операций осуществляется при выполнениии команд условного и безусловного пе-
рехода. Команды условного перехода передают управление по адресу, заданному операндом,
в зависимости от состояния отдельных битов флагового регистра, кроме команды JCXZ, ко-
торая проверяет состояние регистра СХ. Модификацию флагов можно произвести как
непосредственно, так и выполнив команду сравнения CMP, которая установит флаги по ре-
зультату операции. Примеры команд условного перехода: JA, JE, JNE, JB, JZ, JL. Команда
безусловного перехода JMP передает управление по указанному адресу.
Прерывания – специфические сигналы, посылаемые процессору устройством или про-
граммой, когда требуется его немедленное вмешательство. В этом случае он останавливает
всякую другую деятельность и вызывает программу-обработчик прерывания. По окончании ее
работы он продолжает прерванную работу с того места, где она остановилась.
Прерывания бывают 2 типов –
а)аппаратные (генерируются схемами ПК в ответ на какое-либо действие, например,
при нажатии клавиши на клавиатуре генерируется прерывание 9). Иногда аппаратные преры-
вания генерируются устройством в случае некорректной работы программы, например деление
на 0.
б)программные – генерируются программой для вызова различных подпрограмм из ОЗУ и
ПЗУ.
Аппаратные прерывания процессор обрабатывает в порядке приоритета (важности).
Прерывания, требующие немедленной реакции процессора – немаскируемые (NMI). Такие пре-
рывания процессор обрабатывает перед всеми остальными, часто они сигнализируют об ава-
рийных ситуациях.
22. Классификация объектных данных в программах на языках высокого уровня. Агрегатные
данные: векторы, массивы, структуры, множества и их отображение на реальную ОП.
Большинство современных ЯВУ определяет понятие типа данных. Оно применяется ко
всем объектам данных и определяет набор физический набор свойств и операций присущих
данным этого типа. Различают языки со строгой типизацией (PASCAL) и со свободной
(ASSEMBLER). Тип данных определяется как рекурсивное использование базовых предопреде-
ленных типов + агрегатирование. Агрегатирование – включает в себя описание массивов,
структур, множеств, объединений.
Базовые типы
Перичислимый тип – объект данного типа может принимать одно из перечисленных за-
ранее значений. Целые числа, действительные числа, символьные данные, битовые данные,
указатель (типизированный и нетипизированный).
Агрегатирование
Массив – каждому элементу ставится в соответствие его индекс. Необходимо иметь
возможность переводить индекс в адрес памяти. Для одномерных массивов проекция элемен-
тов на ОП выглядит как @A[i]=@A[0]+i*l, где l-длина элемента массива. Для многомерного
есть 2 случая – размещение по строкам и по столбцам. Для двумерного массива прекция
элемента @A[i,j]=@A[0]+i*lстр+j*lэл-та, где lстр – длина строки, а lэл-та – размер эле-
мента. Если ЯВУ позволяет массивы переменной длины, то к массиву должен быть приписан
скрытый элемент данных, наз. дополнительным вектором. Он должен содержать информацию о
последних измененных размерностях для правильной индексации.
Структура – совокупность элементов различных типов. Длина структуры равна сумме
длин всех ее членов. Чтобы обратиться к структуре по памяти, надо знать, где расположе-
на структура, и смещение элемента внутри структуры.
Объединение – похоже на структуру, но все члены объединения расположены на одном
участке памяти.Описывает одни и те же данные "с разных точек зрения". Размер объедине-
ния совпадает с размером самого большого члена объединения.
Множество – представление набора элементов. Могут быть ограниченные и динамиче-
ские. Представлены в виде битовых полей – 1 означает наличие элемента, 0 – отсутсвие.
Длина равна числу элементов разделить на 8 и дополнена до кратности 8 в большую сторо-
ну. Доступ – через логические операции.
23. Указатели и динамические структуры данных: стеки, списки, очереди, деревья.
Указатель – тип данных, хранящих адрес в памяти других данных. В зависимости от
типизации указатель может быть нетипизированным (содержать просто адрес в памяти) и ти-
пизированным (указывать только на элемент определенного типа).
Стек – хранилише данных однородного типа с дисциплиной "последним пришел-первым вышел"
(LIFO).
?
SP
Над стеком определены операции PUSH, POP (затолкнуть, извлечь).
При операции PUSH указатель стека SP увеличится на 1, при извлечении уменьшится на 1.
Природа стека делает необходимым соответствие операций PUSH и POP. Если его нет, то
возможно 2 ситуации:
а) переполнение – SP вышел за пределы верхнего значения
б) антипереполнение –"- нижнего.
Очередь – структура данных с дисциплиной FIFO – "первым вошел, первым вышел".
?tp
?hp
Здесь HP – указатель на последнее значение, tp – номер последнего выбранного элемента.
Если HP=TP – очередь пуста.
ENQ x - добавляем в очередь
HP=HP+1
A[HP]=x
DEQ x - извлекаем из очереди
TP=TP+1
x = A[TP]
Особые ситуации - так же как и со стеком.
Для реализации динамических структур данных используют т.н. кучу (heap). Это объем па-
мяти, в котором можно выделить участок для произвольного элемента данных. Для кучи есть
2 операции: выделения памяти ALLOCATE и освобождения FREE. Эти функции не делают ника-
ких действий с собственно памятью. При выделении программист получает адрес, а при ос-
вобождении доступный объем кучи становится больше. Одного адреса для этих операций не-
достаточно, требуется еще и размер элемента данных.
Списки – сложные динамические структуры данных, представляющие собой структуры,
содержащие указатели на другие подобные структуры. Если такой указатель в структуре 1 –
односвязный список, если 2 – двусвязный, если много – многосвязный. Стек и очередь мож-
но легко представить в виде одно- и двусвязного списка. Списки характеризуются тем, что
для них легко реализуется любая дисциплина ввода-вывода за счет простого добавления и
удаления элемента.
Для добавления элемента достаточно выделить под него память и присвоить адрес памяти
нового элемента соответствующему предыдущему элементу. Для удаления элемента память из-
под него освобождается, а указателям на него присваивается некоторое зарезервированное
значение NULL – "указатель на ничто".
data;
struct s *next;
data;
struct s *next;
data;
struct s *next;
NULL
Односвязный список
data;
struct s *prev;
struct s *next;
data;
struct s *prev;
struct s *next;
data;
struct s *prev;
struct s *next;
NULL
Двусвязный список
Дерево – структура данных, в которой каждому элементу может соответствовать несколько
подчиненных элементов, например, для бинарного дерева – два подчиненных элемента.
Структура для представления такого дерева – данные и указатели на левого и правого по-
томков. На таком списке реализуются все операции по обходу деревьев.
NULL NULL
NULL NULL NULL NULL
Структура двоичного дерева. Каждый элемент содержит поле данных и два указателя -
на левого и правого потомков.
24. Способы выделения памяти в программах: абсолютное, статическое, динамическое
и автоматическое распределения. Механизм стека и кучи при реализации процессоров языка
программирования.
Статическое выделение памяти – выделение памяти под данные внутри сегмента данных
программы. Такие данные существуют на протяжении всей жизни программы до ее завершения.
Автоматическое распределение – выделение памяти под данные в стеке. Такие данные
существуют на протяжении работы текущей подпрограммы (функции или процедуры), затем
уничтожаются.
Динамическое выделение – выделение памяти под данные самой программой, когда это
необходимо. Время жизни таких данных зависит от программы.
В стеке размещаются данные для возврата из подпрограмм, а также их аргументы и
автоматические данные. Все это может потребовать достаточно большого размера стека. Как
правило, программист может определять размер стека в программе.
Куча. Для реализации динамических структур данных используют т.н. кучу (heap).
Это объем памяти, в котором можно выделить участок для произвольного элемента данных.
Для кучи есть 2 операции: выделения памяти ALLOCATE и освобождения FREE. Эти функции не
делают никаких действий с собственно памятью. При выделении программист получает адрес,
а при освобождении доступный объем кучи становится больше. Одного адреса для этих опе-
раций недостаточно, требуется еще и размер элемента данных. Если указатель типизирован-
ный, размер будет получен автматически. В случае нетипизированного указателя размер
должен быть передан в функцию.
Для реализации кучи ЯВУ снабжаются диспетчерами памяти, которые выделяют и осво-
бождают память, имеют сведения о ее фрагментации, знают наибольший кусок свободной па-
мяти и ее общее количество и т.п. При ненадобности память должна своевременно освобож-
даться. При использовании динамической памяти возможноа ситуация образования «мусора» –
кусков памяти, на которые утеряны ссылки, но которые не были своевремменно освобождены,
поэтому менеджер считает их занятыми. Для оптимизации известна процедура "уборка мусо-
ра" – перестройка динамических структур с освобождением памяти из-под тех данных, на
которые отсутствуют ссылки.
25. Среды ссылок: глобальная, локальная и нелокальная их реализация в исполняющих
системах ЯВУ.
26. Понятие программного модуля: подпрограммы, функции, сопрограммы.
Модульное программирование подразумевает разбиение программы на подпрограммы по
специфике обрабатываемых данных. Для этой цели в ЯВУ используются функции и процедуры.
При вызове подпрограммы в стеке сохраняется текущее значение счетчика команд (ближняя
модель вызова) и значение сегмента кода (дальняя модель вызова). При использовании
дальней модели вызова подпрограмма необязательно должна находиться в том же сегменте,
что и вызывающая программа. По окончании выполнения кода подпрограммы эти данные вос-
станавливаются, управление передается на следующий оператор после оператора вызова про-
цедуры.
До вызова подпрограммы в стек помещаются параметры – аргументы подпрограммы. Если
передан не сам аргумент, а его адрес, то подпрограмма может изменить аргумент, в про-
тивном случае нет, т.к. по завершению работы подпрограммы стек очищается от аргументов.
Отличие функций от процедур в том, что функции могут возвращать значения в вызывающую
программу и их можно присваивать, например, какой-либо переменной. В действительности
функция при возврате значений просто модифицирует регистры процессора, а ЯВУ по согла-
шению использует данные из этих регистров.
27. Способы передачи управления между модулями. Применение стека для организации
связи в подпрограммах и функциях.
Переписать 26 без первых 2 предложений.
28. Параметры подпрограмм и функций. Способы передачи параметров – по значению,
по ссылке, по имени.
До вызова подпрограммы в стек помещаются фактические параметры – аргументы под-
программы. Если требуется изменит аргумент в процедуре, то передается не сам аргумент,
а его адрес. Существует два способа передачи параметров в подпрограмму для 8086 – со-
глашения о передаче параметров в С и Паскале. При передаче параметров первым способом
запись аргументов в стек идет с последнего до первого, в Паскале наоборот.
Передача самого аргумента – передача параметра по значению. Передача адреса аргу-
мента – передача по ссылке.
В С можно писать подпрограммы с переменным числом параметров, однако это не реко-
мендуется, т.к. стек имеет ограниченный размер и не желательно передавать по значению
элементы данных большого размера.
После выполнения пролога все параметры подпрограммы имеют отрицательное смещение
от регистра BP. После выполнения пролога, как правило, в стеке выделяется место под
локальные переменные.
По окончании работы процедуры стек очищается от локальных переменнных и
параметров.
29. Общая структура программного модуля для микропроцессора 80х86 – регистр BP,
локальные переменные, глобальные переменные, параметры.
Обобщение 26, 28 (см. их для того, чтобы написать более подробно)
Регистр BP – относительно него с отрицательным смещением происходит адресация па-
раметров после выполнения кода пролога в подпрограмме.
push bp
mov bp, sp
mov ax, word ptr [bp-2]; загрузка в ах аргумента
Локальные переменные – размещаются в стеке после вызова процедуры и выполнения
кода пролога и удаляются перед завершением.
Глобальные переменные – размещаются в сегменте данных программы и существуют в
течение всей жизни программы.
Параметры – могут передаваться по значению и по ссылке, размещаются в стеке перед
вызовом процедуры, после выполнения кода пролога к ним возможно адресоваться через ре-
гистр BP, при завершении подпрограммы удаляются из стека.
30. Сегментация памяти. Типы программных сегментов, их использование в програм-
мах.
Любая программа состоит из многих частей. Как правило некоторые функции пишутся
самостоятельно, другие используются готовыми. Чтобы обеспечить взаимодействие между
частями программы, применяют ряд механизмов.
а) унитарная структура объектного модуля.
б) механизм внешних ссылок позволяет устанавливать связи между отдельными частями.
в) Способ объединения отдельных частей в общий исполняемый модуль. В современных систе-
мах основой 3-го способа и является сегментация.
Сегменты – бывают 4 видов.
а) кодовые – содержат коды исполняемой программы. Вряде случаев там можно располагать и
данные. Модификация сегмента кода в процессе работы программы считается плохим стилем
программирования, но иногда это приходится делать, напр. при сохранении регистров перед
запуском программы функцией EXEC.
Сегменты данных бывают 3 типов:
а) сегмент инициализированных данных – содержит данные статического типа с уже
присвоенными значениями
б) сегмент стека – как правило, ничем не инициализирован
в) сегмент неинициализированных данных. В него попадают данные, не имеющие начального
значения (BSS).
Исполняемый модуль содержит образ начального состояния всех сегментов, и не обязан со-
держать только образ BSS.
При использовании указателей в программах с не более чем одним сегментом данных и
не более чем одним – кода достаточно 16-битового короткого указателя, т.к. значения
сегментов фиксиованы и хранятся в регистрах DS и CS соответственно. Для большего коли-
чества сегментов требуются длинные указатели.
Существует несколько моделей памяти – способов распределения программ по
сегментам. Поддержка переключения моделей памяти есть в компиляторах C и ASSEMBLER, в
остальных, например Trubo Pascal, чаще всего используется модель памяти LARGE.
TINY (крошечная) – и данные и код в одном сегменте (64К). Короткие указатели.
Полученный исполняемый модуль может быть пригоден для конверсии в формат типа COM.
SMALL (малая) – 2 сегмента – код и данные (128K).Короткие указатели.
COMPACT (компактная) – 1 сегмент кода и много сегментов данных. Первая модель, где нуж-
ны дальние указатели.
MEDIUM (средняя) – наоборот, много сегментов кода, 1 данных.
LARGE (большая) – много сегментов кода и данных. Наиболее распространена.
HUGE (огромная) – то же, что и LARGE + все указатели программно приводятся к виду длин-
ных. Используется для построения очень больших программ.
В 32-битовом режиме модели памяти не нужны, т.к. размер сегмента достигает 4ГБ.
31. Особенности указателей в 80х86. Модели памяти.
См. 30.
32. Понятие среды ОС. Взаимодействие прикладной программы с ОС. Системные соглашения о
связях.
Структура взаимодействия аппаратуры, системы и прикладного ПО.
Аппаратные средства ПРИЛОЖЕНИЕ
Операционная система
Прикладное ПО API
СИСТЕМА
Среда ОС – совокупность условий, в которых работают прикладные програмы в данной ОС.
Современная ОС обеспечивает, как минимум, 4 условия:
а) запуск и остановка прикладных программ.
б) распределение ресурсов.
в) обеспечение таких системных услуг, которых нет в аппаратуре.
г) защиту, т.е минимальную вероятность повреждения программ и данных при сбое одной из
выполняющихся программ.
Чтобы писать приложения под ОС, существует ряд правил, которым должен следовать про-
граммист, в частности, он должен знать API – интерфейс прикладного программирования.
Определяет состав, параметры и смысл функций, предоставляемых ОС программисту.
Например: стандарт POSIX на API ОС UNIX включает функции:
1) Набор файловых операций
2) Операции со строками
3) Ф-ии многозадачности, управления процессами
4) Управление терминалом.
Помимо POSIX есть API Win32 и т.п. АPI ОС может включать самые разнообразные услуги,
вплоть до поддержки функций телефонного аппарата на базе модема (TAPI Win32)
33. Принципы междумодульного взаимодействия: внешние ссылки и общие имена (public
names)
Внешние ссылки из сегмента позволяют получать доступ к данным, которые объявлены в
другом модуле. Для объявления внешних ссылок в компиляторах с ассемблера используется
директива EXTRN. Пример использования:
EXTRN maybe:far
Идентификаторы в программе можно сделать доступными из других модулей. Для этого
применяется директива PUBLIC. Пример использования:
maybe PROC far
PUBLIC maybe
Такие действия необходимы для того, чтобы после раздельной компиляции модулей ком-
поновщик, используя имена и смещения, записанные в объектных модулях, разрешил все
внешние ссылки директив EXTRN, использовав соответствующие директивы PUBLIC. Если для
какой-то ссылки EXTRN не будет обнаружен соответствующий идентификатор PUBLIC, то ком-
поновщик выдаст ошибку unresolved external , и сборка прекратится.
Использование многомодульной структуры необходимо:
а) для разбиения большого текста на модули по функциональному назначению;
б) для создания библиотек процедур;
в) для написания подпрограмм в языки высокого уровня.
34. Технология разработки программ – трансляция и редактирование связей. Понятие об ис-
ходном, объектном, выполняемом модулях.
Исходный код программы – код, написанный на языке программирования. Может включать
модули на ЯВУ и модули с подпрограммами на языке ассемблера.
Объектный модуль – код программы после трансляции (компиляции), преобразованный в
машинные коды. Помимо них содержит внешние ссылки и информацию для редактора связей и
может также содержать отладочную информацию (debug info).
Исполняемый модуль –модуль, содержащий готовую к выполнению программу – м.б. 2 ви-
дов:
а) точный образ памяти программы с привязкой к абсолютным адресам (в MS-DOS – фор-
мат файла *.COM)
б) перемещаемый исполняемый формат, см. 17.
Трансляция – получение объектного кода из исходного.
Редактирование связей – разрешение внешних ссылок и создание исполняемого модуля
из объектных.
35. Основные функции редактора связей – распределение памяти, разрешение внешних
ссылок – см. 17, 33.
36. Программные сегменты и их атрибуты, способы распределения памяти под сегменты.
Собственно сегменты и распределение памяти см. 30.
Атрибуты сегментов
Атрибут комбинации сегмента предназначен дляуказания компоновщику, каким образом объе-
динять сегменты, находящиеся в разных модулях и имеющие одинаковые имена. М.б. PRIVATE
(сегмент не будет объединяться с одноименными из др. модулей), PUBLIC (будет) и некото-
рые другие.
Атрибут класса сегмента представляет собой строку, заключенную в кавычки, которая по-
зволяет определить компоновщику нужный порядок размещения сегментов при помещении их в
программу из разных модулей. Он группирует вместе сегменты с одинаковым классом.
Атрибут выравнивания сегмента – сообщает компонаовщику, чтобы он позаботился о том,
чтобы сегмент начинался с указанной границы. Возможное выравнивание: BYTE – выравнива-
ние не делается, сегмент начинается со следующего байта, WORD (DWORD) – выравнивание
погарнице слова (двойного слова), PARA – выравнивание по границе 16-байтового парагра-
фа, и т.п.
Атрибут размера сегмента – показывает размер, 16 или 32-битные сегменты.
Атрибут доступа – показывает возможность доступа к сегменту в защищенном режиме – дос-
тупен как кодовый, для чтения, записи, чтения и записи.
37. Разрешение внешних ссылок, функция автовызова, библиотеки объектных модулей и их
использование.
Разрешение внешних ссылок – см. 33, 17.
Библиотеки объектных модулей – пакет объектных модулей, собранных в один файл и подклю-
чаемый к программе на этапе разрешения внешних ссылок (все идентификаторы, которые
должны быть доступны из библиотек, объявляются в модулях как PUBLIC). Компоновщик может
просматривать библиотеку и самостоятельно находить нужные модули, избавляя от этого
программиста. Библиотеки делаются с помощью программы-библиотекаря. Библиотекарь может
добавлять и извлекать модули, а также получать список доступных идентификаторов.
Любой компилятор ЯВУ имеет в комплекте несколько стандартных библиотек, например,
библиотеки ввода-вывода, работы с плавающей точкой, графическую и т.п.
38. Типы внешних ссылок и общих имен. Статическое и динамическое разрешение ссылок.
Внешние ссылки см. 17, 33, 34.
Статическое и динамическое разрешение внешних ссылок.
Процесс разрешения внешних ссылок на этапе создания исполняемого модуля – статическое
разрешение ссылок. Возможно и динамическое подсоедиение нужных модулей на этапе работы
программы.
а) Динамически вызываемый загрузчик, т.е. программа вызывает загрузчик и подсоединяет
недостающие части. Такой подход невыгоден (сложен и требует много времени)
б) DLL – принцип разделяемых библиотек. DLL – это пакет функций, отредактированный для
исполнения в позиционно-независимом стиле. Имеет таблицу всех содержащихся функций. Для
работы с ним программа выполняет 1) функцию загрузки DLL, 2)переход по смещению в таб-
лице функций.
При работе с DLL несколько программ могут использовать одну ее копию в памяти.
39. Динамическое распределение памяти, оверлейные программы. Общая структура объектного
модуля.
Стандартный исполняемый псевдоперемещаемый модуль (например, типа EXE для DOS) со-
держит сегменты в том виде, в котором они будут размещены в памяти. Такое распределение
памяти называется статическим. В ситуации нехватки памяти, отдельный код или данные,
которые могут быть нужны не все вместе, а по очереди, разумнее было бы подгружать в па-
мять в процессе выполнения. Выделение памяти под выполняемый код в процессе работы про-
граммы и удаление их после использования называется динамическим распределением памяти.
Программы, содержащие динамически подгружаемые модули, называются оверлейными, а сами
такие модули – оверлеями. Загрузка данных из модуля в общем случае не представляет про-
блем, в случае загрузки кода перед выполнением он должен быть особым образом подготов-
лен (например, с учетом местоположения вызывающей программы в памяти для подпрограмм
должны быть образованы правильные ссылки). Такую подготовку выполняет специальная про-
грамма – менеджер оверлеев. Он может поставляться, а) как библиотека компилятора [в
Borland Pascal 7.0]. В этом случае оверлейный модуль, как правило, имеет какой-то свой
специфический формат, работа с ним ведется с помощью стандартных подпрограмм. Код овер-
лейных подпрограмм и данных размещается в памяти [в BP буфер оверлеев имеет плавающую
границу с кучей] и по окончании работы с ним может быть удален. б) Может быть внедрен в
структуру оверлейного модуля. В этом случае модуль имеет формат исполняемого файла, и
для инициализации он должен быть запущен стандартным для ОС способом из-под вызывающей
программы.
Оверлеи имеют широкое распространение в системе MS-DOS, при подгрузке используется
не только основная память, но и DOS-спецификации расширенной: XMS, EMS. В развитых мно-
гозадачных системах используется, в основном, очень похожая технология DLL. Ее отличие
в том, что она функционирует в защищенном режиме и позволяет использовать одну свою
копию в памяти разным программам. DLL можно рассматривать как следущее поколение овер-
лейной технологии.
40. Основные функции ОС. Принципы мультипрограммирования. Системные ресурсы.
Основные функции ОС:
1) Управление процессором путем передачи управления программам.
2) Обработка прерываний, синхронизация доступа к ресурсам.
3) Управление памятью.
4) Управление устройствами ввода-вывода.
5) Управление инициализацией программ, межпрограммные связи.
6) Управление данными на долговременных носителях путем поддержки файловой системы.
Ресурс – какой-либо объект или показатель надежности какого-либо объекта. Системные
ресурсы – совокупность аппаратных ресурсов и системных сервисов. Основными потребителя-
ми системных ресурсов являются процессы, выполняемые в системе.
41. Защита программ и данных в мультипрограммных средах. Режимы управления. Защита и
распределение памяти.
Защита программ и данных в многозадачных ОС означает малую вероятность того, что
сбой одной из выполняющихся программ не вызовет повреждения данных или кода других про-
грамм, и по возможности изолировать процессы друг от друга. Во всех ОС сущ. хотя бы 2
режима процессора – системный и пользовательский. Программа исп. в пользовательском ре-
жиме и не может использовать ряд команд. В системном режиме доступно все. Переключение
режимов работы осуществляется системными вызовами. Системный вызов – специальная коман-
да, приводящая к прерыванию, и в ядре ОС существует несколько точек, куда перейдет
управление по этому прерыванию. 386 имеет встроенный механизм для этих переключений –
шлюз.
Защита памяти – осуществляется путем блокировки доступа к памяти других процессов,
а также блокировки доступа к памяти ядра. Один из способов – вся память делится на
страницы, и у каждой есть замок – 4-битовый признак, который можно установить только
привелигированной командой. В процессоре есть 4-битовый регистр – ключ, который также
можно установить только привелигированной командой. При обращении происходит сравнение
замка и ключа.
С появлением многозадачности появилась проблема распределения памяти. При работе
реальной программы обращения к ОП имеют тенденцию к локализации. Память можно разделить
на используемую и неиспользуемую. Чтобы отследить использование области памяти, всю ОП
можно разбить на страницы фиксированного размера (4К) и с каждой страницей связать бит,
который устанавливать при обращении к данной странице.
42. Управление ЦП – фоновая обработка, пактная обработка, прерывания.
43. Общая схема функционирования ОС – супервизор, диспетчер, планировщик. Виртуализа-
ция.
Супервизор – программа многозадачной ОС, обеспечивающая наилучшее использование
ресурсов ЭВМ при одновременном выполнении нескольких задач.
Планировщик – программа, выполняющая алгоритм планирования процессов. Планирова-
ние очередности предоставления выполняющимся процессам времени центрального процессора
(диспетчеризация). Процессы работают с центральным процессором в режиме разделения
времени.
44. Виртуальная память и способы ее реализации. Страничная память. Свопинг.
Виртуальная память отличается от обычной ОП тем, что какие-то ее редко используе-
мые фрагменты могут находиться на диске и подгружаться в реальную ОП по мере необходи-
мости. Такая организация памяти позволяетс снять ограничение, накладываемое объемом фи-
зической памяти, установленной на ЭВМ. Для реализации ВП используют, например, динами-
ческю переадресацию. Сегментом в терминах ВП называется область памяти из 2L страниц.
Вначале по номеру в таблице сегментов отыскивается сегмент. Таблица сегментов содержит
начальный адрес таблицы страниц. Вторая часть адреса используется для обращения в эту
таблицу, и по ней находится физический адрес данной страницы. Результаты поизка по таб-
лицам запоминаются в быстродействующем ассоциативном ЗУ, называемом TLB. Наиболее часто
употребляемые адреса откладываются в TLB и поэтому 98-99% обращений к памяти идут без
просмотра таблиц.
Страничная организация памяти – организация, при которой адресное пространство па-
мяти разбивается на малые участки – страницы. Используется для управления памятью в
системах, работающих в защищенном режме. Как правило, такая организация памяти подразу-
мевает пейджинг – механизм виртуальной памяти, при котором страницы вытесняются на диск
и подкачиваются с диска.
Свопинг – алгоритм реализации виртуальной памяти. Его можно разбить на три части:
управление пространством на устройстве выгрузки, выгрузка процессов из основной памяти
и подкачка процессов в основную память. В качестве устройства выгрузки используют раз-
дел на устройстве типа жесткого (swap-partition) или дисковый файл (swap-file) на таком
устройстве.
45. Системная архитектура 80386: сегментирование, страничная организация, средства ав-
торизации и защиты.
Возможности 80386 полностью раскрываются, когда он работает в защищенном режиме. В
этом режиме адресное пространство расширяется до 4Т, а виртуальное – до 64Т. 80386 ис-
пользует сегментацию – один из методов управления памятью. Сегменты – самостоятельные
области памяти, имеющие собственные атрибуты. В сегменте м.б. код программы или данные.
Вся информация о сегменте запоминается в спец. структуре, наз. дескриптором. Дескрипто-
ры используются аппаратно и не доступны из программ. Межсегментные вызовы в 80386 про-
исходят с учетом защиты. Помимо сегментации, 80386 поддерживает другой вид организации
памяти – страничную организацию. Страницы – это малые блоки памяти одинакового размера,
не имеющие логической связи со структурой программ. Они используются в основном на
уровне ОС. Страницы могут подкачиваться с диска и вытесняться на диск (пейджинг).
В 80386 есть режим виртуального 8086 – режим, эмулирующий 8086 в защищенном режи-
ме, при котором у каждого пользователя многозадачной системы создается иллюзия моно-
польного владения ресурсами машины.
80386 поддерживает 4-уровненвую систему защиты, управление защитой осуществляется
с помощью уровней привелигированности. Уровень привелигированности управляется привели-
гированными командами, командами ввода-вывода и доступом к сегментным дескрипторам.
1