Програмите се пишат на езици за програмиране. Съществуват различни видове езици за програмиране, които решават различни типове задачи. Една програма представлява обикновен текст, написан на текстов редактор. Обикновено командите са на английски език и са интуитивни. Това се нарича изходен код на програмата. Т.е. изходният код се разчита лесно от човек. За съжаление, компютърът не разбира изходния код на програмата. Той трябва да бъде транслиран (преведен) до команди, които се разбират от компютъра. В резултат на превеждането (транслирането) се получава машинен код, който представлява поредици от нули и единици, които се изпълняват от компютъра. Машинният код практически е нечитаем от човек и може да се изпълнява само на платформата, за която е преведен (компилиран[1]).
Нека да разгледаме един пример, с който да илюстрираме разликата между изходния код и машинния код. Примерите са реализирани с помощта на езика Паскал[2]. Компилаторът, който е използван, е със свободен изходен код и може да бъде изтеглен безплатно от следния адрес http://www.freepascal.org/. Всъщност, цялата статия е реализирана изцяло с използването на свободен софтуер.
Program Calculator; var operand1 : real; operand2 : real; result : real; operation : char; error : string; BEGIN write('Въведете число: '); readln(operand1); write('Въведете операция: '); readln(operation); write('Въведете число: '); readln(operand2); error := ''; case operation of '+': result := operand1 + operand2; '-': result := operand1 - operand2; '*': result := operand1*operand2; '/': result := operand1/operand2; otherwise error := 'невалидна операция'; end; if error = '' then writeln('Резултатът е: ', result:6:5) else writeln('Грешка: ', error); END.
Въпросният пример представлява калкулатор. Програмата изисква въвеждането на две числа и операция. След това операцията се извършва върху числата и резултатът се извежда на екрана. За момента се поддържат операциите събиране, изваждане, умножение и деление, което е напълно достатъчно за демонстрационни нужди.
Както виждате, изходният код на програмата е разбираем (разбира се, читателят трябва да има известни познания по английски език). За да преведем изходния код на машинен код, използваме командата fpc calculator.pp, която се явява компилатор на езика Паскал. Ето и самата сесия:
[radnev@localhost linux]$ fpc calculator.pp Free Pascal Compiler version 1.0.10 [2003/06/26] for i386 Copyright (c) 1993-2003 by Florian Klaempfl Target OS: Linux for i386 Compiling calculator.pp Assembling calculator Linking calculator 35 Lines compiled, 0.1 sec [radnev@localhost linux]$
В резултат се получава изпълнимият файл calculator. Терминологията варира леко и може да срещнете други наименования, като двоичен файл[3], машинен файл или най-използваното наименование програма. Ето част от съдържанието на изпълнимия файл или т.н. машинен код:
01111111 01000101 01001100 01000110 00000001 00000001 00000001 00000000 00000000 00000000 00000000 00000000 00000000 00000000 00000000 00000000 00000010 00000000 00000011 00000000 00000001 00000000 00000000 00000000 10000000 10000000 00000100 00001000 00110100 00000000 00000000 00000000 11111100 10110100 00000000 00000000 00000000 00000000 00000000 00000000 00110100 00000000 00100000 00000000 00000010 00000000 00101000 00000000 00000101 00000000 00000100 00000000 00000001 00000000 00000000 00000000 00000000 00000000 00000000 00000000 00000000 10000000 00000100 00001000
Нека да изпълним програмата, за да видим дали работи. Ето няколко изпълнения на програмата:
Въведете число: 23 Въведете операция: * Въведете число: 45 Резултатът е: 1035.00000 Въведете число: 12345 Въведете операция: / Въведете число: 23 Резултатът е: 536.73913 Въведете число: 2 Въведете операция: ^ Въведете число: 32 Грешка: невалидна операция Въведете число: 345 Въведете операция: / Въведете число: 0 Runtime error 200 at 0x08052F63 0x08052F63 0x080480B0
Програмата работи за тестваните случаи на умножение и деление, и показва резултата с точност до петия знак след десетичната запетая. Липсва операцията по степенуване и при деление на нула програмата се чупи, вместо да покаже съобщение за грешка.
Очевидно, ако разполагаме само с машинния код на програмата, няма как да я оправим. Но ако разполагаме с изходния код на програмата, може сравнително лесно да добавим операцията по степенуване и да направим съответната проверка за грешка. Ето модифицираната част на новата програма:
case operation of '+': result := operand1 + operand2; '-': result := operand1 - operand2; '*': result := operand1*operand2; '/': if operand2 = 0 -- Проверка за then error := 'деление на нула' -- деление на else result := operand1/operand2; -- нула '^': begin result := 1; -- Новата for i := 1 to trunc(operand2) -- операция за do result := result*operand1; -- степенуване end otherwise error := 'невалидна операция'; end;
След като компилираме програмата, изпълняваме я отново, за да видим дали работи. Ето няколко нови примера от изпълнението на програмата:
Въведете число: 34 Въведете операция: / Въведете число: 0 Грешка: деление на нула Въведете число: 2 Въведете операция: ^ Въведете число: 5 Резултатът е: 32.00000
Както се вижда от изложените примери, ако имаме изходния код на една програма и разбираме от програмиране, може сравнително лесно да оправим грешки и/или да добавим нова функционалност. При липсата на изходния код на програмата, очевидно, това е невъзможно.
[1] Транслаторите се делят на два вида: интерпретатори и компилатори. Интерпретаторите четат изходния код и изпълняват (превеждат) командите на машинен код една по една по време на изпълнението на програмата. Компилаторите генерират (превеждат) цялата програма на машинен код предварително. След това програмата може да се изпълнява самостоятелно без наличието на компилатор. Това деление не е много точно, понеже напоследък навлязоха нови концепции, като псевдо-компилатор и виртуална машина. Но целта на статията не е да разглежда различните видове транслатори и да прави сравнение между тях.
[2] Езикът за програмиране Паскал бе избран пред другите езици, поради факта, че се изучава(ше) в почти всички училища и университети, лесен е за разчитане и е идеален за обучение, въпреки че няма толкова голямо практическо приложение като Джава или С/С++.
[3] Текстов файл и двоичен файл е двойка термини, подобна на изходен код и машинен код. Смисълът е пак същия. Текстовият файл може да се чете от човек директно, докато двоичният файл не може.