2.4 用 cc 來編譯程式

本章範例只有針對 GNU C compiler 和 GNU C++ compiler 作說明, 這兩個在 FreeBSD base system 中就有了, 直接打 ccgcc 就可以執行。 至於,如何用直譯器產生程式的說明,通常可在直譯器的文件或線上文件找到說明,因此不再贅述。

當你寫完你的傑作後,接下來便是讓這個程式可以在 FreeBSD 上執行, 通常這些要一些步驟才能完成,有些步驟則需要不同程式來完成。

  1. 預先處理(Pre-process)你的程式碼,移除程式內的註解,和其他技巧, 像是 expanding(擴大) C 的 marco。

  2. 確認你的程式語法是否確實遵照 C/C++ 的規定,如果沒有符合的話,編譯器會出現警告。

  3. 將原始碼轉成組合語言 —— 它跟機器語言(machine code)非常相近,但仍在人類可理解的範圍內(據說應該是這樣)。 [1]

  4. 把組合語言轉成機器語言 —— 是的,這裡說的機器語言就是常提到的 bit 和 byte,也就是 1 和 0。

  5. 確認程式中用到的函式呼叫、全域變數是否正確,舉例來說:如若呼叫了不存在的函式,編譯器會顯示警告。

  6. 如果程式是由程式碼檔案來編譯,編譯器會整合起來。

  7. 編譯器會負責產生東西,讓系統上的 run-time loader 可以把程式載入記憶體內執行。

  8. 最後會把編譯完的執行檔存在硬碟上。

通常 編譯(compiling) 是指第 1 到第 4 個步驟。 —— 其他步驟則稱為 連結(linking), 有時候步驟 1 也可以是指 預先處理(pre-processing), 而步驟 3 到步驟 4 則是 組譯(assembling)

幸運的是,你可以不用理會以上細節,編譯器都會自動完成。 因為 cc 只是是個前端程式(front end),它會依照正確的參數來呼叫相關程式幫你處理。 只需打:

% cc foobar.c

上述指令會把 foobar.c 開始編譯,並完成上述動作。 如果你有許多檔案需要編譯,那請打類似下列指令即可:

% cc foo.c bar.c

記住語法錯誤檢查就是 —— 純粹檢查語法錯誤與否, 而不會幫你檢測任何邏輯錯誤,比如:無限迴圈,或是排序方式想用 binary sort 卻弄成 bubble sort。 [2]

cc 有非常多的選項,都可透過線上手冊來查。 下面只提一些必要且重要的選項,以作為例子。

-o 檔名

-o 編譯後的執行檔檔名,如果沒有使用這選項的話, 編譯好的程式預設檔名將會是 a.out [3]

% cc foobar.c               執行檔就是 a.out
% cc -o foobar foobar.c     執行檔就是 foobar
       
-c

使用 -c 時,只會編譯原始碼,而不作連結(linking)。 當只想確認語法是否正確或使用 Makefile 來編譯程式時,這個選項非常有用。

        % cc -c foobar.c
       

這會產生叫做 foobarobject file(非執行檔)。 這檔可以與其他的 object file 連結在一起,而成執行檔。

-g

-g 將會把一些給 gdb 用的除錯訊息包進去執行檔裡面,所謂的除錯訊息例如: 程式在第幾行出錯、那個程式第幾行做什麼函式呼叫等等。除錯資訊非常好用。 但缺點就是:對於程式來說,額外的除錯訊息會讓編譯出來的程式比較肥些。 -g 的適用時機在於:當程式還在開發時使用就好, 而當你要釋出你的 “發行版本(release version)” 或者確認程式可運作正常的話,就不必用 -g 這選項了。

% cc -g foobar.c
       

這動作會產生有含除錯訊息的執行檔。 [4]

-O

-O 會產生最佳化的執行檔, 編譯器會使用一些技巧,來讓程式可以跑的比未經最佳化的程式還快, 可以在大寫 O 後面加上數字來指明想要的最佳化層級。 但是最佳化還是會有一些錯誤,舉例來說在 FreeBSD 2.10 release 中用 cc 且指定 -O2 時,在某些情形下會產生錯誤的執行檔。

只有當要釋出發行版本、或者加速程式時,才需要使用最佳化選項。

% cc -O -o foobar foobar.c
       

這會產生 foobar 執行檔的最佳化版本。

以下三個參數將會強迫 cc 確認程式碼是否符合一些國際標準的規範, 也就是通常說的 ANSI 標準, 而 ANSI 嚴格來講屬 ISO 標準。

-Wall

-Wall 顯示 cc 維護者所認為值得注意的所有警告訊息。 不過這名字可能會造成誤解,事實上它並未完全顯示 cc 所能注意到的各項警告訊息。

-ansi

-ansi 關閉 cc 特有的某些特殊非 ANSI C 標準功能。 不過這名字可能會造成誤解,事實上它並不保證你的程式會完全符合 ANSI 標準。

-pedantic

全面關閉 cc 所特有的非 ANSI C 標準功能。

除了這些參數,cc 還允許你使用一些額外的參數取代標準參數,有些額外參數非常有用, 但是實際上並不是所有的編譯器都有提供這些參數。 照標準來寫程式的最主要目的就是,希望你寫出來的程式可以在所有編譯器上編譯、執行無誤, 當程式可以達成上述目的時,就稱為 portable code(移植性良好的程式碼)

一般來說,在撰寫程式時就應要注意『移植性』。 否則。當想把程式拿到另外一台機器上跑的時候,就可能得需要重寫程式。

% cc -Wall -ansi -pedantic -o foobar foobar.c

上述指令會確認 foobar.c 內的語法是否符合標準, 並且產生名為 foobar 的執行檔。

-llibrary

告訴 gcc 在連結(linking)程式時你需要用到的函式庫名稱。

最常見的情況就是,當你在程式中使用了 C 數學函式庫, 跟其他作業平台不一樣的是,這函示學函式都不在標準函式庫(library)中, 因此編譯器並不知道這函式庫名稱,你必須告訴編譯器要加上它才行。

規則很簡單,如果有個函式庫叫做 libsomething.a, 就必須在編譯時加上參數 -lsomething 才行。 舉例來說,數學函式庫叫做 libm.a, 所以你必須給 cc 的參數就是 -lm。 一般情況下,通常會把這參數必須放在指令的最後。

% cc -o foobar foobar.c -lm
       

上面這指令會讓 gcc 跟數學函式庫作連結,以便你的程式可以呼叫函式庫內含的數學函式。

如果你正在編譯的程式是 C++ 程式碼,你還必須額外指定 -lg++ 或者是 -lstdc++。 如果你的 FreeBSD 是 2.2(含)以後版本, 你可以用指令 c++ 來取代 cc。 在 FreeBSD 上 c++ 也可以用 g++ 取代。

% cc -o foobar foobar.cc -lg++     適用 FreeBSD 2.1.6 或更早期的版本
% cc -o foobar foobar.cc -lstdc++  適用 FreeBSD 2.2 及之後的版本
% c++ -o foobar foobar.cc
       

上述指令都會從原始檔 foobar.cc 編譯產生名為 fooboar 的執行檔。 這邊要提醒的是在 UNIX® 系統中 C++ 程式傳統都以 .C.cxx 或者是 .cc 作為副檔名, 而非 MS-DOS® 那種以 .cpp 作為副檔名的命名方式(不過也越來越普遍了)。 gcc 會依副檔名來決定用哪一種編譯器編譯, 然而,現在已經不再限制副檔名了, 所以可以自由的使用 .cpp 作為 C++ 程式碼的副檔名!

2.4.1 常見的 cc 問題

2.4.1.1. 我用 sin() 函示撰寫我的程式, 但是有個錯誤訊息(如下),這代表著?
2.4.1.2. 好吧,我試著寫些簡單的程式,來練習使用 -lm 選項(該程式會運算 2.1 的 6 次方)
2.4.1.3. 那如何才可以修正剛所說的問題?
2.4.1.4. 已經編譯好 foobar.c, 但是編譯後找不到 foobar 執行檔。 該去哪邊找呢?
2.4.1.5. 好,有個編譯好的程式叫做 foobar, 用 ls 指令時可以看到, 但執行時,訊息卻說卻沒有這檔案。為什麼?
2.4.1.6. 試著執行 test 執行檔, 但是卻沒有任何事發生,到底是哪裡出錯了?
2.4.1.7. 當執行我寫的程式時剛開始正常, 接下來卻出現 “core dumped” 錯誤訊息。這錯誤訊息到底代表什麼?
2.4.1.8. 真是太神奇了!程式居然發生 “core dumped” 了,該怎麼辦?
2.4.1.9. 當程式已經把 core memory 資料 dump 出來後, 同時也出現另一個錯誤 “segmentation fault” 這意思是?
2.4.1.10. Sometimes when I get a core dump it says “bus error”. It says in my UNIX book that this means a hardware problem, but the computer still seems to be working. Is this true?
2.4.1.11. This dumping core business sounds as though it could be quite useful, if I can make it happen when I want to. Can I do this, or do I have to wait until there is an error?

2.4.1.1. 我用 sin() 函示撰寫我的程式, 但是有個錯誤訊息(如下),這代表著?

/var/tmp/cc0143941.o: Undefined symbol `_sin' referenced from text segment
         

當使用 sin() 這類的數學函示時, 你必須告訴 cc 要和數學函式庫作連結(linking),就像這樣:

% cc -o foobar foobar.c -lm
         

2.4.1.2. 好吧,我試著寫些簡單的程式,來練習使用 -lm 選項(該程式會運算 2.1 的 6 次方)

#include <stdio.h>

int main() {
    float f;

    f = pow(2.1, 6);
    printf("2.1 ^ 6 = %f\n", f);
    return 0;
}
         

然後進行編譯:

% cc temp.c -lm
         

編譯後執行程式,得到下面這結果:

% ./a.out
2.1 ^ 6 = 1023.000000
         

很明顯的,程式結果不是正確答案,到底是哪邊出錯?

當編譯器發現你呼叫一個函示時,它會確認該函示的回傳值類型(prototype), 如果沒有特別指明,則預設的回傳值類型為 int(整數)。 很明顯的,你的程式所需要的並不是回傳值類別為 int

2.4.1.3. 那如何才可以修正剛所說的問題?

數學函示的回傳值類型(prototype)會定義在 math.h, 如果你有 include 這檔,編譯器就會知道該函示的回傳值類型,如此一來該運算就會得到正確的結果!

#include <math.h>
#include <stdio.h>

int main() {
...
         

加了上述內容之後,再重新編譯,最後執行:

% ./a.out
2.1 ^ 6 = 85.766121
         

如果有用到數學函式,請確定要有 include math.h 這檔, 而且記得要和數學函式庫作連結。

2.4.1.4. 已經編譯好 foobar.c, 但是編譯後找不到 foobar 執行檔。 該去哪邊找呢?

記得,除非有指定編譯結果的執行檔檔名,否則預設的執行檔檔名是 a.out。 用 -o filename 參數, 就可以達到所想要的結果,比如:

% cc -o foobar foobar.c
         

2.4.1.5. 好,有個編譯好的程式叫做 foobar, 用 ls 指令時可以看到, 但執行時,訊息卻說卻沒有這檔案。為什麼?

MS-DOS 不同的是,除非有指定執行檔的路徑, 否則 UNIX 系統並不會在目前的目錄下尋找你想執行的檔案。 在指令列下打 ./foobar 代表 “執行在這個目錄底下名為 foobar 的程式”, 或者也可以更改 PATH 環境變數設定如下,以達成類似效果:

bin:/usr/bin:/usr/local/bin:.
         

上一行最後的 "." 代表“如果在前面寫的其他目錄找不到,就找目前的目錄”。

2.4.1.6. 試著執行 test 執行檔, 但是卻沒有任何事發生,到底是哪裡出錯了?

大多數的 UNIX 系統都會在路徑 /usr/bin 擺放執行檔。 除非有指定使用在目前目錄內的 test,否則 shell 會優先選擇位在 /usr/bintest, 要指定檔名的話,作法類似:

% ./test
         

為了避免上述困擾,請為你的程式取更好的名稱吧!

2.4.1.7. 當執行我寫的程式時剛開始正常, 接下來卻出現 “core dumped” 錯誤訊息。這錯誤訊息到底代表什麼?

關於 core dumped 這個名稱的由來, 可以追溯到早期的 UNIX 系統開始使用 core memory 對資料排序時。 基本上當程式在很多情況下發生錯誤後, 作業系統會把 core memory 中的資訊寫入 core 這檔案中, 以便讓 programmer 知道程式到底是為何出錯。

2.4.1.8. 真是太神奇了!程式居然發生 “core dumped” 了,該怎麼辦?

請用 gdb 來分析 core 結果(詳情請參考 Section 2.6)。

2.4.1.9. 當程式已經把 core memory 資料 dump 出來後, 同時也出現另一個錯誤 “segmentation fault” 這意思是?

基本上,這個錯誤表示你的程式在記憶體中試著做一個嚴重的非法運作(illegal operation), UNIX 就是被設計來保護整個作業系統免於被惡質的程式破壞,所以才會告訴你這個訊息。

最常造成“segmentation fault”的原因通常為:

  • 試著對一個 NULL 的指標(pointer)作寫入的動作,如

    char *foo = NULL;
    strcpy(foo, "bang!");
           
    
  • 使用一個尚未初始化(initialized)的指標,如:

    char *foo;
    strcpy(foo, "bang!");
           
    

    尚未初始化的指標的初始值將會是隨機的,如果你夠幸運的話, 這個指標的初始值會指向 kernel 已經用到的記憶體位置, kernel 會結束掉這個程式以確保系統運作正常。如果你不夠幸運, 初始指到的記憶體位置是你程式必須要用到的資料結構(data structures)的位置, 當這個情形發生時程式將會當的不知其所以然。

  • 試著寫入超過陣列(array)元素個數,如:

    int bar[20];
    bar[27] = 6;
           
    
  • 試著讀寫在唯讀記憶體(read-only memory)中的資料,如:

    char *foo = "My string";
    strcpy(foo, "bang!");
           
    

    UNIX compilers often put string literals like "My string" into read-only areas of memory.

  • Doing naughty things with malloc() and free(), eg

    char bar[80];
    free(bar);
           
    

    or

    char *foo = malloc(27);
    free(foo);
    free(foo);
           
    

Making one of these mistakes will not always lead to an error, but they are always bad practice. Some systems and compilers are more tolerant than others, which is why programs that ran well on one system can crash when you try them on an another.

2.4.1.10. Sometimes when I get a core dump it says “bus error”. It says in my UNIX book that this means a hardware problem, but the computer still seems to be working. Is this true?

No, fortunately not (unless of course you really do have a hardware problem...). This is usually another way of saying that you accessed memory in a way you should not have.

2.4.1.11. This dumping core business sounds as though it could be quite useful, if I can make it happen when I want to. Can I do this, or do I have to wait until there is an error?

Yes, just go to another console or xterm, do

% ps
       

to find out the process ID of your program, and do

% kill -ABRT pid
       

where pid is the process ID you looked up.

This is useful if your program has got stuck in an infinite loop, for instance. If your program happens to trap SIGABRT, there are several other signals which have a similar effect.

Alternatively, you can create a core dump from inside your program, by calling the abort() function. See the manual page of abort(3) to learn more.

If you want to create a core dump from outside your program, but do not want the process to terminate, you can use the gcore program. See the manual page of gcore(1) for more information.

Notes

[1]

嚴格說起來,在這個階段 cc 並不是真的把原始程式轉成組合語言, 而是轉為 machine-independent 的 p-code

[2]

剛所說的 binary sort 和 bubble sort 問題, 在已排序好的序列中,binary sort 搜索效率會比 bubble sort 好。

[3]

至於 -o 的原因,則是一團歷史迷霧了。

[4]

請注意,因為上例沒用 -o 以指定執行檔名稱, 所以執行檔會是 a.out 這檔。 那麼,要如何產生 foobar 的執行檔並內含除錯訊息, 這就留待看倌們練習一下囉。

本文及其他文件,可由此下載:ftp://ftp.FreeBSD.org/pub/FreeBSD/doc/

若有 FreeBSD 方面疑問,請先閱讀 FreeBSD 相關文件,如不能解決的話,再洽詢 <questions@FreeBSD.org>。
關於本文件的問題,請洽詢 <doc@FreeBSD.org>。