Ein häufiger Typ von UNIX®-Anwendungen ist ein Filter -- ein Programm, das Eingaben von stdin liest, sie verarbeitet und das Ergebnis nach stdout schreibt.
In diesem Kapitel möchten wir einen einfachen Filter entwickeln und lernen, wie wir von stdin lesen und nach stdout schreiben. Dieser Filter soll jedes Byte seiner Eingabe in eine hexadezimale Zahl gefolgt von einem Leerzeichen umwandeln.
%include 'system.inc' section .data hex db '0123456789ABCDEF' buffer db 0, 0, ' ' section .text global _start _start: ; read a byte from stdin push dword 1 push dword buffer push dword stdin sys.read add esp, byte 12 or eax, eax je .done ; convert it to hex movzx eax, byte [buffer] mov edx, eax shr dl, 4 mov dl, [hex+edx] mov [buffer], dl and al, 0Fh mov al, [hex+eax] mov [buffer+1], al ; print it push dword 3 push dword buffer push dword stdout sys.write add esp, byte 12 jmp short _start .done: push dword 0 sys.exit
Im Datenabschnitt erzeugen wir ein Array mit Namen hex
.
Es enthält die 16 hexadezimalen Ziffern in aufsteigender Reihenfolge. Diesem Array
folgt ein Puffer, den wir sowohl für die Ein- als auch für die Ausgabe
verwenden. Die ersten beiden Bytes dieses Puffers werden am Anfang auf 0
gesetzt. Dorthin schreiben wir die beiden hexadezimalen Ziffern
(das erste Byte ist auch die Stelle an die wir die Eingabe lesen). Das dritte Byte ist
ein Leerzeichen.
Der Code-Abschnitt besteht aus vier Teilen: Das Byte lesen, es in eine hexadezimale Zahl umwandeln, das Ergebnis schreiben und letztendlich das Programm verlassen.
Um das Byte zu lesen, bitten wir das System ein Byte von stdin zu lesen und speichern es im ersten Byte von buffer
. Das System gibt die Anzahl an Bytes, die gelesen wurden,
in EAX
zurück. Diese wird 1
sein, wenn eine Eingabe empfangen wird und 0
, wenn keine Eingabedaten mehr verfügbar sind. Deshalb
überprüfen wir den Wert von EAX
. Wenn dieser 0
ist, springen wir zu .done
,
ansonsten fahren wir fort.
Anmerkung: Zu Gunsten der Einfachheit ignorieren wir hier die Möglichkeit eines Fehlers.
Die Umwandlungsroutine in eine Hexadezimalzahl liest das Byte aus buffer
in EAX
, oder genaugenommen nur
in AL
, wobei die übrigen Bits von EAX
auf null gesetzt werden. Außerdem kopieren wir das Byte
nach EDX
, da wir die oberen vier Bits (Nibble) getrennt von
den unteren vier Bits umwandeln müssen. Das Ergebnis speichern wir in den ersten
beiden Bytes des Puffers.
Als Nächstes bitten wir das System die drei Bytes in den Puffer zu schreiben, also die zwei hexadezimalen Ziffern und das Leerzeichen nach stdout. Danach springen wir wieder an den Anfang des Programms und verarbeiten das nächste Byte.
Wenn die gesamte Eingabe verarbeitet ist, bitten wie das System unser Programm zu beenden und null zurückzuliefern, welches traditionell die Bedeutung hat, dass unser Programm erfolgreich war.
Fahren Sie fort und speichern Sie den Code in eine Datei namens hex.asm. Geben Sie danach folgendes ein (^D bedeutet, dass Sie die Steuerungstaste drücken und dann D eingeben, während Sie Steuerung gedrückt halten):
% nasm -f elf hex.asm % ld -s -o hex hex.o % ./hex Hello, World! 48 65 6C 6C 6F 2C 20 57 6F 72 6C 64 21 0A Here I come! 48 65 72 65 20 49 20 63 6F 6D 65 21 0A ^D %
Anmerkung: Wenn Sie von MS-DOS® zu UNIX wechseln, wundern Sie sich vielleicht, warum jede Zeile mit
0A
an Stelle von0D 0A
endet. Das liegt daran, dass UNIX nicht die CR/LF-Konvention, sondern die "new line"-Konvention verwendet, welches hexadezimal als0A
dargestellt wird.
Können wir das Programm verbessern? Nun, einerseits ist es etwas verwirrend, dass
die Eingabe, nachdem wir eine Zeile verarbeitet haben, nicht wieder am Anfang der Zeile
beginnt. Deshalb können wir unser Programm anpassen um einen Zeilenumbruch an Stelle
eines Leerzeichens nach jedem 0A
auszugeben:
%include 'system.inc' section .data hex db '0123456789ABCDEF' buffer db 0, 0, ' ' section .text global _start _start: mov cl, ' ' .loop: ; read a byte from stdin push dword 1 push dword buffer push dword stdin sys.read add esp, byte 12 or eax, eax je .done ; convert it to hex movzx eax, byte [buffer] mov [buffer+2], cl cmp al, 0Ah jne .hex mov [buffer+2], al .hex: mov edx, eax shr dl, 4 mov dl, [hex+edx] mov [buffer], dl and al, 0Fh mov al, [hex+eax] mov [buffer+1], al ; print it push dword 3 push dword buffer push dword stdout sys.write add esp, byte 12 jmp short .loop .done: push dword 0 sys.exit
Wir haben das Leerzeichen im Register CL
abgelegt. Das
können wir bedenkenlos tun, da UNIX-Systemaufrufe im
Gegensatz zu denen von Microsoft® Windows® keine Werte von Registern ändern in denen sie
keine Werte zurückliefern.
Das bedeutet, dass wir CL
nur einmal setzen müssen.
Dafür haben wir ein neues Label .loop
eingügt, zu
dem wir an Stelle von _start
springen, um das nächste
Byte einzulesen. Außerdem haben wir das Label .hex
eingefügt, somit können wir wahlweise ein Leerzeichen oder einen Zeilenumbruch
im dritten Byte von buffer
ablegen.
Nachdem Sie hex.asm entsprechend der Neuerungen geändert haben, geben Sie Folgendes ein:
% nasm -f elf hex.asm % ld -s -o hex hex.o % ./hex Hello, World! 48 65 6C 6C 6F 2C 20 57 6F 72 6C 64 21 0A Here I come! 48 65 72 65 20 49 20 63 6F 6D 65 21 0A ^D %
Das sieht doch schon besser aus. Aber der Code ist ziemlich ineffizient! Wir führen für jeden einzelne Byte zweimal einen Systemaufruf aus (einen zum Lesen und einen um es in die Ausgabe zu schreiben).
Zurück | Zum Anfang | Weiter |
Unser erstes Programm | Nach oben | Gepufferte Eingabe und Ausgabe |
Wenn Sie Fragen zu FreeBSD haben, schicken Sie eine E-Mail an
<de-bsd-questions@de.FreeBSD.org>.
Wenn Sie Fragen zu dieser Dokumentation haben, schicken Sie eine E-Mail an <de-bsd-translators@de.FreeBSD.org>.