糯米文學吧

位置:首頁 > 計算機 > 計算機硬件

計算機中的編碼知識

計算機是使用這些編碼在計算機內部和鍵盤等終端之間以及計算機之間進行信息交換。為了使信息的表示、交換、存儲或加工處理方便,在計算機系統中通常採用統一的編碼方式,因此制定了編碼的國家標準或國際標準。

計算機中的編碼知識

  1.二-十進制編碼

在計算機中,為了適應人們的習慣,採用十進制數方式對數值進行輸入和輸出。這樣,在計算機中就要將十進制數變換為二進制數。將十進制數變換為二進制數的方法很多,但是不管採用哪種方法的編碼統稱為二-十進制編碼,即BCD碼(Binary Coded Decimal)。在二-十進制編碼中最常用的一種是8421碼。它採用4位二進制編碼表示1位十進制數,其中4位二進制數中由高位到低位的每一位權值分別是:23、22、21、20,即8、4、2、1。BCD碼在形式上是0和1組成的二進制形式,而實際上它表示的是十進制數,只不過是每位十進制數用4位二進制編碼表示,運算規則和數制都是十進制。

  2.字符編碼

英文字母和常用的數學符號與標點符號等字符通常採用ASCII(American Standard Code for Information Interchange,美國信息交換標準碼)編碼。

ASCII碼有7位碼和8位碼兩種形式。7位ASCII碼用7位二進制數進行編碼,可以表示128個字符。8位ASCII碼用8位二進制數進行編碼,可以表示256個字符。

標準ASCII 碼為7位碼,也叫基礎ASCII碼,表示所有的大寫和小寫字母、數字0~9、標點符號,以及在美式英語中使用的特殊控制字符共128個符號。8位ASCII碼的前127個符號編碼與7位碼相同,後128個稱為擴展ASCII碼。

計算機存儲單元中,7位ASCII碼常用一個字節來表示(8位二進制位),其最高位(b7)用作奇偶校驗位。所謂奇偶校驗是指在代碼傳送過程中用來檢驗是否出現錯誤的一種方法,一般分奇校驗和偶校驗兩種。奇校驗規定:正確的代碼一個字節中1的個數必須是奇數,若非奇數,則在最高位b7添1;偶校驗規定:正確的代碼一個字節中1的個數必須是偶數,若非偶數,則在最高位b7添1。

  3.漢字編碼

漢字種類繁多,編碼比拼音文字困難,因此在不同的.場合要使用不同的編碼,通常有4種類型的編碼,即輸入碼、國標碼、內碼、字形碼。

  (1)輸入碼

輸入碼所解決的問題是如何使用西文標準鍵盤把漢字輸入到計算機內。有各種不同的輸入碼,主要分為三類:數字編碼、拼音編碼和字形編形碼。

  (2)國標碼

國標碼又稱為漢字交換碼,在計算機之間交換信息用,用兩個字節來表示,每個字節的最高位均為0,因此可以表示的漢字數為214=16384個。將漢字區位碼的高位字節、低位字節各加十進制數32(即十六進制數的20)便得到國標碼。

  (3)內碼

漢字內碼是在設備和信息處理系統內部存儲、處理、傳輸漢字用的代碼。無論使用何種輸入碼,進入計算機後就立即被轉換為機內碼。規則是將國標碼的高位字節、低位字節各自加上128。

為了統一表示世界各國的文字,1993年國際標準化組織公佈了“通用多八位編碼字符集”的國際標準ISO/IEC 10646,簡稱UCS(Universal Code Set),它為包括漢字在內的各種正在使用的文字規定了統一的編碼方法。

  (4)字形碼

字形碼是表示漢字字形的字模數據,因此也稱為字模碼,是漢字的輸出形式,通常用點陣、矢量函數等表示。

  4.多媒體信息編碼

所謂多媒體信息是指由文字、聲音、圖像為載體的信息。圖像和聲音信息在計算機中也是以二進制形式編碼的。

  (1)圖像編碼

一幅彩色圖像(image)可以看成是由許許多多個彩色的點(像素)組成的,如圖1所示。每個像素點有深淺不同的顏色,這種點越小,圖像越清晰。

  (2)聲音編碼

聲音是由聲波傳遞的,聲波編碼數據在文件中的存儲形式、排列順序等稱為文件格式,因各種應用需求不同,存在着多種多樣的聲音文件格式,有些文件格式可以存儲多種不同的音頻編碼數據,也有些文件格式是為某一種音頻編碼特製的。

標籤:編碼 計算機