發新話題

[分享] 中文輸入法簡介

中文輸入法簡介

以鍵盤輸入中文的方法雖然有很多種,但大概可以分為訪客無法瀏覽此圖片或連結,請先 註冊登入會員 訪客無法瀏覽此圖片或連結,請先 註冊登入會員 訪客無法瀏覽此圖片或連結,請先 註冊登入會員 三類:
(一)拆字
原理:
把中文字分拆成若干部件,並以字母或數字鍵代表,按不同輸入法的設計,將部件輸入。
例子:

拆字輸入法的例子有「倉頡、九方、縱橫碼、大易、行列」等,現以「訪客無法瀏覽此圖片或連結,請先 註冊登入會員 」、「訪客無法瀏覽此圖片或連結,請先 註冊登入會員 」及「訪客無法瀏覽此圖片或連結,請先 註冊登入會員 」為例,加以說明。
* 倉頡
朱邦復先生根據中文字的結構和組字原理,配合電腦邏輯處理的需要,經過分析、歸納後,總共整理出二十四個基本字形,稱為倉頡字母。不過這二十四個字母並不能組成數以萬計的中文字,所以便再配合多個輔助字形,再由此組成所有的中文字。

倉頡字母可分為下列四大類別:哲理類 、筆畫類 、人體類 、字形類 。
除了二十四個倉頡字母外,還有一個“難”字鍵,來取代繁瑣的字形,合共有二十五個鍵。 下面是這些鍵在鍵盤上的位置:




中文字的數量很多,以二十四個基本的倉頡字母並不能組成數以萬計的中文字,所以便需要再配合八十二個輔助字形及八個慣用偏旁,組成所有的中文字。

在倉頡輸入法裏,選取適當的倉頡字母或輔助字形,以代表該字字碼的過程,稱為取碼。詳細的取碼概念、方法和原則,可以參考市面上的書籍或本網站提供的網址,下列網站還有一個有趣的學習軟件供免費下載 : 訪客無法瀏覽此圖片或連結,請先 註冊登入會員

* 九方
  • 將中文字的字首(文字起首的組成部分)分為九種特徵,並以九個數字代表,依據字的字首特徵及相應部件,以數字鍵或滑鼠輸入。
  • 又將中文字分為「獨體字」和「分體字」兩大類,各有不同的輸入規則:
    • 獨體字的輸入法,例如「音」字:先選字首特徵(步驟1),再選部件(步驟2),再按「確定」(步驟3),然後選字(步驟4)。


  • 分體字的輸入方法,是先判斷文字的左上方屬於哪一種字首特徵,按下該特徵後(步驟1),再判別該部分與哪個部件最近似(步驟2),按下該部件,再判別該字右上方的字首與哪個特徵最近似(步驟3),按下該特徵後便可選字(步驟4)了。

    例如「韻」字:

  • 最新版本的九方輸入法還加設了「筆劃」及「拼音」等輸入方式,詳見下列網頁:訪客無法瀏覽此圖片或連結,請先 註冊登入會員


* 縱橫碼

  • 把構成中文字的十種筆劃(如:橫、豎、點、捺),以 0 至 9 十個數字(根據代碼口訣去決定代表數字:一橫二豎三點捺,叉四插五方塊六,七角八八九是小,撇與左鉤都是零。)代表輸入。它以漢字四角的筆形編碼,依次序為左上、右上、左下、右下,取碼時先取字的主部首(常用部首,共55個)或副部首(漢字中不含主部首而且是左右或左下角包圍結構的,例如「毯」,左面部份或左及下角包圍部份稱為副部首),再取字身(漢字取去主部首或副部首,餘下的字形稱為字身)最多取六碼,例如「渤」字:

    • 「渤」字的主部首是「」,縱橫碼是31,字身是「勃」,縱橫碼是4400,所以全個「渤」字的縱橫碼是314400;
    • 輸入時先在小鍵盤上打314400,再按「 / 」鍵 ( 代表單字 ) ,選「0 : 渤」,按 「0」鍵即可輸入「渤」字。
有些漢字分不出主部首或副部首,即只有字身部分,就可按照左上、右上、左下、右下的原則去找出編碼,例如「我」字:

  • 「我」字只有字身,縱橫碼是0307 ;
  • 輸入時在小鍵盤上打0307,再按「/」鍵選「0 : 我」,按「0」鍵即可輸入「我」字。
  • 漢字的其中一個特點是以單字組成詞組。縱橫碼針對此特點而設計了以詞組輸入漢字的方法( 在小鍵盤上按入編碼後,再按代表詞組的 * 鍵,即出現該詞組,再按號數即可輸入該詞組 ),加快了輸入的速度,例如 :

    詞組取碼原則字例編碼
    二字'33', 即取每字的前三碼武昌131616
    三字'222', 即取每字的前二碼武則天136814
    四字'2112', 即取第一、四字的前二碼,第二、三字的前一碼英明神武456313
    多字'21111',即取第一字的前二碼,第二、三、四、五字的前一碼,往後的字不取碼英雄無用武之地450871
  • 縱橫碼又將常用字編成一碼及二碼的「快易碼」,用者只需將該字或詞的第一或首二碼打出,即能找出該字或詞,例如 : 了(1),可以(1),成功 (53)
  • 參考資料:訪客無法瀏覽此圖片或連結,請先 註冊登入會員
(二) 筆順
原理:
用中文字的基本筆劃,並以數字鍵代表,按筆順輸入。
例子:
筆順輸入法的例子有「筆順碼、十二鍵、字源」等,現以「筆順碼」為例,加以說明。
* 筆順碼
  • 把中文字的筆劃歸納成「[url=]橫/剔、豎、撇、捺/點、順折、逆折、叉、八、交、口[/url]」十種基本筆形,以0至9代表。輸入時按「順向取前三碼,逆向取後三碼」的規則取碼,最多取六碼。

    例如「售」字:



    但一些較簡易 / 常用的中文字並不需要取六碼就可以輸入文字,所以速度可快些。

    例如「文」字:




    又例如「信」字,按此輸入法的原理,應輸入324011才可打出「信」字,但實際上只要打入3240便可輸入此字了。

(三) 拼音
原理:
利用字母鍵及數字輸入文字的聲母、韻母及聲調,把字「拼」出來。
例子:
拼音輸入法的例子有「注音、漢語拼音、粵語拼音」等,現以「漢語拼音」為例,加以說明。
* 漢語拼音
  • 依照國家使用的「漢語拼音方案」的原則,把某字的聲母、韻母及聲調利用鍵盤輸入。例如「道」字,在鍵盤輸入其聲母d,再輸入韻母ao,再按其聲調4,便會出現「道」字。
  • 使用此方法須對漢語拼音有一定的認識。
  • 由於中文字的同音字頗多,故經常輸入後仍需要選字,以致影響輸入的速度。
  • 參考資料:訪客無法瀏覽此圖片或連結,請先 註冊登入會員
其他輸入方法
*聲控
  • 利用麥克風輸入說話,透過音效卡及電腦的語音識別軟件,將語音資訊轉換成中文字。為了增加準確性及速度,電腦會將這些連續輸入的文字與電腦中的詞庫的對比,以找出相關字詞。
  • 因為各人的聲音、語調都不相同,為了提高識別的準確性,使用者須預先做「練習」,使語音辨識系統熟悉自己的聲音。
  • 隨著電腦科技的發展,語音辨識的準確性正不斷提高。
* 電碼
  • 利用電報密碼(每一漢字配以4個數字,例:顧(7357),只需輸入該字的電碼數字便可打出該字。
  • 由於香港身份證上已印有持有人姓名的中文電碼,對不懂中文輸入法而又需要輸入大量個人資料的人最為適用。
* 光學字元識別
  • 光學字元識別,即OCR(Optical Character Recognition)。
  • 原理是透過電腦來進行文字辨識的工作,例如利用掃描器將編印或手寫的文字掃描到電腦中,再透過這些字元辨識軟件辨識掃描進來的圖像並轉化成文字,以便進行其他編輯工作。
此外,還有結合拆字、筆順及拼音的原理而創出不同的輸入法,例如:智能五筆,詳見網頁:訪客無法瀏覽此圖片或連結,請先 註冊登入會員

TOP

發新話題

本站所有圖文均屬網友發表,僅代表作者的觀點與本站無關,如有侵權請通知版主會盡快刪除。