對(duì)大多數(shù)西方人來(lái)說(shuō),在手機(jī)上安裝第三方鍵盤似乎完全沒有必要。但在中國(guó),這是常態(tài)。
由于漢語(yǔ)的書寫方式可以與發(fā)音完全分離(日語(yǔ)、韓語(yǔ)和越南語(yǔ)都有漢字的變體),如果系統(tǒng)默認(rèn)鍵盤沒有對(duì)漢語(yǔ)進(jìn)行特殊的優(yōu)化,它就會(huì)非常難用。因此,中國(guó)目前有大約 8 億人使用了第三方智能鍵盤,它們可以預(yù)測(cè)用戶想要輸入的內(nèi)容。
(資料圖)
但對(duì)第三方鍵盤的依賴也帶來(lái)了安全風(fēng)險(xiǎn):大多數(shù)鍵盤應(yīng)用都會(huì)將按鍵點(diǎn)擊傳輸?shù)皆贫耍詫?shí)現(xiàn)更好的詞組和內(nèi)容預(yù)測(cè),如果應(yīng)用程序沒有使用足夠強(qiáng)大的加密協(xié)議,就會(huì)為內(nèi)容攔截攻擊創(chuàng)造機(jī)會(huì)。
今天,我想帶大家踏上一段關(guān)于鍵盤應(yīng)用程序或輸入法編輯器(IMEs,input method editors)歷史的極客之旅。如今,輸入法是如此的普遍,以至于人們很容易忘記它們誕生的背后藏著多少努力。
它們是非常經(jīng)典的創(chuàng)新案例,彌合了數(shù)字世界和現(xiàn)實(shí)世界之間的鴻溝。
在 20 世紀(jì) 80 年代,市面上的個(gè)人電腦無(wú)法處理漢字。即便艱難地實(shí)現(xiàn)了漢字?jǐn)?shù)字化,使其可以顯示在電腦屏幕上,但仍然面臨一個(gè)大問(wèn)題:用戶如何鍵入這些字符?特別是,你如何將成千上萬(wàn)的漢字與 QWERTY 鍵盤上的 26 個(gè)字母相匹配?
第一次的嘗試與今天的鍵盤應(yīng)用程序完全不同,因?yàn)樗Φ姆较蛑饕性跐h字的書寫方式上。
1983 年 8 月,也就是 40 年前,一位名叫王永民的中國(guó)工程師開發(fā)了第一種流行的漢字輸入法,名為五筆。他將一個(gè)漢字分解成不同的筆畫,在 QWERTY 鍵盤上,每個(gè)字母都對(duì)應(yīng)了幾個(gè)筆畫。
例如,漢字“犬”,對(duì)應(yīng)了幾種形狀(筆畫):犬(字根)、 一、丿、和丶。這些形狀分別與鍵盤上的 D、G、T 和 Y 相匹配。因此,當(dāng)用戶鍵入“DGTY”時(shí),五筆輸入法就會(huì)將其與對(duì)應(yīng)的字符匹配,并打出“犬”字。
在 QWERTY 鍵盤上使用五筆輸入法,最多只需要四個(gè)鍵(碼),就能打出一個(gè)漢字。這被認(rèn)為是打漢字最快的方式之一。但缺點(diǎn)也很明顯:用戶需要背下來(lái)哪些鍵對(duì)應(yīng)哪些筆畫,因此學(xué)習(xí)曲線相當(dāng)陡峭。
漢字輸入法發(fā)展的下一步是發(fā)明了拼音打字。這聽起來(lái)可能難以置信,但拼音這種用標(biāo)準(zhǔn)拉丁字母拼寫每個(gè)中文單詞的現(xiàn)代方式,直到 20 世紀(jì) 50 年代才出現(xiàn)。在隨后的 80 和 90 年代,中國(guó)才開始嘗試在學(xué)校里先教孩子們拼音,然后再教他們?nèi)绾螌懽帧?/p>
結(jié)果是,在所有將漢字與拉丁字母相匹配的方法中,拼音成為了一種更容易、更被廣泛接受的方法。
我們?nèi)砸浴叭弊譃槔?。它的發(fā)音被標(biāo)準(zhǔn)化為 quǎn,所以在標(biāo)準(zhǔn)鍵盤上鍵入 Q、U、A、N 四個(gè)字母,屏幕上就會(huì)出現(xiàn)這個(gè)字。
(來(lái)源:AI 生成)
大量基于拼音的輸入法是在 20 世紀(jì) 90 年代發(fā)明的。最突出的是北京大學(xué)計(jì)算機(jī)科學(xué)教授朱守濤于 1993 年發(fā)明的智能 ABC。在微軟將智能 ABC 整合進(jìn) Windows PC,并將其設(shè)為默認(rèn)輸入法之一后,它成為了中國(guó)使用最廣的輸入法(王永民和朱守濤分別來(lái)自河南和山東的農(nóng)村,但他們卻引領(lǐng)了幾代人的輸入法習(xí)慣,其中,王永民于 1943 年出生于河南省南陽(yáng)市南召縣鴨河工區(qū)的貧農(nóng)家庭,朱守濤于 1946 年出生于山東省寧陽(yáng)縣伏山鎮(zhèn)東代村)。
但是,用拼音打字也有問(wèn)題:幾十個(gè)或幾百個(gè)漢字可能有相同的拼音拼寫。如果你輸入 QUAN,計(jì)算機(jī)無(wú)法判斷在 81 個(gè)漢字中,哪一個(gè)才是你想要的。
因此,每次用戶在智能 ABC 中鍵入一串拼音時(shí),仍然需要從一長(zhǎng)串候選字中選擇正確的那個(gè)。
幸運(yùn)的是,它們總是以相同的順序顯示,這意味著你可以記住你經(jīng)常使用的字符出現(xiàn)在候選小窗口中的位置。
我使用智能 ABC 的親身經(jīng)歷就是這樣。我名字中的最后一個(gè)字是毅,拼寫為 yi。yi 恰好是漢語(yǔ)拼音中可匹配數(shù)量最多的發(fā)音,有數(shù)百個(gè)字符有著相同的拼寫(謝謝啊,我的爸爸媽媽)。當(dāng)我打字的時(shí)候,刻在我的腦海里的一件事是:毅,是智能 ABC 的第四頁(yè)的第六個(gè)選項(xiàng)。
這樣打字的效率顯然不高。事實(shí)上,用智能 ABC 打字比用五筆要慢。但下一代鍵盤程序很快就超越了前一代。
2006 年,搜狗輸入法發(fā)布,它本質(zhì)上結(jié)合了拼音打字的基礎(chǔ)和搜索引擎的技術(shù)。正如搜索引擎可以推薦最接近用戶查詢的內(nèi)容一樣,鍵盤軟件可以預(yù)測(cè)用戶可能想要鍵入的內(nèi)容。
有了搜狗,候選字符和單詞不再按固定順序顯示,而是會(huì)根據(jù)用戶的鍵入歷史記錄和新聞內(nèi)容進(jìn)行調(diào)換。例如,在這篇文章中,我已經(jīng)打了幾次“毅”字,搜狗記住了這一點(diǎn),于是每當(dāng)我輸入 yi 時(shí),它都會(huì)把“毅”放在首位。
許多其他創(chuàng)新的輸入法與搜狗大約在同一時(shí)間發(fā)明。一些人試圖將基于形狀的方法與基于拼寫的方法相結(jié)合。自從觸控板和觸摸屏開始使用以來(lái),搭載了這種屏幕的設(shè)備允許用戶直接在設(shè)備上寫漢字。
但隨著時(shí)間的推移,這些方法慢慢變得小眾,最受歡迎的還是搜狗等智能鍵盤帶來(lái)的更高效的打字方法,這也成為了中國(guó)人如何與技術(shù)和彼此互動(dòng)的基礎(chǔ)。
關(guān)于漢語(yǔ)與科技之間的歷史關(guān)系,還有許多更有趣的故事。例如,中國(guó)港臺(tái)地區(qū)發(fā)展出了獨(dú)有的一套漢字打字方式。我推薦耶魯大學(xué)東亞語(yǔ)言和文學(xué)教授石靜遠(yuǎn)(Jing Tsu)的《漢字王國(guó)》一書,很適合相關(guān)知識(shí)不多的人閱讀。
備注:文章標(biāo)題相比原文有改動(dòng)。
作者簡(jiǎn)介:Zeyi Yang為《麻省理工科技評(píng)論》報(bào)道中國(guó)和東亞的技術(shù)。此前,他的作品曾出現(xiàn)在《Protocol》、《Rest of World》、《哥倫比亞新聞評(píng)論》、《南華早報(bào)》、《日經(jīng)亞洲》等媒體上。
支持:Ren
關(guān)鍵詞:
國(guó)新能源8月28日快速上漲 以下是國(guó)新能源在北京時(shí)間8月28日09:30分盤口異動(dòng)快照:  8
藥監(jiān)動(dòng)態(tài)|濰坊:開展規(guī)范青少年近視矯正專項(xiàng)檢查 為進(jìn)一步規(guī)范兒童青少年近視矯正工作,切實(shí)加強(qiáng)眼視光醫(yī)療器械監(jiān)管,規(guī)
首破500萬(wàn)人次!樂(lè)山大佛景區(qū)旅游接待量創(chuàng)歷史新高 四川新聞網(wǎng)-首屏新聞樂(lè)山8月28日訊(記者李舉濤)8月28日11時(shí),隨著來(lái)
【世界說(shuō)】美媒:槍支是美國(guó)獨(dú)有且持久的頑疾 “病根”在其政治、文化和法律中根深蒂固 中國(guó)日?qǐng)?bào)網(wǎng)8月28日電當(dāng)?shù)貢r(shí)間8月26日,美國(guó)佛羅里達(dá)州北部杰克遜維爾市
指甲怎么掃描二維碼 在日常生活中,當(dāng)我們使用數(shù)字設(shè)備時(shí),我們會(huì)遇到各種不同的問(wèn)題,其中
國(guó)家稅務(wù)總局趙國(guó)際被查 上證報(bào)中國(guó)證券網(wǎng)訊據(jù)中央紀(jì)委國(guó)家監(jiān)委駐國(guó)家稅務(wù)總局紀(jì)檢監(jiān)察組、天津