[精讚] [會員登入]
18858

「許功蓋」的字以及源由

有玩過電腦一段時間的人,都聽過這個人(有一天我才發現7年級的竟然都不認識這個

分享此文連結 //n.sfs.tw/10211

分享連結 「許功蓋」的字以及源由@新精讚
(文章歡迎轉載,務必尊重版權註明連結來源)
2019-10-25 07:04:01 最後編修
2016-11-12 15:03:11 By 張○○
 

自動目錄

有玩過電腦一段時間的人,都聽過這個人(有一天我才發現7年級的竟然都不認識這個"人")。

在古老的年代,寫程式時最討厭的就是處理「許功蓋」的問題,因為有一些Big5編碼的字,後面那個 byte竟然是 ascii 碼的反斜線 '\',這雖然不值得什麼大驚小怪,但是在程式語言中,那個 "\" 是極重要的脫逸字元(Escape character),會把後面接的那個字元給脫逸掉。例如 明明是寫 "我姓許" 這三個字,轉換成 utf-8 時,就會變成 "我姓許\",莫明奇妙多出一個反斜線,把後面的雙引號 " 給脫逸掉了,當然,程式執行到這一定是錯。

這種痛苦的經驗非常多,例如網頁的表單,以前還採用 big5 的編碼時,如果使用者要修改表單,一般的做法會把原來的值寫為 text中,慘的就是如果好死不死使用者填的最後一個字是「許功蓋」這種匪類,就會把 value 值的右引號給脫逸,造成亂碼或是破碎的表單。還有中文檔案上傳到ftp,遇到教"育"的育字、午"餐"的餐字,看到的可能就是"灶" 和另一個奇怪的字,有時還會有下載不回來的冏境。還有php 的函數 strip_slashes 把 \ 脫掉的函數,竟然會把許功蓋這些匪類給脫了(strip) 只能說一個慘字。

真的要抱怨會寫不完,所以解決 big5 的最好方法,就是不要再用 big5。

以下文章節錄自網管很忙 url http://203.64.20.7/lifetype126/index.php?op=ViewArticle&articleId=15&blogId=1

許功蓋是何許人? 令人頭疼的傢伙

  有人說中國人像一盤散沙,不但不團結又愛搞分化,無論在學校、公司、部隊或社會,小圈圈或小山頭林立,想要中立者很難不被人貼上標籤,一旦被歸類到哪 個派系時禍福難料。台海兩岸不就是最明顯的例子,上一代的鬥爭,下一代繼續鬥,非要弄得大家頭破血流為止。

大名鼎鼎的許功蓋

  無論是許功蓋或是許蓋功其實只是本尊與分身的差別不同,意思是在電腦世界裡都代表一個相同問題,我想只要曾經用過"PHP+MySQL"架站過的人, 幾乎是無人不知無人不曉這頭疼的傢伙,且絕對是這些架站人心中永遠的痛。仔細探究原因,你會發現,錯的人其實不該是許功蓋,而是通稱大五碼的BIG5碼, 關於大五碼的歷史傳說眾說紛紜,無一定論。我們並不評論當初編碼的對錯與是非,對這歷史有興趣的讀者不妨到google搜尋"BIG5″,相信可以找到一 堆資料。

  既然大五碼聽來似乎有些問題,為何目前幾乎所有的繁體中文卻又都採用此一編碼呢?在西元1983-1984年間,個人電腦正在台灣逐漸推廣,電腦上的 套裝軟體也開始盛行,為了解決電腦處理中文的問題,因而制定一套中文內碼,也就是我們通稱的"BIG5碼",又稱大五碼。而經歷過這段時間的人,一定不會 忘記當初倚天中文的行銷手法,在國外軟體廠商開始引進原版軟體觀念的當時,倚天中文卻反其道而行,允許校園甚至一般使用者無條件且免費複製其中文系統,因 此,讓倚天中文在當時幾乎成為中文的標準,也由於倚天中文正是採用BIG5編碼,嚴格說來,也就是BIG5碼為何一直沿用到現今的主要原因了。

BIG5不只找php麻煩,連UNIX都難倖免於難

  7C 是 ASCII 裡的 pipe ‘|’ 用過 UNIX的人應該知道它是作什麼的,舉一個簡單的例子,如果你用 FTP 上傳一個 “四.doc” 的檔名到 UNIX 作業系統 ,傳完後立刻變成 “北.doc’,我想有太多人碰過這種經驗,原因無他,中文字 “四” 的 BIG5 碼是"A57C",當 UNIX 看到 7C 時會覺得莫名其妙,上傳一個 “|” 給我做什麼?於是就自己處理掉了…

熊大:口好渴!人呢?

單位同事瑩光說,他在處理資料庫轉碼時( big5 ==> utf-8) 發現「許功蓋」在轉完會讓人很冏,本來要寫一個程式特別去判斷後再轉,但是後來他發現那樣子效率太差,所以直接用取代的就好,反正許功蓋的字約 70 個,常用的不到10個,只要處理會影響的許功蓋系列35字就好了。

BIG5碼中容易衝碼的文字

常見字用彩色標註
最常見字:功餐許蓋

次常見字:擺珮豹枯淚穀愧
其他字就見招拆招吧,有時一篇10萬字的書大概也不見得會出現。

(請注意看你的內文是否用到了下列的字:)

ASCII(5C) == “\”

A45C么 AE5C娉 B85C稞 C25C擺 A55C功  AF5C珮 B95C鈾 C35C黠 A65C吒 B05C豹

BA5C暝 C45C孀 A75C吭 B15C崤 BB5C蓋  C55C髏 A85C沔 B25C淚 BC5C墦 C65C躡

A95C坼 B35C許 BD5C穀 AA5C歿 B45C廄  BE5C閱 AB5C俞 B55C琵 BF5C璞 AC5C枯

B65C跚 C05C餐 AD5C苒 B75C愧 C15C縷 

ASCII(7C) == “|”

AA7C泜 B47C揉 A87C育 BE7C魯 B27C琍  BC7C慝 C67C鸛 A97C尚 B37C逖 BD7C罵

A77C坑 B17C悴 BB7C誡 C57C疊 A67C帆  B07C院 BA7C漏 C47C辮 AB7C咽 B57C稅

BF7C糕 AC7C洱 B67C閏 C07C嚐 AD7C迢  B77C會 C17C舉 A47C弋 AE7C徑 B87C腮

C27C甕 A57C四 AF7C砝 B97C頌 C37C牘


原文 2010-04-26 22:09:34

END

你可能感興趣的文章

超強姓名音譯網站 超級強,符合我所有需求

中國台灣香港澳門各省市英文代碼 中台港澳英文代碼一覽表

中國的網路審查(資訊長城) 介紹中國的網路審查(簡字网络审查、資訊長城或防火長城)

移除google 的頁庫存檔--移除在google中保存的網頁資料 我的網頁或文件被google保存了,但我不想給別人下載要怎麼做?

NETCRAFT發現你的網站及作業系統 NETCRAFT可以發現你的網站及作業系統

我有六顆硬碟,該設定 RAID5, RAID50 還是 RAID6? 我有六顆硬碟,該設定 RAID5, RAID50 還是 RAID6?

我有話要說

>>

限制:留言最高字數1000字。 限制:未登入訪客,每則留言間隔需超過10分鐘,每日最多5則留言。

訪客留言

[無留言]

隨機好文

為什麼要買長達二十年的保單? 為什麼要買長達二十年的保單?找一個可以說服我買二十年保單的理由。

[札記] 2016.7~12月札記 札記,只是札記

UTF-8的網頁但IE8一片空白 UTF8編碼的網頁在Firefox 正常顯示、但IE8 就是空白,IE8編碼設定是「自動偵測」可是自動偵測到的是 big5...

維修冰箱 維修冰箱

一個邏輯的錯誤刪了全部檔案的經驗 今天本來想做一件很簡單的事,但卻足足浪費我多一倍的時間,再加上刪掉我全部的檔案,原因只是因為我自己的邏輯錯誤。