樂樂文學網 > 重生之乘風而起 > 第七百四十五章 加法減法
  “在我看來,新的字庫,需要達到幾個標準。”

  “首先就是碼位要寬泛,我的意見是以二十萬為基準;”

  “其次是對gb2312和gb13000的兼容,需要具備提供完整、清晰、明確的代碼映射表,實現自由轉換。”

  “第三是對標準的用戶自定義區和標準保留區的使用做了明確、詳細的規定。既要讓用戶可以在自定義區,利用字庫提供的十三筆畫和漢字基準部件,造出自己需要的漢字,同時又要對這些新入庫的漢字,制定出嚴格的標準和使用方法,同時還要及時升級,將通過審批的漢字加載進標準保留區。”

  “這樣可以群策群力,既減少我們的工作量,又讓廣大用戶有了參與字庫建設的機會。”

  這一條在座的所有人都沒有想到過,現在給周至一提出來,大家都感覺眼前一亮,這小子的腦瓜子可真靈!

  “最后一條,當然就是強制標準,我們需要一個具備強約束力的標準規范,提高知名度。”

  “強制性標準的知名度最高。中文軟件的最終用戶如果知道了我們制定出了一個最佳的漢字標準,肯定會要求軟件開發商來實現它。”

  “而反過來,軟件開發商也不得不重視標準,實現這個標準,來提高自己的競爭力。”

  “這個標準,會不會……太高了啊?”麥明川摳了摳腦門:“我估計百分之九十九的用戶都用不到。”

  “剛剛說了,用不到全集,可以選用不同層次的子集嘛。”周至說道:“但是這并不能說明大全集就不該有。”

  “麥主任,據我所知,電子計算機使用的邏輯算法,包括設計理念,其實也是幾十年甚至一兩百年前就已經成熟的學科,直到人類在晶體管技術實現突破之后,才將那些成熟學科的數學成果,應用到了集成電路上,形成了如今的信息產業。”

  “弗雷格,羅素和布爾,他們也沒有說過他們的數理邏輯研究,在十九世紀的時候標準太高了,得等到二十一世紀信息科技萌芽的時候,再讓后人來研究也不晚啊?”

  “哈哈哈哈哈……”麥明川大笑:“周至同學這是以子之矛攻子之盾,學得一手的好邏輯啊,有沒有興趣來我們計算機系學習啊?這可是如今國家最人才稀缺,需求最迫切的好專業喲!”

  “別想了。”辜老擺了擺手:“肘子第一志愿是我中文系,其次歷史系,其次哲學系,他是文科生。”

  “文科生?”這下輪到麥明川驚訝了:“文科生有如此嚴謹的邏輯思維?”

  “麥主任這就是瞧不起我們了。”周至笑道:“我們的古文有一套反復的語法,這本身就說明我們早就具備了一套嚴密的思維邏輯。”

  “我們古代的名家學派,法家學派,縱橫家學派,都是運用這套思維的高手,不能因為我們沒有將之單列出來作為一門學問寫出專著,就代表我們沒有這門學問,就沒有人研究過。”

  “肘子你扯遠了,”辜老笑道:“不過我覺得思路是不錯的,我們的目標的確可以定得高一點。”

  “辜老,您是不知道現在的內外存儲有多貴,”麥明川說道:“字庫需要調入內存,才能夠快捷方便地使用,現在的計算機系統,內存一般才八兆,加載了操作系統,尤其是現在的可視化系統,會耗用大量的內存,留給應用的,可就已經不多了。”

  “隨著技術的進步,這些總是可以解決的嘛。”辜幼文說道:“就如肘子所言,我們可以先有思路,有理論,有儲備,”

  說完拍了拍那堆字稿:“有這些東西,先標準后應用,我看是完全可行的嘛!”

  “其實這就和標準計量局里的鉑金度量衡一樣,”旦增笑道:“標準制定的時候我們不妨就高,等到應用的時候,再因地制宜嘛。”

  “其實只要有了標準點陣字,將字庫拓展出來就不難了。”李紅江有些興奮:“因為不管漢字是復雜還是簡單,是繁體還是簡體,其基準筆畫和部首結構都是一樣的。”

  “也就是說,我們完全可以使用gb2312和gb13000的筆畫耦合技術,有了點陣字,就可以創造出黑體,宋體,彷宋,楷體四種基準字體。”

  “對,這就是我們漢字的優勢。”周至說道:“我們的字稿上,點陣字以外的其余三種字體,其實是用來給李教授他們做修正用的,如果李教授認為沒有問題的話,今后我就讓我同學專門寫點陣字了。”

  “肘子你這同學也是高中生?那他有沒有興趣來我們計算機系啊?”

  “呃,我這同學是水電校,職高那種,已經畢業參加工作了,在蠻州電力公司。”周至說道:“對了我還有個要求,李教授,如果用了我們的字稿,研究者當中,我希望把我同學的名字加進去。”

  “現在就剩下開發掃描程序和編碼了。”李紅江拿兩根手指敲著下巴,陷入了思索:“還是時間的問題,要是能夠趕在gb13000推出之前最好。我們說服標準委員會的機會更大……”

  “其實我還有一個思路,”周至說道。

  “你講你講。”麥明川現在看著小子一百個的順眼,理論上這小子已經將大家的思路給打開了,也將最難的水磨功夫都做了,現在就剩下一個入庫和編碼的問題。

  而這兩樣,國家在編寫gb2312和gb13000的時候,已經有了長足的經驗。

  “其實我們還可以反向操作。”

  “什么反向操作?”

  “開發一個文字識別軟件。”周至說道:“一個能夠識別漢字,將漢字加工成點陣字,再將之按照偏旁部首等一定的規則,給漢字自動賦予編碼,將之放入字庫碼位的軟件。”

  “設計思路有嗎?”李紅江的這下興趣來了,中文識別,好東西呀。

  “這個程序的設計思路是這樣的。”周至說道:“因為漢字本身是有一定組織規則的,以方塊字為主,因此我們可以利用這些規則去掃描它,對其進行分析。”

  “理論上每個漢字,尤其是印刷體,其重心位置,中宮收放等特征,在一本典籍當中都是同一的,我們可以通過廣泛采樣,得到均值,再將這些均值作為漢字的字體設計參數,賦給已有的點陣字,產生與典籍一樣的字體。”

  “如果反過來思考,我們可以認為,每一個典籍上的文字,都是被字體算法計算出來的圖形,而這個圖形,本身是全覆蓋其點陣字的所有邊界的。”

  “如果我們對其按照之前掃出的參數進行反耦合,也就是做減法,理論上是完全可以將文字圖形,減縮成標準點陣字的。”

網頁版章節內容慢,請下載好閱小說app閱讀最新內容

請退出轉碼頁面,請下載好閱小說app 閱讀最新章節。