2007年3月20日 星期二

紀錄:可攜式造字引擎專利釋放暨成果發表會

稍早提及可攜式造字引擎專利釋放暨成果發表會,日前已在中研院資訊所圓滿落幕,雖然許多技術性與實用性的議題尚待克服,但剎那搜尋工坊這項釋放專利的創舉,可望驅使漢字與資訊的整合邁入新的契機。OrzLab也順利展示內建動態組字技術的Linux mobile phone概念機,未來將逐步釋出其原始程式碼。

議程方面,自下午三點,由剎那搜尋工坊 (前身為易符智慧科技) 的大家長陳昌江先生在「專利釋放現場公告」揭露「可攜式造字引擎專利公眾授權條款書」,並有存證信函與拍照留影,為漢字資訊處理界劃下新的一頁,自此,此類動態組字技術將不再受限於特定單位,而能以自由軟體之形式,廣泛流通於新的應用中,感謝與會的貴賓與我們見證這一刻。葉健欣先生 (yap,前朱邦復實驗室成員) 則在「組字研究的簡史」給予清晰的介紹,提及何以漢字系統會面臨窘境、古文訓詁的難題、過去幾十年內相關漢字技術的變遷,以及從易符智慧科技剎那搜尋工坊所面臨的挑戰與技術應用的轉變。

張正一 (魔法設計師) 隨後給予精彩的「組字標準與觀念解說」議程,先由昔日「萬碼奔騰」的時代點題,雖然今日我們已清楚知曉Unicode標準的重要性,但實務應用上難免有所不足,其中以漢字缺字為最,為此,Unicode 3.0以降, 引入新的IDS與IDC機制 (Ideographic Description Sequence/Character)剎那搜尋工坊則以此為基礎並整合以部件為基礎的動態組字技術,張正一先生則率先撰寫符合自由軟體規範的組字示範程式,在議程中發表與展示,藉此為與會的貴賓建立概念。

由於專利釋放之舉也需要配套的自由軟體社群支援,才得以彰顯價值,所以本會也邀請到來自中研院資訊所的林誠夏與胡崇偉 (marr) 探討授權與專案開發的須知,詳見「公眾授權條款簡介」與「開源計畫要如何參與」。最後是OrzLab的議程「應用動態組字於手持式裝置」,首先分析手機一類的移動裝置在成本與多國語文上面臨的難題,再者是來自裝置端與後端的訊息交換議題,再深入探究系統設計,可發現以往的點陣字系統是一大衝擊,不僅增加成本也造成潛在的裝置壽命問題,同時輸出與輸入系統彼此是獨立的。OrzLab引入全向量繪圖系統,試圖克服上述技術難題,目前已經有高效能且低儲存需求的ASCII字型引擎,正銜接Unicode IDS需求,在議程尾聲,展示了一款內建動態組字技術的Linux mobile phone概念機,得以在QCIF解析度 (176x220) 迅速呈現全螢幕漢字輸出。

由於與會賢達來自古文研究、電子產業、出版業、佛經文化、文書處理等領域,所以議程後的討論時間中,激盪了深入的技術與人文性思考。首先是漢書軟體作者施得勝先生提問:「動態組字美觀度可否精進?」yap的回應是:

  • 組字七萬字約佔1MB ,而 TTF 要40~50MB 。美觀是用空間和時間來換取的
  • 常用字只有兩三千字,這些字沒有必要動態組出來,使用既有的方式即可
  • 動態組字使用的場合為呈現系統不存在的字,此時,組字再醜,也遠比空白或亂碼來得好
另一則是關於自由軟體授權的議題,這由中研院資訊所的葛冬梅小姐給予簡要的分析。臺灣師範大學國文系亓婷婷教授則提出美觀度、手寫辨識與組字的整合等問題,就動態組字本質來說,形同一個可提供無窮字形的字型檔,與輸入法沒有關連,亦即可沿用任何既有的輸入法,來輸入構形部件,當然,對於手寫辨識來說,將會有潛在的優勢,因為已經預先作部件的分析。

東海大學資管系林正偉教授
提出澄清專利涵蓋的議題,陳昌江先生則重申專利字號與適用範圍,以茲與眾多漢字學者研究區別,這也引發關於動態組字需要唯一或標準表示的討論,以「好」這個中文字為例,其部件為左邊的「女」與「子」,再行左右組合,但對複雜的字來說,構成方式不唯一,Unicode IDS只是探究其表示法,該如何確認有一致的交換性?多方討論的結果來看,剎那搜尋工坊表示會另行規範,但不在本研討會的議程中。最後是Mat (UCIMF作者) 就實務上詢問動態組字能否與Unicode相容,基本上只要依據Unicode IDS作對應,即可符合相容性,這也意味著,OrzLab未來可能從Unicode console/terminal與FreeType整合的方式,切入動態組字技術的應用。

會後就是BoF時間,也激盪了許多想法,相關的自由軟體實做與部件字庫也會在近日釋出,所以,儘管三十年前謝清俊教授等人就提出構字式的具體研究,但真正能夠讓成果累積並且跨入電腦以外的項目,這是個起點,但我們終於跨出了。

相關資訊:

沒有留言: