顯示具有 zhongwen 標籤的文章。 顯示所有文章
顯示具有 zhongwen 標籤的文章。 顯示所有文章

2007年3月20日 星期二

紀錄:可攜式造字引擎專利釋放暨成果發表會

稍早提及可攜式造字引擎專利釋放暨成果發表會,日前已在中研院資訊所圓滿落幕,雖然許多技術性與實用性的議題尚待克服,但剎那搜尋工坊這項釋放專利的創舉,可望驅使漢字與資訊的整合邁入新的契機。OrzLab也順利展示內建動態組字技術的Linux mobile phone概念機,未來將逐步釋出其原始程式碼。

議程方面,自下午三點,由剎那搜尋工坊 (前身為易符智慧科技) 的大家長陳昌江先生在「專利釋放現場公告」揭露「可攜式造字引擎專利公眾授權條款書」,並有存證信函與拍照留影,為漢字資訊處理界劃下新的一頁,自此,此類動態組字技術將不再受限於特定單位,而能以自由軟體之形式,廣泛流通於新的應用中,感謝與會的貴賓與我們見證這一刻。葉健欣先生 (yap,前朱邦復實驗室成員) 則在「組字研究的簡史」給予清晰的介紹,提及何以漢字系統會面臨窘境、古文訓詁的難題、過去幾十年內相關漢字技術的變遷,以及從易符智慧科技剎那搜尋工坊所面臨的挑戰與技術應用的轉變。

張正一 (魔法設計師) 隨後給予精彩的「組字標準與觀念解說」議程,先由昔日「萬碼奔騰」的時代點題,雖然今日我們已清楚知曉Unicode標準的重要性,但實務應用上難免有所不足,其中以漢字缺字為最,為此,Unicode 3.0以降, 引入新的IDS與IDC機制 (Ideographic Description Sequence/Character)剎那搜尋工坊則以此為基礎並整合以部件為基礎的動態組字技術,張正一先生則率先撰寫符合自由軟體規範的組字示範程式,在議程中發表與展示,藉此為與會的貴賓建立概念。

由於專利釋放之舉也需要配套的自由軟體社群支援,才得以彰顯價值,所以本會也邀請到來自中研院資訊所的林誠夏與胡崇偉 (marr) 探討授權與專案開發的須知,詳見「公眾授權條款簡介」與「開源計畫要如何參與」。最後是OrzLab的議程「應用動態組字於手持式裝置」,首先分析手機一類的移動裝置在成本與多國語文上面臨的難題,再者是來自裝置端與後端的訊息交換議題,再深入探究系統設計,可發現以往的點陣字系統是一大衝擊,不僅增加成本也造成潛在的裝置壽命問題,同時輸出與輸入系統彼此是獨立的。OrzLab引入全向量繪圖系統,試圖克服上述技術難題,目前已經有高效能且低儲存需求的ASCII字型引擎,正銜接Unicode IDS需求,在議程尾聲,展示了一款內建動態組字技術的Linux mobile phone概念機,得以在QCIF解析度 (176x220) 迅速呈現全螢幕漢字輸出。

由於與會賢達來自古文研究、電子產業、出版業、佛經文化、文書處理等領域,所以議程後的討論時間中,激盪了深入的技術與人文性思考。首先是漢書軟體作者施得勝先生提問:「動態組字美觀度可否精進?」yap的回應是:

  • 組字七萬字約佔1MB ,而 TTF 要40~50MB 。美觀是用空間和時間來換取的
  • 常用字只有兩三千字,這些字沒有必要動態組出來,使用既有的方式即可
  • 動態組字使用的場合為呈現系統不存在的字,此時,組字再醜,也遠比空白或亂碼來得好
另一則是關於自由軟體授權的議題,這由中研院資訊所的葛冬梅小姐給予簡要的分析。臺灣師範大學國文系亓婷婷教授則提出美觀度、手寫辨識與組字的整合等問題,就動態組字本質來說,形同一個可提供無窮字形的字型檔,與輸入法沒有關連,亦即可沿用任何既有的輸入法,來輸入構形部件,當然,對於手寫辨識來說,將會有潛在的優勢,因為已經預先作部件的分析。

東海大學資管系林正偉教授
提出澄清專利涵蓋的議題,陳昌江先生則重申專利字號與適用範圍,以茲與眾多漢字學者研究區別,這也引發關於動態組字需要唯一或標準表示的討論,以「好」這個中文字為例,其部件為左邊的「女」與「子」,再行左右組合,但對複雜的字來說,構成方式不唯一,Unicode IDS只是探究其表示法,該如何確認有一致的交換性?多方討論的結果來看,剎那搜尋工坊表示會另行規範,但不在本研討會的議程中。最後是Mat (UCIMF作者) 就實務上詢問動態組字能否與Unicode相容,基本上只要依據Unicode IDS作對應,即可符合相容性,這也意味著,OrzLab未來可能從Unicode console/terminal與FreeType整合的方式,切入動態組字技術的應用。

會後就是BoF時間,也激盪了許多想法,相關的自由軟體實做與部件字庫也會在近日釋出,所以,儘管三十年前謝清俊教授等人就提出構字式的具體研究,但真正能夠讓成果累積並且跨入電腦以外的項目,這是個起點,但我們終於跨出了。

相關資訊:

2007年3月14日 星期三

可攜式造字引擎專利釋放暨成果發表會

本週二下午至中研院資訊所,參與「可攜式造字引擎專利釋放既成果發表會」的行前會,確立許多細節,新聞稿已出爐,摘錄如下:

3月17日剎那搜尋工坊將假中央研究院舉行可攜式造字引擎專利釋放暨成果發表會

對於出版、文史研究、教育、甚至科技行業,漢字重重的缺字問題始終是永遠的痛,在經歷30餘年產、官、學的努力下,終於萌生全面性解決方案-部件組字

部件組字在邁向成熟實用化的道路上,剎那搜尋工坊扮演了相當的角色。過去專注於開發漢字搜尋技術,也鑽研缺字問題的全面解決之道,在吸納中央研究院謝清俊教授、朱邦復先生等等諸前人的成果後,研發出「可攜式造字引擎」。該技術內涵為基於漢字字形本質的動態組字,使跳脫以往人為一字一碼的武斷,回復漢字本有的活性架構。不但解決了缺字困難,也同時相容於unicode標準,為一條無痛的漢字數位進化之路。

剎那搜尋工坊鑑於此重大數位漢字基礎技術,乃「站在巨人肩膀上」的成果,為謀求對社會大眾的最大利益,遂藉此會公示將此專利技術無償開放公眾運用,歡迎各界使用與繼續發揚。

會中將說明本技術的沿革簡史、組字的觀念、以及如何參與發展的作法。
OrzLab也提供了十五分鐘的介紹「應用動態組字於手持式裝置」,延續之前blog「動態組字技術於Embedded領域」的觀點,將以實際的案例探討嵌入式系統領域如何由此受益,相當感謝剎那工作坊釋出專利,經過多次的討論後,也看到許多機會,作為華人的工程背景人員,我們有相當大的伸展舞台,同時開放的胸襟加上open source,所激盪出的變革更值得我們關注。

舉辦單位
時間地點

3/17/2007 下午3:00~5:00 中央研究院資訊科學研究所 新館 101會議室

2007年3月2日 星期五

動態組字技術於Embedded領域

魔法設計師與marr的引見下,去年於COSCUP 2006有幸認識剎那工坊的陳昌江與yap前輩,談到中文組字技術與嵌入式系統的若干細節,給予我很大的鼓舞。本實驗室今年的計畫中,即有Embedded GUI Framework的項目,原本只是因應RT executive或virtualization需要 (如Linux subsystem尚在啟動或者非運作中的情況下,至少可有輕量級的人機介面與使用者互動),所提出附加性設計,這也就是Xorz/Embedded (展示1/展示2)。但如果能順利整合中文動態組字技術,對於原本即以向量繪圖為核心架構的Xorz/Embedded,是很好的契機,或許可作為低階裝置的UI,同時我們也可以看到,開發中國家如中國大陸,更是需要動態組字技術。

為何我們要重視動態組字技術的原因,除了陳昌江前輩日前發表的大作「等待新漢碼」所提到種種根深蒂固的窘境以及文化傳承的需要,另一個現實的考量是,這類可攜式造字引擎可避免過度的Disk I/O存取,進而大幅提昇儲存裝置的壽命 (NAND/NOR Flash 皆有讀寫次數限制),所以短期內我們應該要在Embedded平台作技術驗證,中期就是銜接現有mobile標準,克服缺字議題。


魔法設計師貢獻了許多教學文件與參考實做,可參考其 blog 之漢字研究的分類,日前張貼的「組字示範程式釋出!」一文即提供了以Java撰寫的教學程式,內含中華民國發明專利號碼第I254863號「可攜式造字引擎」專利的技術與剎那工坊維護之剎那單線體字形檔,經專利權人陳昌江同意,預先提供執行檔與資料檔供測試評估使用,詳細規格可見正體中文網,附帶一提,相關專利可望於近日釋放,成為公共財。

OrzLab很自然就成為受益者,不過小弟目前仍在規劃階段,只有零星的測試程式碼,不過抽離Xorz/Embedded內部的向量描繪引擎就是相當重要的工作,目前已經有個具體而微的向量字型編輯程式,以下是其運作畫面:

另外,也可試著與對岸許多Embedded GUI開發者打聲招呼,其實已經太多重複的工作了。今年真是刺激的一年 :-)