周至倒是不怕這些,畢竟島國和國內一樣,能夠處理河豚的廚師是需要考取執照的。
馬爺不吃正好,周至正好順便把他的那一份給干掉了。
反倒是池田丘這樣的年輕女士,對于吃這個部位一點沒有異樣,還笑吟吟地跟周至討論口感,讓周至感慨這女的要是在國內遇到付霞,指定聊得到一處去。
之后坂本五郎對于周至和馬爺的態度就好像有了點細微的差別,好像給周至的笑臉更多,對于馬爺就有點應付了。
聽聞周至提出想要去靜嘉堂訪問,同時和靜嘉堂文庫的負責人討論將文庫數字化的工作,不由得對周至刮目相看“周桑,這個想法,是在瀚文大字庫創立之前就有了的”
說實話的確是如此,不過周至心目中的數字化圖書館遠比現在任何人心目中的結構都要宏大得多。
但是腦海里邊的東西提前說出來一點用都沒有,事情只能一步一步地做起來,現在第一步的瀚文大字庫已經完成,才說得到第二步上來。
第二步,當然就是將典籍的內容數字化。
周至心目中的圖書館,絕不是簡單的掃描,轉字,存儲這樣簡單的功能。
這里面涉及到版本格式的數字化,文字內容的數字化,書目索引體系數字化,段落標簽的數字化,特殊詞庫數字化,訪問檢索功能的開發,以及典籍內部與外部的聯想特征接口。
就拿資治通鑒來舉例,周至要的不是一個txt文檔,而是一個立體化的數據庫,研究者可以根據自己的需要,輸入“漢武帝”三個字,就能夠檢索到資治通鑒里提到漢武帝的所有內容,由此拼合出一篇漢武帝的傳記,同時還能夠檢索出每一個段落的具體出處,以及與漢武帝這個關鍵詞有關系的一級標簽索引段落,二級標簽索引段落,三級標簽索引段落。
比如漢武帝的五服內親人,父母,后妃,子女,重臣,重要制度,新立官制,政策,戰爭,災異,這些就屬于與之相關的一級索引。
在位期間的其余地方大事,諸侯,番邦等,這些內容屬于二級索引。
以此類推。
這樣就會把編年體的資治通鑒,剖析出一篇紀傳體的漢武帝傳,而這篇傳記上的許多內容,還可以一層一層地向下鉆取,比如皇后這一索引,就可以鉆取出衛子夫,從衛子夫,又可以鉆取出衛青,劉據。
這些是內部接口,還有外部的,比如將資治通鑒和史記、漢書、后漢書、五代史、資治通鑒長編等再度關聯起來。
當然這些已經是屬于將來要干的事情了,當務之急是先要將典籍的內容數字化完成。
也就是說,這一切的基礎,是先要得到一個“資治通鑒txt”。
還有一個步驟,也是要和這一步同時進行的,就是“版本格式設置”。
這個是用來展示用的,周至想要讀者在瀏覽古籍的時候,體驗到翻閱古籍的效果。
要是再過幾十年,這事兒就很簡單,將典籍的高清掃描圖片和隱藏的數碼文字鏈接到一起,就能夠輕松實現。