重生之乘風而起

第一千九百二十九章 合作項目

阅读页设置
背色

  

  

  

  

  

  

  

  

字體

上一章 首頁 目錄 書架 下一章

    周至倒是不怕這些,畢竟島國和國內一樣,能夠處理河豚的廚師是需要考取執照的。

    馬爺不吃正好,周至正好順便把他的那一份給幹掉了。

    反倒是池田丘這樣的年輕女士,對於吃這個部位一點沒有異樣,還笑吟吟地跟周至討論口感,讓周至感慨這女的要是在國內遇到付霞,指定聊得到一處去。

    之後坂本五郎對於周至和馬爺的態度就好像有了點細微的差別,好像給周至的笑臉更多,對於馬爺就有點應付了。

    聽聞周至提出想要去靜嘉堂訪問,同時和靜嘉堂文庫的負責人討論將文庫數字化的工作,不由得對周至刮目相看:「周桑,這個想法,是在瀚文大字庫創立之前就有了的?」

    說實話的確是如此,不過周至心目中的數字化圖書館遠比現在任何人心目中的結構都要宏大得多。

    但是腦海裡邊的東西提前說出來一點用都沒有,事情只能一步一步地做起來,現在第一步的瀚文大字庫已經完成,才說得到第二步上來。

    第二步,當然就是將典籍的內容數字化。

    周至心目中的圖書館,絕不是簡單的掃描,轉字,存儲這樣簡單的功能。

    這裡面涉及到版本格式的數字化,文字內容的數字化,書目索引體系數字化,段落標籤的數字化,特殊詞庫數字化,訪問檢索功能的開發,以及典籍內部與外部的聯想特徵接口。

    就拿《資治通鑑》來舉例,周至要的不是一個TXT文檔,而是一個立體化的資料庫,研究者可以根據自己的需要,輸入「漢武帝」三個字,就能夠檢索到資治通鑑里提到漢武帝的所有內容,由此拼合出一篇漢武帝的傳記,同時還能夠檢索出每一個段落的具體出處,以及與漢武帝這個關鍵詞有關係的一級標籤索引段落,二級標籤索引段落,三級標籤索引段落。

    比如漢武帝的五服內親人,父母,后妃,子女,重臣,重要制度,新立官制,政策,戰爭,災異,這些就屬於與之相關的一級索引。

    在位期間的其餘地方大事,諸侯,番邦等,這些內容屬於二級索引。

    以此類推。


    這樣就會把編年體的《資治通鑑》,剖析出一篇紀傳體的《漢武帝傳》,而這篇傳記上的許多內容,還可以一層一層地向下鑽取,比如皇后這一索引,就可以鑽取出衛子夫,從衛子夫,又可以鑽取出衛青,劉據。

    這些是內部接口,還有外部的,比如將《資治通鑑》和《史記》、《漢書》、《後漢書》、《五代史》、《資治通鑑長編》等再度關連起來。

    當然這些已經是屬於將來要幹的事情了,當務之急是先要將典籍的內容數字化完成。

    也就是說,這一切的基礎,是先要得到一個「《資治通鑑》.txt」。

    還有一個步驟,也是要和這一步同時進行的,就是「版本格式設置」。

    這個是用來展示用的,周至想要讀者在瀏覽古籍的時候,體驗到翻閱古籍的效果。

    要是再過幾十年,這事兒就很簡單,將典籍的高清掃描圖片和隱藏的數碼文字鏈接到一起,就能夠輕鬆實現。

    不過現在卻不行,因為如今的存儲空間是非常珍貴的,高清掃描圖片動則一兩兆,《資治通鑑》一共三百萬字,只需要6M的存儲空間。

    然而要是連掃描圖片一起打包的話,《資治通鑑》一共近三百冊,一萬多頁,兩頁一圖,拿起碼也需要12G。

    就算對圖片進行壓縮處理,也至少需要一兩個G才行。

    在家用電腦硬盤空間以一兩個G為主流的九四年,這麼幹就實在是太奢侈了。

    因此就需要將各種版本的《資治通鑑》的版面信息採集起來,然後找到規律,通過程序處理,在讀者瀏覽典籍的時候,將卷面格式和文字配套,臨時地「畫」出來。

    這個功能就無需占用大量的空間,而且實現起來難度也並不大。

    有了這兩個功能,最簡單原始的「數字圖書館」1.0版,就算是能夠出台了。

    坂本五郎本身並不懂技術,和很多外行一樣,聽了周至一通忽悠後,感覺這玩意兒實在是太高大上了。

    而且這東西整理出來後,可以到處備份,相當於能夠將一個靜



第一千九百二十九章 合作項目  

『加入書籤,方便閱讀』

上一章 首頁 目錄 加書籤 下一章
相關:  葉輕眉的故事極夜黎明  蘇廚  末世:黎明效應  黎明效應  回到山溝去種田    明末逐鹿天下  我在詭異世界謹慎修仙  開局一座神秘島  十方亂世,人間武聖!  吞噬古帝  
同類最熱
搜"重生之乘風而起"
360搜"重生之乘風而起"
語言選擇