“國杰教授那邊呢”周至對麥明川問道。
李國杰是負責曙光超算操作系統snix的,他們那邊也有大字庫的需要,因此也有一套班子,主要負責對這邊的成果進行驗證,其實主要就是白嫖。
但是蜀大也沒有辦法,因為為了提高工作效率,周至之前開發了一套文字識別系統,這個系統能夠通過一系列的處理,將掃描的圖像字轉化為系統使用的矢量字,毫無疑問能夠節約大量的人工勞動。
但是有個問題,就是非常消耗運算資源,蜀大的幾臺機子處理不了,這部分工作得交給曙光超級計算機來完成。
雖然部委和超算中心頗有以大欺小的嫌疑,畢竟設計思路和解決方案都是蜀大提出來的,超算中心只負責運算出成果而已,然而拋開這些不談的話,這其實不亞于阿姆斯特朗登錄月球的一步。
文科863工程項目也有了使用超級計算機的資格,周至這也算是給文理之間身后的隔閡撕開了一條縫隙。
“曙光很厲害。”說到這個麥明川也不得不服“雖然分給我們的工作時間很少,但是采字工作已經全部完成了,就目前我們收集的七萬多個漢字,已經全部完成了矢量化的工作。”
“不過配碼工作老李不肯幫忙了,得咱們自己來水磨。”
“這個好辦。”辜開來說道“肘子根據我編字典的方法編寫了一套計算機算法,能夠將漢語大字典里的漢字,按照當時的編目規則,將文字自動轉化成編碼。”
“是嗎要有這個可就太方便了”麥明川大喜“我跟學校建議過對肘子進行特招,你們就是推擋。要干字庫,正需要文理兼通的人才才行”
“只是這套規則只處理了漢語大字典里的五萬字。”周至說道“而瀚文大字庫一二級就是七萬字,三級加上更是過十萬了,還是需要結合識別系統里的字根與筆畫識別功能,配合文字的讀音和筆畫,給矢量字配碼才行。”
“給漢語大字典完成編碼,用了多少時間”
“在矢量字現成的情況下,采集字根,參考讀音,分配編碼。”周至笑道“其實動作很快的,反倒是調試bug和處理一些系統無法判定的存疑字,耗費的時間更多。”
“我用了兩天時間完成了可行性實驗,在個人電腦上能夠做到五秒處理一個字。”
“那就省大事兒了”王主任又驚又喜“如此一來我們d日前按時交付產品,應該就沒有問題了。”
麥明川現在覺得周至簡直就是瀚文大字庫工程的吉祥物,他一來工程就能夠取得巨大的進展,這娃非常喜歡動腦筋,喜歡開發各種各樣的程序來代替繁瑣工作,從最早的手寫字庫,到字根筆畫分析系統,識別系統,轉換系統,再到現在的自動編碼系統,常常使用蠻不講理的方式,給理科生們撞開一條條寶貴的道路。
李紅江團隊下的人的確有些委屈,他們現在也漸漸明白了這個工程的本質,那就是它本身的確是一個文科項目,設計思路、理念、方法論,全都是文科的那一套,具體到了操作層面,才有理科生插手的余地。
說白了,這就叫管理層和打工仔的區別。
fo
fo。fo已改網址,已改網址,已改網址,大家重新收藏新網址,新網址新電腦版網址大家收藏后就在新網址打開,老網址最近已經老打不開,以后老網址會打不開的,請牢記:,免費最快更新無防盜無防盜報錯章,求書找書,請加qq群647547956群號</p>