當前位置:首頁  科學頭條

在數(shù)據(jù)海中撈“大魚”

中國工程科技知識中心完成總體技術構架

發(fā)布時間:2013-04-11來源:浙大新聞辦作者:周煒 張鴦4854


    鼠標一點,就相當于跑了好幾個圖書館、檔案館,查閱了許多個專業(yè)數(shù)據(jù)庫,搜尋了浩如煙海的工程技術報告和專利庫——這樣“坐享其成”的好事,正是中國工程科技知識中心的建設愿景。浙江大學計算機學院的科研團隊作為主要力量參與了中心的建設,經(jīng)過一年的研發(fā),目前已經(jīng)完成了總體技術構架,并形成了中草藥、金屬材料、工程科技圖書、工程咨詢報告等
4個專業(yè)知識服務系統(tǒng)。
    
    
據(jù)介紹,知識中心于20123月啟動,計劃用9年左右的時間,匯聚打通我國工程科技領域海量數(shù)據(jù),構建工程科技領域各個專業(yè)知識服務系統(tǒng),建成國內(nèi)工程科技信息資源最豐富,應用范圍最廣,實用性最強的知識整合體。
    
    
讓分散的數(shù)據(jù)匯聚成海,并形成便于獲取和生成新知識的數(shù)據(jù)庫,是知識中心最核心的技術路徑。知識中心技術總體組組長、浙大計算機學院院長莊越挺說,目前互聯(lián)網(wǎng)上的搜索引擎只實現(xiàn)了網(wǎng)頁搜索功能,只能搜索到數(shù)據(jù)海中的淺表信息,還遠遠不能滿足工程科技“深度搜索”的需求。比如,想要研究鋼鐵材料,在搜索引擎中得到的信息大多只是鋼鐵的商業(yè)信息,而關于鋼鐵生產(chǎn)的技術參數(shù),鋼材本身的材料韌度、強度、耐火性等數(shù)據(jù),在互聯(lián)網(wǎng)搜索結(jié)果中幾乎找不到,必須去查找專業(yè)的數(shù)據(jù)庫。
    
    
知識中心是要通過技術創(chuàng)新,讓更海量的知識,更容易地被獲取。“我們一項重要的工作是對知識數(shù)據(jù)的二次智能加工,將書本、網(wǎng)絡、數(shù)據(jù)庫等來源的信息進一步‘碎片化’。比如一本書可以按照章節(jié)、段落來存儲。這樣的一個好處是,比如當你尋找一個名詞概念時,不同的學者有不同的定義,就很方便地把所有對這個概念的描述找出來,放在一起一目了然。”
    
    
在中草藥專業(yè)知識服務系統(tǒng)中,記者嘗試在通用搜索選擇“單味藥”輸入“麻黃”后,麻黃的性味,功效,用法用量,醫(yī)藥案例等信息一一展現(xiàn)。在相似藥分析服務中,可以看到8000多味中藥中與“麻黃”藥物屬性相似的藥材,點擊連線,系統(tǒng)列出“麻黃”與“防風”之間在藥物屬性以及化合物方面的異同。在配伍分析服務中,輸入“麻黃”,系統(tǒng)動態(tài)生成它與其他藥材的配伍圖。“這有助輔助科研人員更快捷有效地進行藥物篩選、新藥發(fā)現(xiàn)等研究工作。”莊越挺說。
    
    
“中國工程科技知識中心的建設正當其時,云計算在方法論上解決了技術路徑的可行性,另外近年中國工程科技的高速發(fā)展,積累了大量的工程科技的數(shù)據(jù),正需要這樣的數(shù)據(jù)庫共享資源。廣大的工程科技人員也迫切需要新型的工具,以便在大數(shù)據(jù)中發(fā)現(xiàn)新知識,新規(guī)律。”中國工程院主席團名譽主席徐匡迪在知識中心建設調(diào)研時說。“高鐵、杭州灣跨海大橋、三峽大壩等中國大型的工程積累了豐富的經(jīng)驗,很多技術數(shù)據(jù)可以積累下來,讓更多的人共享。”
    
    
據(jù)了解,目前四個專業(yè)知識服務系統(tǒng)已進入測試階段,接下去將逐步展開50-60個專業(yè)知識服務系統(tǒng)的建設。
    
    (文 周煒/張鴦)