- 相關(guān)推薦
淺析知識組織視野下檔案知識庫的構(gòu)建思路
摘要:檔案知識庫是實(shí)現(xiàn)檔案資源知識化、知識資源有序化及知識資源服務(wù)化的重要手段。文章從知識組織的角度入手,對檔案知識庫中檔案知識點(diǎn)、檔案知識單元、檔案知識簇、再生的檔案知識以及檔案知識服務(wù)平臺等構(gòu)成要素的構(gòu)建思路詳細(xì)分析,包括檔案知識點(diǎn)的分類標(biāo)引,檔案知識點(diǎn)的關(guān)聯(lián)與聚類,檔案知識單元的挖掘推理與語意關(guān)聯(lián),檔案知識的再生與利用,以及檔案知識服務(wù)平臺的構(gòu)建。
關(guān)鍵詞:知識組織;檔案知識庫;構(gòu)建;思路
當(dāng)今社會檔案信息資源數(shù)據(jù)量大,信息冗余混亂,多元信息并存且新的數(shù)據(jù)時時刻刻都在產(chǎn)生,檔案用戶在獲取所需的檔案信息時經(jīng)常迷茫于其中而無所適從。這正反映當(dāng)前檔案信息服務(wù)平臺的信息組織方式與人們?nèi)找嬖鲩L的知識服務(wù)需求之間不相匹配的矛盾。大數(shù)據(jù)時代的檔案信息服務(wù)業(yè)發(fā)生了很大的變化,服務(wù)核心已由實(shí)體文本服務(wù)轉(zhuǎn)向數(shù)字化資源服務(wù),最終轉(zhuǎn)向知識化資源服務(wù)。這就需要檔案信息服務(wù)部門采用知識組織方法,構(gòu)建信息豐富的檔案知識庫,使雜亂的檔案信息有序化,有序的檔案信息知識化,最終有效地服務(wù)于用戶。
檔案知識庫脫胎于海量的檔案信息資源,是對其整理加工的成果。其不僅包含檔案資源本身所記載與反映的知識內(nèi)容,還包括不同檔案知識之間的關(guān)聯(lián),文件產(chǎn)生、辦理中形成的背景、結(jié)構(gòu)等方面的知識,檔案資源客觀載體上呈現(xiàn)的顯性知識,甚至其后的知識關(guān)聯(lián),檔案組織者、檔案人員等存儲于其腦中的經(jīng)驗(yàn)、閱歷等主觀的隱性知識。檔案知識庫有效地融入了用戶的需求,可以支撐并服務(wù)于用戶問題的解決。因許多潛在知識并未直接記錄在檔案載體上,所以需要采取知識組織方法深度挖掘,才能構(gòu)建出可利用的檔案知識庫,并有效地服務(wù)于用戶。
1分析檔案信息資源,分類與標(biāo)引檔案知識點(diǎn)
檔案知識點(diǎn)的分類及標(biāo)引是在分析檔案知識點(diǎn)內(nèi)容屬性(特征)及相關(guān)外表屬性的基礎(chǔ)上,按照定義好的類別將其分門別類,并用特定語言表達(dá)分析出的屬性或特征。檔案知識點(diǎn)的分類及標(biāo)引針對的是用戶所需的直接檔案信息、知識,是對檔案信息資源中知識點(diǎn)的發(fā)掘和形式上的組織,如可以從數(shù)字檔案、檔案全文數(shù)據(jù)庫、檔案目錄數(shù)據(jù)庫等檔案客體提取用戶所需的檔案知識,經(jīng)分類標(biāo)引后直接服務(wù)于用戶。對檔案知識點(diǎn)進(jìn)行分類與標(biāo)引首先要對檔案知識點(diǎn)(數(shù)據(jù))進(jìn)行采集,并進(jìn)一步分析與檢測其是否可用、重復(fù)及是否完整等?捎眯詸z測主要側(cè)重于分析數(shù)據(jù)本身是否有誤或是否對用戶問題的解決有用;重復(fù)數(shù)據(jù)主要是指基本相同的數(shù)據(jù),可能由于格式或拼寫上的差異,導(dǎo)致檔案信息管理系統(tǒng)無法區(qū)分;不完整數(shù)據(jù)主要指信息的缺失,如檔案責(zé)任者、所屬機(jī)構(gòu)、度量單位等信息的缺失等。然后要對采集到的檔案信息資源進(jìn)行數(shù)據(jù)清洗,要選擇合適的策略,篩選無用數(shù)據(jù),合并同類信息,補(bǔ)充完善缺失信息,最終形成用戶所需的待分類與標(biāo)引的知識點(diǎn)集合。在對檔案知識點(diǎn)進(jìn)行分類和標(biāo)引時,可以參照《中國檔案分類法》、《中國檔案主題詞表》、網(wǎng)絡(luò)信息資源分類法等分類標(biāo)引語言詞典進(jìn)行設(shè)計(jì),建立成套的檔案知識分類體系,形成分類明確、層次明晰、次序井然的分類標(biāo)準(zhǔn)。大數(shù)據(jù)時代檔案知識點(diǎn)的標(biāo)引可有效借助于計(jì)算機(jī)的自動標(biāo)引,可采用關(guān)鍵詞標(biāo)引、概念標(biāo)引、語義標(biāo)引、本體標(biāo)引等方法來標(biāo)示檔案知識點(diǎn),使其具備一定的主題和屬性特征。經(jīng)過檔案知識點(diǎn)的分類與標(biāo)引,用戶所直接需要的、知識服務(wù)密度低的檔案知識集合已經(jīng)形成,可以作為檔案知識庫的基礎(chǔ)部分,用以滿足用戶基本的檔案信息與知識需求,但許多潛在的知識尚需進(jìn)一步開發(fā),進(jìn)行更深層次的知識組織。
2關(guān)聯(lián)檔案知識點(diǎn),聚類檔案知識資源
檔案知識點(diǎn)的關(guān)聯(lián)組織“是將檔案知識及其相互聯(lián)系等關(guān)系信息也有效地存儲于數(shù)據(jù)庫中。這就使得原本無序的檔案知識變得易于控制且有序,讓原本孤立的數(shù)據(jù)呈現(xiàn)出有機(jī)的聯(lián)系”。
例如用戶在查閱數(shù)字檔案信息資源時,遇到不了解的人物、事件等時就會產(chǎn)生直接查閱相關(guān)文件的需要,通過檔案知識關(guān)聯(lián),就可以將數(shù)據(jù)庫中的相應(yīng)人物與事件等知識點(diǎn)與之關(guān)聯(lián),為用戶提供更高效的服務(wù)。而檔案知識資源的聚類組織則“是根據(jù)一定的規(guī)則將信息或知識按類聚集起來,分別給予相同的類別標(biāo)記,并將類號賦予相關(guān)信息,存儲于數(shù)據(jù)庫中的過程、技術(shù)和方法”。這就將原本分散的檔案知識點(diǎn)按照一定的主題特征聚合在一起,使聚合在一起的檔案知識點(diǎn)具備相同的關(guān)聯(lián)或特征。經(jīng)過檔案知識點(diǎn)的分類與標(biāo)引,檔案知識點(diǎn)已經(jīng)具備一定的主題與屬性特征,這一層次的檔案知識分別涵蓋各種事件、基本概念、情景、方法、用戶知識需求等知識點(diǎn),可以滿足用戶低知識層面的需求,解決用戶的一些較單一問題,可將其直接歸入檔案知識庫中,用以解決用戶單一、低知識密度的問題。而通過檔案知識點(diǎn)的關(guān)聯(lián)組織和聚類組織,形成知識密度較高且橫向關(guān)聯(lián)的檔案知識單元,如檔案文摘、索引、題錄等形式的檔案知識產(chǎn)品,實(shí)現(xiàn)檔案知識點(diǎn)的優(yōu)化組合,檔案知識密度大為提升,可以解決用戶較復(fù)雜的問題,滿足用戶較高層次的檔案知識需求。
3挖掘推理檔案知識單元,組織關(guān)聯(lián)檔案知識語義
通過對檔案知識單元進(jìn)行挖掘、推理、語意關(guān)聯(lián)等形式的知識組織,可以進(jìn)一步增強(qiáng)檔案知識單元的知識密度,滿足用戶更高層次的檔案知識服務(wù)需求。檔案知識單元的語意組織“是將信息及信息間的語義關(guān)系存儲起來,構(gòu)成具有語義關(guān)系的數(shù)據(jù)庫。在檢索和分析時,通過建立的語義關(guān)系,進(jìn)行語義推理實(shí)現(xiàn)知識服務(wù)”。檔案知識單元的語義組織與關(guān)聯(lián)將數(shù)據(jù)庫中檔案知識的原有記錄、字段的關(guān)系上升到知識間的語義關(guān)系,保證了檔案知識間的關(guān)聯(lián)與再生及隱性知識的呈現(xiàn)。這種語義關(guān)系非常豐富,例如檔案中事件與事件間語義關(guān)系、人與人之間的親屬關(guān)系及隸屬關(guān)系、不同主題間的語義關(guān)系等。通過檔案知識單元的挖掘、推理、語意關(guān)聯(lián)等知識組織,改變了原有檔案知識單元間的顯性聯(lián)系,產(chǎn)生了新的關(guān)聯(lián)與知識,形成檔案綜述、檔案百科全書、檔案年鑒、檔案主題庫等更高知識密度的檔案知識資源,即檔案知識簇,真正實(shí)現(xiàn)檔案資源有序化,有序檔案資源知識化,最終實(shí)現(xiàn)檔案知識資源服務(wù)化。
4再分析各層檔案知識,再生并利用檔案新知識
經(jīng)過檔案知識點(diǎn)的關(guān)聯(lián)與聚類、檔案知識單元的挖掘推理與語意關(guān)聯(lián)而形成的檔案知識簇已經(jīng)具備很高的知識密度,可以存入檔案知識庫中,服務(wù)于用戶高層次的檔案知識需求。然而檔案知識簇層面的檔案知識仍不是最高層次的知識實(shí)現(xiàn),還可以通過知識挖掘與推理等實(shí)現(xiàn)檔案知識的進(jìn)一步升華,即檔案知識的再生,這也是借助檔案知識單元、知識關(guān)聯(lián)、檔案信息資源等,通過挖掘、推理、演繹、歸納等方法形成新的檔案知識的過程。這一過程需要融合用戶的需求及知識組織的背景,對用戶需求及檔案知識資源進(jìn)行不同層次的細(xì)分、關(guān)聯(lián)、挖掘與推理,運(yùn)用統(tǒng)計(jì)分析、機(jī)器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)等方法,分析出新穎、有效、潛在有用的規(guī)律等新知識。比如對用戶查檔新規(guī)律的歸納進(jìn)而為用戶提供智能化推薦服務(wù),這里歸納出的新規(guī)律就是再生的檔案知識。檔案知識的再生過程也可以是從檔案知識簇到檔案知識點(diǎn)的逆向細(xì)化的過程,而在這一逆化過程的推理中也可能產(chǎn)生檔案新知識。檔案“再生知識產(chǎn)生過程中遵循有效性、新穎性、潛在有用性以及最終可理解性原則”,以保證新生的檔案知識、規(guī)律、模型等對于新的數(shù)據(jù)仍有一定的適用性,對于用戶問題的解決以及社會實(shí)踐的發(fā)展仍然具有實(shí)際效用。通過知識分析、推理、挖掘等再生的新知識在形式、內(nèi)容等方面可能存在一定的問題,需要對其進(jìn)行檢查修正,結(jié)合檔案用戶實(shí)際使用狀況及反饋等情況適當(dāng)調(diào)整新知識,按照標(biāo)準(zhǔn)的規(guī)則修正再生的檔案新知識,然后直接放入檔案知識庫中服務(wù)于用戶。
5呈現(xiàn)檔案知識庫,打造檔案知識服務(wù)平臺
經(jīng)過知識組織形成檔案知識庫,接下來就是將其呈現(xiàn)并服務(wù)于用戶,即構(gòu)建檔案知識服務(wù)層,這一層表現(xiàn)為檔案知識服務(wù)平臺。檔案知識服務(wù)平臺是連接用戶與檔案知識資源的門戶,是檔案信息資源知識組織結(jié)果的呈現(xiàn)形式,包括用戶數(shù)據(jù)采集分析系統(tǒng)、多功能檢索系統(tǒng)和可視化呈現(xiàn)系統(tǒng)三個主要模塊。
首先是構(gòu)建用戶數(shù)據(jù)采集分析系統(tǒng),該系統(tǒng)一方面用于采集分析用戶的檢索請求、反饋意見等,將其分析、推理為標(biāo)準(zhǔn)詳細(xì)的知識檢索語言,并將分析結(jié)果進(jìn)行標(biāo)記與存儲;另一方面,該系統(tǒng)可以采集用戶檔案知識需求信息與使用行為信息,并將其傳遞于檔案知識組織層,用于構(gòu)建用戶行為分析數(shù)據(jù)庫。
其次是構(gòu)建多功能檢索系統(tǒng),包括知識點(diǎn)檢索系統(tǒng)、知識單元檢索系統(tǒng)、知識簇檢索系統(tǒng),分別對應(yīng)用戶不同知識密度的檢索請求。知識點(diǎn)檢索系統(tǒng)主要針對用戶關(guān)于事件、概念、檔案原件等較低知識密度問題的檢索分析,知識單元檢索系統(tǒng)主要適用于用戶關(guān)于檔案文摘、檔案題錄、案卷分析等較高知識密度問題的檢索分析,知識簇檢索系統(tǒng)則主要適用于用戶關(guān)于檔案年鑒、檔案主題庫、檔案綜述、檔案使用規(guī)律等更高知識密度問題的檢索分析。經(jīng)過數(shù)據(jù)采集分析系統(tǒng)處理的檢索語言到達(dá)多功能檢索系統(tǒng)后,該系統(tǒng)迅速將其推理匹配于相應(yīng)檢索層次,然后將檢索分析結(jié)果傳遞于檔案知識庫,并在其中進(jìn)行用戶檢索請求與目標(biāo)資源的匹配,然后將檢索結(jié)果以可視化的方式多元呈現(xiàn)于用戶。
最后是構(gòu)建可視化呈現(xiàn)系統(tǒng),分為檢索結(jié)果的多元呈現(xiàn)、知識導(dǎo)航系統(tǒng)、知識地圖服務(wù)等形式。經(jīng)過檔案知識庫匹配符合用戶需求的目標(biāo)資源需要經(jīng)過可視化呈現(xiàn)系統(tǒng)予以多元化呈現(xiàn),包括文本、圖片、知識脈絡(luò)圖、知識關(guān)聯(lián)地圖等豐富形式,還可為用戶提供相關(guān)檔案知識、相似檔案知識、相似需求查詢等關(guān)聯(lián)推薦服務(wù),將豐富的檢索內(nèi)容人性化呈現(xiàn)于用戶。對于檔案知識需求模糊、檔案知識水平不高的用戶,可借助知識導(dǎo)航系統(tǒng)與知識地圖服務(wù)檢索所需的檔案知識!皺n案知識導(dǎo)航系統(tǒng)是引導(dǎo)用戶,使用檢索工具、檔案知識資源庫等獲取所需檔案知識的服務(wù)系統(tǒng)!倍R地圖服務(wù)則可以“用可視化圖形等格式告訴用戶在哪里或怎么樣可以找到所需的知識資源”。通過檔案知識服務(wù)平臺,檔案知識資源庫中的知識資源得以更好地呈現(xiàn)于用戶,有效地促進(jìn)了檔案知識資源服務(wù)化宗旨的真正實(shí)現(xiàn)。
隨著大數(shù)據(jù)趨勢的日益深入,為解決檔案信息服務(wù)平臺的信息組織方式與人們?nèi)找嬖鲩L的知識服務(wù)需求之間不相匹配的矛盾,需要對檔案信息資源進(jìn)行知識組織,構(gòu)建檔案知識庫。通過檔案知識庫的構(gòu)建,使得檔案資源知識化,知識資源有序化,這就可以使用戶避免在浩瀚的檔案信息海洋中搜尋所需的檔案信息,而是以檔案知識的形式推送并呈現(xiàn)于用戶面前,節(jié)省用戶時間,提升服務(wù)效率,最終實(shí)現(xiàn)知識服務(wù)化的宗旨。
參考文獻(xiàn):
[1]楊力,姚樂也.數(shù)字檔案館知識組織層次體系探討[J].檔案學(xué)通訊,2009(5):58~60.
[2]黃靜.檔案信息服務(wù)知識導(dǎo)航研究[D].南寧:廣西民族大學(xué),2008.
【淺析知識組織視野下檔案知識庫的構(gòu)建思路】相關(guān)文章:
關(guān)于新課程視野中生命課堂的構(gòu)建的論文07-03
淺析行業(yè)知識商圈的研究07-03
淺析初中歷史翻轉(zhuǎn)課堂現(xiàn)實(shí)構(gòu)建與實(shí)踐07-03
當(dāng)代視野下審視的城市雕塑發(fā)展論文07-03
談機(jī)械制造專業(yè)體系構(gòu)建思路分析論文07-03