進入21世紀,隨著計算機技術(shù)、網(wǎng)絡技術(shù)、通信技術(shù)的高速發(fā)展,信息的存儲和處理能力得到迅速提高,信息量持續(xù)增長,紙質(zhì)文檔被不斷轉(zhuǎn)變?yōu)殡娮游臋n,可以說,我們正在被呈幾何量級產(chǎn)生的信息所淹沒。但大量的信息卻因為沒有經(jīng)過挑...[繼續(xù)閱讀]
海量資源,盡在掌握
進入21世紀,隨著計算機技術(shù)、網(wǎng)絡技術(shù)、通信技術(shù)的高速發(fā)展,信息的存儲和處理能力得到迅速提高,信息量持續(xù)增長,紙質(zhì)文檔被不斷轉(zhuǎn)變?yōu)殡娮游臋n,可以說,我們正在被呈幾何量級產(chǎn)生的信息所淹沒。但大量的信息卻因為沒有經(jīng)過挑...[繼續(xù)閱讀]
標引(indexing),簡單說是一種標識和引導,是對文獻是什么信息的描述;具體是指在分析文獻內(nèi)容或情報問題的基礎上,用某種索引語言或標識符號把文獻的主題概念及其他有檢索意義的特征標識出來,作為情報存儲和檢索的依據(jù)的處理過...[繼續(xù)閱讀]
標引按照使用的標引語言或標識符號的類型,可分為分類標引和主題標引;按照使用的標引設備,可分為手工標引和自動標引。1.2.2.1 分類標引分類標引,又稱文獻分類或信息分類,是依據(jù)特定的分類規(guī)則,對文獻進行分類標識的過程。分類...[繼續(xù)閱讀]
自動標引的研究至今大致經(jīng)歷了三個階段:第一階段是20世紀50年代至90年代初。這個階段主要是關(guān)于關(guān)鍵字提取方法的研究。第二階段是20世紀90年代至90年代末。這個階段傳統(tǒng)的自動標引方法的效率已達到極限,因此自動標引方法的研...[繼續(xù)閱讀]
自動標引方法主要包括統(tǒng)計標引法、語言分析標引法、人工智能標引法、網(wǎng)頁標引法、概率標引法、詞典標引法等。下面對這些方法做一詳細介紹。1.3.2.1 統(tǒng)計標引法在各類自動標引的方法中,出現(xiàn)最早且被廣泛持續(xù)使用的是統(tǒng)計標...[繼續(xù)閱讀]
1.3.3.1 自動標引方法研究的不足自動標引通過近幾十年的發(fā)展,已取得了長足的進步,但國內(nèi)自動標引的研究仍存在不足,主要表現(xiàn)在以下幾個方面。1.中文分詞算法存在缺陷找出各知識單元,是進行標引的第一步,但由于中文的特殊性,使...[繼續(xù)閱讀]
標引分為分類標引和主題標引,相對應的,標引的標準也分為分類法和主題詞法。1.4.1.1 分類法基于分類法的標引標準發(fā)展較早。早在1876年,杜威就創(chuàng)立了《杜威十進分類法》(Dewey Decimal Classfication,DDC),可以說是開辟了圖書分類法的新紀...[繼續(xù)閱讀]
元數(shù)據(jù),即數(shù)據(jù)的數(shù)據(jù),是用來描述數(shù)字化信息資源并確保這些數(shù)字化信息資源能夠被計算機自動辨析、分解、提取和分析歸納的一種框架或一套編碼體系。④基于元數(shù)據(jù)的信息資源描述標準目前使用最廣泛的有兩種:一種是使用較早...[繼續(xù)閱讀]
隨著計算機網(wǎng)絡技術(shù)以及通信技術(shù)的發(fā)展,網(wǎng)絡信息資源的數(shù)量呈幾何級增長,已經(jīng)成為信息資源的主體,因而網(wǎng)絡信息資源標引也成為現(xiàn)代信息資源標引中首先要解決的問題,其標準也在傳統(tǒng)標準的基礎上產(chǎn)生了新的變化。1.4.3.1 MARC在...[繼續(xù)閱讀]
國際標準化組織(ISO)的標準化原理委員會(STACO)將標準定義為由一個公認的機構(gòu)制定和批準的文件。它對活動或活動的結(jié)果規(guī)定了規(guī)則、導則或特殊值,供其共同和反復使用,以實現(xiàn)在預定領(lǐng)域內(nèi)最佳秩序的效果。而國家標準GB/T 3935.1—...[繼續(xù)閱讀]