- 相關(guān)推薦
非結(jié)構(gòu)化WEB數(shù)據(jù)庫(kù)與圖書(shū)館多媒體信息資源的組織利用論文
【內(nèi)容提要】針對(duì)傳統(tǒng)關(guān)系數(shù)據(jù)庫(kù)在處理非結(jié)構(gòu)化多媒體WEB信息中所存在的問(wèn)題,結(jié)合圖書(shū)館多媒體數(shù)據(jù)庫(kù)的特點(diǎn)及特定技術(shù)要求,介紹了非結(jié)構(gòu)化WEB數(shù)據(jù)庫(kù)的技術(shù)特點(diǎn)及其在組織與利用館藏多媒體信息資源中的作用。
【摘要題】信息資源建設(shè)
【關(guān)鍵詞】非結(jié)構(gòu)化WEB數(shù)據(jù)庫(kù)/多媒體/信息資源/組織利用/關(guān)系數(shù)據(jù)庫(kù)
【正文】
1 非結(jié)構(gòu)化WEB數(shù)據(jù)庫(kù)簡(jiǎn)介
非結(jié)構(gòu)化WEB數(shù)據(jù)庫(kù),是指其字段長(zhǎng)度可變,并且每個(gè)字段的記錄又可以由可重復(fù)或不可重復(fù)的子字段構(gòu)成的基于INTERNET、INTRANET的數(shù)據(jù)庫(kù),用它不僅可以處理結(jié)構(gòu)化數(shù)據(jù)(如數(shù)字、符號(hào)等信息)而且更適合處理非結(jié)構(gòu)化數(shù)據(jù)(全文文本、圖象、聲音、影視、超媒體等信息)并在互聯(lián)網(wǎng)上發(fā)布。非結(jié)構(gòu)化WEB數(shù)據(jù)庫(kù)主要是針對(duì)非結(jié)構(gòu)化數(shù)據(jù)而產(chǎn)生的,與以往流行的關(guān)系數(shù)據(jù)庫(kù)相比,其最大區(qū)別在于它突破了關(guān)系數(shù)據(jù)庫(kù)結(jié)構(gòu)定義不易改變和數(shù)據(jù)定長(zhǎng)的限制,支持重復(fù)字段、子字段以及變長(zhǎng)字段并實(shí)現(xiàn)了對(duì)變長(zhǎng)數(shù)據(jù)和重復(fù)字段進(jìn)行處理和數(shù)據(jù)項(xiàng)的變長(zhǎng)存儲(chǔ)管理,在處理連續(xù)信息(包括全文信息)和非結(jié)構(gòu)化信息(包括各種多媒體信息)中有著傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)所無(wú)法比擬的優(yōu)勢(shì)。
2 圖書(shū)館多媒體信息資源的特點(diǎn)及組織利用中的技術(shù)要求
2.1 圖書(shū)館多媒體信息的數(shù)據(jù)量非常大,象館藏影視資料和各種多媒體教育資料,其動(dòng)態(tài)圖象信號(hào),每秒可達(dá)數(shù)兆字節(jié),一段幾分鐘的MP3音樂(lè)也有幾兆字節(jié),即使經(jīng)過(guò)壓縮、也十分巨大。如何對(duì)多媒體海量數(shù)據(jù)進(jìn)行有效地組織、存儲(chǔ)并構(gòu)成WEB數(shù)據(jù)庫(kù)提供給用戶網(wǎng)上使用,技術(shù)要求很高。
2.2 館藏多媒體信息的數(shù)據(jù)類型很多,包括各種圖文數(shù)據(jù)、聲音數(shù)據(jù)、影視數(shù)據(jù)、超媒體數(shù)據(jù)、多種格式的隨書(shū)光盤(pán)等等,其數(shù)據(jù)長(zhǎng)度不固定,結(jié)構(gòu)上的差異大,使得處理這些數(shù)據(jù)十分困難,要求數(shù)據(jù)庫(kù)既能夠處理可變長(zhǎng)度字段又能夠處理可重復(fù)的子字段。
2.3 多媒體信息處理在時(shí)間上要求很高,多媒體信息中的聲音和動(dòng)態(tài)圖像對(duì)時(shí)間特別敏感,在使用這些信息時(shí),必須保證其時(shí)間上的要求,否則將會(huì)使這些信息失真甚至變得毫無(wú)意義。
2.4 開(kāi)發(fā)利用館藏多媒體信息資源經(jīng)常要多種信息集成描述,比如某種多媒體,既有圖像,又有聲音,還有文字說(shuō)明,這樣就會(huì)改變傳統(tǒng)的數(shù)據(jù)庫(kù)操作形式和數(shù)據(jù)庫(kù)接口,尤其對(duì)圖文并茂的數(shù)據(jù)庫(kù)的建立和查詢,需要統(tǒng)一語(yǔ)義描述。
基于多媒體信息資源的上述特點(diǎn),要想使館藏豐富的多媒體信息資源得到充分利用,滿足信息用戶不斷增長(zhǎng)的信息需求,對(duì)多媒體信息處理提出了不同于普通信息處理技術(shù)的新要求:
(1) 多媒體數(shù)據(jù)庫(kù)元數(shù)據(jù)存儲(chǔ)技術(shù)要求
我們知道音頻、圖象、視頻等多媒體信息數(shù)據(jù)是非結(jié)構(gòu)化的,它們不能用簡(jiǎn)單的數(shù)字解析式表示,多媒體數(shù)據(jù)庫(kù)必須取得基于這些媒體對(duì)象內(nèi)容及信息特征的解釋,才能完成存儲(chǔ)及應(yīng)用,這些解釋就稱為元數(shù)據(jù),通過(guò)對(duì)元數(shù)據(jù)的歸類、整理、實(shí)現(xiàn)標(biāo)準(zhǔn)化的存儲(chǔ)是多媒體信息資源組織利用的關(guān)鍵。多媒體數(shù)據(jù)庫(kù)元數(shù)據(jù)存儲(chǔ)技術(shù)要求包括:文本元數(shù)據(jù)的存取,語(yǔ)音元數(shù)據(jù)的存取,圖象元數(shù)據(jù)的存取,視頻元數(shù)據(jù)的存取等方面的技術(shù)要求。
(2) 多媒體數(shù)據(jù)庫(kù)結(jié)構(gòu)字段設(shè)計(jì)與數(shù)據(jù)記錄處理方面的要求
a.允許可變長(zhǎng)字段、可重復(fù)字段、子字段和MARC字段。
b.數(shù)據(jù)庫(kù)記錄的數(shù)目與記錄長(zhǎng)度,字段數(shù)目與字段長(zhǎng)度,字段可重復(fù)次數(shù)不應(yīng)受到限制。
c.允許建立可以快速存取的倒排文件和多媒體、多語(yǔ)言記錄表。
d.數(shù)據(jù)庫(kù)可自動(dòng)接受和產(chǎn)生MARC和ISO2709記錄格式的文件,并且滿足對(duì)MEDADATA數(shù)據(jù)模式的支持功能。
(3) 基于WEB的多媒體信息檢索與信息發(fā)布的技術(shù)要求
隨著用戶對(duì)于信息需求的大量增加,以及對(duì)于多媒體信息的實(shí)效性要求,基于WEB的數(shù)據(jù)庫(kù)信息存儲(chǔ)的檢索越來(lái)越傾向于多媒體全文信息檢索的查詢語(yǔ)言,并且對(duì)于檢索結(jié)果的需求也側(cè)重于多媒體全文信息的獲取。與此同時(shí),WEB數(shù)據(jù)庫(kù)的信息發(fā)布形式開(kāi)始更多地過(guò)渡到通過(guò)網(wǎng)絡(luò)瀏覽器以多媒體電子文檔的方式(B/S)傳輸給網(wǎng)上用戶。也要求利用多媒體WEB傳輸技術(shù),向用戶提供主動(dòng)的特定多媒體信息的推送服務(wù)。
3 非結(jié)構(gòu)化WEB數(shù)據(jù)庫(kù)的特點(diǎn)及其在組織與利用多媒體信息資源中的作用
3.1 豐富的數(shù)據(jù)類型與靈活的數(shù)據(jù)結(jié)構(gòu),滿足多種類型館藏多媒體數(shù)據(jù)結(jié)構(gòu)組織
根據(jù)非結(jié)構(gòu)化多媒體數(shù)據(jù)信息的特殊性,非結(jié)構(gòu)化WEB數(shù)據(jù)庫(kù)在進(jìn)行存儲(chǔ)和管理多媒體信息時(shí),整個(gè)數(shù)據(jù)庫(kù)的管理機(jī)制擯棄了傳統(tǒng)結(jié)構(gòu)化關(guān)系數(shù)據(jù)庫(kù)對(duì)于信息采取定長(zhǎng)和結(jié)構(gòu)化定義和管理的局限,它從多媒體數(shù)據(jù)模型入手,采用子字段、多值字段以及變長(zhǎng)字段的機(jī)制,允許創(chuàng)建許多不同類型的非結(jié)構(gòu)化或任意格式的字段,從而突破了關(guān)系數(shù)據(jù)庫(kù)非常嚴(yán)格的表結(jié)構(gòu),解決了關(guān)系數(shù)據(jù)庫(kù)模型過(guò)于簡(jiǎn)單,不便于表達(dá)復(fù)雜嵌套的問(wèn)題。非結(jié)構(gòu)化WEB數(shù)據(jù)庫(kù)在數(shù)據(jù)類型上不僅支持字符型、數(shù)值型數(shù)據(jù),而且由于具有很強(qiáng)的外部文件支持功能,使其可以支持如超長(zhǎng)文本、圖像、聲音、動(dòng)畫(huà)等多種多媒體擴(kuò)展數(shù)據(jù)類型。與傳統(tǒng)關(guān)系數(shù)據(jù)庫(kù)相同之處是非結(jié)構(gòu)化WEB數(shù)據(jù)庫(kù)的數(shù)據(jù)結(jié)構(gòu)也是建立在二維表的基礎(chǔ)之上的,但它與關(guān)系數(shù)據(jù)庫(kù)不同的是:(1)非結(jié)構(gòu)化WEB數(shù)據(jù)庫(kù)二維表的屬性長(zhǎng)度是不可變的,在列的維度上可以隨意擴(kuò)展,這就能較好地滿足多媒體數(shù)據(jù)處理時(shí),需要靈活的可變長(zhǎng)字段的要求。(2)非結(jié)構(gòu)化WEB數(shù)據(jù)庫(kù)由于支持重復(fù)字段、子字段,使其可以在數(shù)據(jù)庫(kù)記錄中實(shí)現(xiàn)二維嵌套,解決了非結(jié)構(gòu)化多媒體數(shù)據(jù)結(jié)構(gòu)復(fù)雜、可能存在重復(fù)字段和多個(gè)嵌套子字段的問(wèn)題。(3)非結(jié)構(gòu)化WEB數(shù)據(jù)庫(kù)一個(gè)字段可以存放關(guān)系數(shù)據(jù)庫(kù)的一張表,它可以在一張表中壓縮關(guān)系數(shù)據(jù)庫(kù)中一對(duì)多的關(guān)系,因此利用非結(jié)構(gòu)化WEB數(shù)據(jù)庫(kù)能很好地實(shí)現(xiàn)多種多媒體數(shù)據(jù)庫(kù)的集中組織與管理。
3.2 基于廣域網(wǎng)的圖書(shū)館海量多媒體數(shù)據(jù)庫(kù)存儲(chǔ)管理機(jī)制的實(shí)現(xiàn)
圖書(shū)館多媒體信息資源數(shù)據(jù)庫(kù)是海量數(shù)據(jù)庫(kù),支持基于廣域網(wǎng)的海量多媒體信息存儲(chǔ)和管理是非結(jié)構(gòu)化WEB數(shù)據(jù)庫(kù)管理系統(tǒng)的主要功能之一,不僅存儲(chǔ)數(shù)據(jù)量大,而且存取速度快,同時(shí)檢索功能強(qiáng)、檢索速度快,在檢索速度方面一般不受信息量大的影響。以IBASE非結(jié)構(gòu)化數(shù)據(jù)庫(kù)為例,每個(gè)數(shù)據(jù)庫(kù)最大的記錄數(shù)可達(dá)到1000萬(wàn)條,每條記錄的最大長(zhǎng)度可達(dá)64000字節(jié)。每個(gè)數(shù)據(jù)庫(kù)最多可有800個(gè)字段。
3.3 利用多種索引方式,實(shí)現(xiàn)多媒體全文檢索、媒體特征檢索等多種檢索策略
館藏多媒體信息資源組織利用的關(guān)鍵是要實(shí)現(xiàn)多種方式的多媒體全文檢索,而要實(shí)現(xiàn)多種檢索方式,建立索引是前提,傳統(tǒng)關(guān)系數(shù)據(jù)庫(kù)支持的索引只限于單字段索引、復(fù)合索引等幾種方式,受其限制,關(guān)系數(shù)據(jù)庫(kù)檢索能力也受到很大限制。非結(jié)構(gòu)化WEB數(shù)據(jù)庫(kù)由于有著靈活的數(shù)據(jù)結(jié)構(gòu),在其底層存儲(chǔ)機(jī)制變革的基礎(chǔ)上,采用先進(jìn)的索引倒排擋技術(shù),使它支持的索引方式比關(guān)系數(shù)據(jù)
庫(kù)要豐富得多,可以滿足極其復(fù)雜檢索的需要,實(shí)現(xiàn)對(duì)于海量多媒體信息的快速全文檢索功能,它支持字段索引、子字段索引和全文索引甚至可以支持人工標(biāo)引索引,中英文混合索引等方式。配合非結(jié)構(gòu)化數(shù)據(jù)庫(kù)的格式化語(yǔ)言,可以對(duì)同一字段進(jìn)行若干種不同的索引,以滿足特殊檢索的需求,實(shí)現(xiàn)多種檢索策略。例如IBASE非結(jié)構(gòu)化數(shù)據(jù)庫(kù)管理系統(tǒng)目前支持8種不同的索引方式,可以涵蓋所有關(guān)系數(shù)據(jù)庫(kù)所提供的90%以上的檢索方式,同時(shí)還提供了包括簡(jiǎn)單檢索、組合檢索、字段檢索、右截?cái)鄼z索、全文檢索、擴(kuò)展檢索、相關(guān)檢索、集合檢索、媒體特征檢索等等大量關(guān)系數(shù)據(jù)庫(kù)所不具備的檢索方式和檢索策略。
3.4 集成WEB服務(wù)器和數(shù)據(jù)庫(kù)服務(wù)器,實(shí)現(xiàn)多媒體網(wǎng)絡(luò)信息發(fā)布與多種服務(wù)功能
關(guān)系數(shù)據(jù)庫(kù)在基于因特網(wǎng)應(yīng)用時(shí),由于結(jié)構(gòu)模型等原因的限制,不能與因特網(wǎng)完全地融合,需在WEB服務(wù)器與數(shù)據(jù)庫(kù)之間加入大量的中間件,從而在無(wú)形中加大了數(shù)據(jù)庫(kù)基于網(wǎng)絡(luò)應(yīng)用的難度,給數(shù)據(jù)庫(kù)在因特網(wǎng)應(yīng)用帶來(lái)了新的網(wǎng)絡(luò)瓶頸,應(yīng)用服務(wù)器由于與數(shù)據(jù)庫(kù)頻繁交互,其本身的效率和數(shù)據(jù)庫(kù)檢索效率易造成因特網(wǎng)應(yīng)用的阻塞。非結(jié)構(gòu)化數(shù)據(jù)庫(kù)模型全部是基于因特網(wǎng),采用WEB服務(wù)器和數(shù)據(jù)庫(kù)服務(wù)器緊密集成的方法,可以將目前傳統(tǒng)數(shù)據(jù)庫(kù)廠商由C/S結(jié)構(gòu)擴(kuò)展來(lái)的瀏覽器/WEB服務(wù)器加應(yīng)用服務(wù)器/數(shù)據(jù)庫(kù)服務(wù)的三層體系結(jié)構(gòu),集成瀏覽器/WEB數(shù)據(jù)庫(kù)發(fā)布系統(tǒng)(B/S)的因特網(wǎng)計(jì)算結(jié)構(gòu),使多媒體數(shù)據(jù)庫(kù)系統(tǒng)成為WEB的一個(gè)重要有機(jī)組成部分,實(shí)現(xiàn)在單一平臺(tái)上融合所有多媒體數(shù)據(jù)庫(kù)和應(yīng)用服務(wù)器的功能,這不僅大大減少了用戶對(duì)多媒體數(shù)據(jù)庫(kù)額外硬件、中間件和其他昂貴的集成業(yè)務(wù)的需求,而且極大地縮短了用戶開(kāi)發(fā)和采用基于因特網(wǎng)應(yīng)用的時(shí)間,有利于用戶把更多時(shí)間用于多媒體信息資源的開(kāi)發(fā)和描述,非結(jié)構(gòu)化數(shù)據(jù)庫(kù)管理系統(tǒng)可以為系統(tǒng)建設(shè)者提供快速有效的方法實(shí)現(xiàn)基于WEB的多媒體數(shù)據(jù)庫(kù)的建立和信息檢索發(fā)布,實(shí)現(xiàn)網(wǎng)上多媒體信息檢索、在線點(diǎn)播、閱讀,圖書(shū)館多媒體資源聯(lián)合編目和聯(lián)合建庫(kù)。同時(shí),利用非結(jié)構(gòu)化WEB數(shù)據(jù)庫(kù)還可以實(shí)現(xiàn)許多新的多媒體信息服務(wù)功能,如采用多媒體信息推送技術(shù)和郵件服務(wù)器功能實(shí)現(xiàn)定題服務(wù)和個(gè)性化多媒體信息服務(wù)。
【參考文獻(xiàn)】
1.朱繼團(tuán).非結(jié)構(gòu)化類型網(wǎng)頁(yè)的全文檢索
系統(tǒng)設(shè)計(jì).現(xiàn)代計(jì)算機(jī),1998(9)
2.張忠友.基于IBASE非結(jié)構(gòu)化網(wǎng)絡(luò)數(shù)據(jù)庫(kù)的IPAC圖書(shū)館網(wǎng)上資源發(fā)布與檢索系統(tǒng).中國(guó)信息導(dǎo)報(bào),2001(2)
3.張忠友.數(shù)字化圖書(shū)館與非結(jié)構(gòu)化數(shù)據(jù)庫(kù).中國(guó)信息導(dǎo)報(bào),2001(6)
4.李慧,顏顯森.數(shù)據(jù)庫(kù)技術(shù)發(fā)展的新方向——非結(jié)構(gòu)化數(shù)據(jù)庫(kù).情報(bào)理論與實(shí)踐,2001(4)
5.朱斌,宋先忠.非結(jié)構(gòu)化數(shù)據(jù)的信息服務(wù)系統(tǒng)設(shè)計(jì)方法.計(jì)算機(jī)時(shí)代,2001(7)
6.田辛玲,劉沖嬌.電子化圖書(shū)館多媒體文獻(xiàn)服務(wù)系統(tǒng)的建設(shè)與實(shí)施.現(xiàn)代情報(bào),2002(6)
7.蔡清萬(wàn).多媒體技術(shù)與數(shù)字圖書(shū)館建設(shè).圖書(shū)館工作與研究,2001(2)
8.李娟.多媒體數(shù)據(jù)庫(kù)開(kāi)發(fā).情報(bào)理論與實(shí)踐,2001(1)
【非結(jié)構(gòu)化WEB數(shù)據(jù)庫(kù)與圖書(shū)館多媒體信息資源的組織利用論文】相關(guān)文章:
利用多媒體指導(dǎo)小學(xué)生習(xí)作的論文06-30
網(wǎng)絡(luò)環(huán)境下專業(yè)圖書(shū)館信息資源建設(shè)論文07-03
Web of Science數(shù)據(jù)庫(kù)中沒(méi)有的論文就不是SCI檢索的論文么?07-03
多媒體在小學(xué)語(yǔ)文教學(xué)中的有效利用論文07-04
計(jì)算機(jī)課利用多媒體技術(shù)論文07-03
利用多媒體提高小學(xué)數(shù)學(xué)課堂效率的論文06-29
如何利用非信息技術(shù)為教學(xué)添加活力的論文07-02
探究高校圖書(shū)館多媒體微服務(wù)模式論文07-03
多媒體論文06-22