網路資訊/別把語意資料庫跟關聯式混爲一談

作/道格

語意科技協助企業整合資料

別以爲語意資料庫科技只能用在BBC Online消費者服務、或是Best Buy與思科追求的網路創意等。終端用戶運算商品化過程,促成了各式各樣的創新;而語意資料庫科技也一樣,它可以爲許多企業帶來好處。

整體而言,語意資料庫(Semantic Database)有5 種主要好處:這些資料庫可以與既有的相關資料庫協同合作、它們可以相容於網路科技、其底層科技可以促成各種資料庫的整合、其資料架構設計上具備彈性。所以,它們可以協助企業應付重大的資料難題

它們的最大賣點在於資料關係持續演化的。在1980年代,我們用住家電話辦公室電話、以及寄信地址來找出人的關聯。到了1990年代,我們還會拿出手機號碼電子信箱帳號。現在,我們則透過各式各樣的網站、以及社交網路帳號產生關聯。

光是把這些識別碼連結起來還不夠,我們的系統能夠了解使用這些資訊的正確情境。也就是說,資料本身必須具備能夠讓機器理解的意涵。所以語意式科技的大前提,就是資訊必須能夠讓機器判讀。

資料在定義上必須提供意義背景脈絡,讓電腦自己就可以判讀資訊,而不需要人來解讀。這不僅是要提供一個類似XML schema的資料架構,還需要資料在本質上具有意義,讓人類與機器都能判讀。

描述資料意義的語意式科技標準稱爲「網路本體語言」(Web Ontology Language, OWL)。網路本體語言界定了一整套的資料關係描述,爲商業詞彙資料集、與資料屬性建立一套定義,產生出來的結果,就叫做「本體」。

一般來說,一間公司會建立、使用多種本體。在企業層級,本體會界定營運部門、績效、與其它核心商業概念。在系統層級,本體會界定其所管理的資料類型,以及該資料的明確屬性、還有這些屬性中內涵的架構與關係。

雖然是不同的本體,但它們之間環環相扣,系統層級的內容與企業層級的概念彼此相關。從系統的角度來看,本體代表着資料的意義與關連。本體不會建立表格或定義儲存機制;它只會傳達資料中可能存在的關聯性

在關聯式資料表中,表格中的直列會決定資料的儲存,這是很重要的一項差異。其它來源的資料,例如關聯式資料庫、重要資料儲存、以及表格等,都可以用來產生語意資料。事實上,語意式科技的核心特色就是,如果既有的關聯式資料庫架構已經夠用,那麼你就不必再重新裝載資料。

天時與人和才能突顯 語意式科技的優勢

大部分公司都已經在關聯式資料庫科技上投入大量資源,包括管理軟體、ETL工具、資料市集、資料倉儲、以及各式各樣的報告系統。所以語意式科技是否值得企業投資,建立新的基礎架構、進行訓練與資料庫重構

如要判斷自家企業是否應該考慮語意式科技,可以考量以下3種情境,在這些情境中語意式科技會是很大的利器

網路資訊.254.255期(新春號)