Oct 3, 2008

LIS 97.10.01

本週邀請到本所姐妹校 Univ. of Wisconsin at Milwaukee 穆祥明教授來訪,演講的主題是Bibliographic Latent Semantic Indexing: No Blames On Users(書目隱性語義索引:使用者無錯),說明除了單純關鍵字比對之外的檢索方式及目前實作的情形(雖然我完全不懂SVD在算什麼)。

人沒有資訊不能活

不知道為什麼在寫這篇心得的時候,我的腦中突然浮現一句大學老師的一句話:「人沒有資訊不能活。」那時還是小大一,聽了沒什麼感覺。但後來發現真的是天天都在處理資訊的問題,對我們更是家常便飯,在這也呼應於第一堂課我們是為解決資訊問題而存在。

是誰在做這件事

隱性語義索引 (LSI:Latent Semantic Indexing)可用來彌補單純關鍵字比對的缺失,將文獻與文獻之間隱含的關係、潛在的「特徵」關聯起來,並解決一詞多義或一義多詞的問題。這使得原本不會從關鍵字查尋得到的資料,得以被發掘,可用來補強現今關鍵字查詢的不足。

在這邊我比較在意的是,是誰去做這件事,找出那些關係跟特徵以及促使我最先看到什麼資訊的人,本身之專業知識是否足夠判斷這件事。就像圖書館選擇買什麼書讀者就看什麼一樣,圖書館用什麼分類讀者就記什麼類號,那些類號對大部份的讀者而言是沒有意義(它只是被放在一個叫494的架子上,然後再記類似的書都放在494的附近),當然也有一些耳聰目明的讀者會很直接地來告訴你「你分錯了!」然而LSI又比類號的判別更需要專業性。

我是為你好

以80/20來說,80%不知道自己要找什麼資料的人,20%有足夠的判斷力知道自己要什麼的人;80%非圖資背景的人,反之20%圖資背景,其中5%是又會找資料的人。簡言之,很多網路服務其實都不是為那20%的人而設計。(但矛盾的是有些地方又像是為那20%的人而量身打造,常常上演我是為你好,你為什麼不要呢的戲碼)

後記:其實一直想要避免自己寫出鬼打牆的心得,但學習的還不夠,所以先盡力地記錄觀察囉。

No comments: