2020年12月17日 星期四

Google (Scholar) 會征服(學術傳播)的網際網路?

 

研究生命週期 (圖片來源)

這篇部落格文章的題名用了太多括弧。有人可能會說:「咦,不是早就征服了嗎?」

幾年前,某位圖資界朋友跟我說,跟研究新手介紹資料庫時,應該優先介紹A&I資料庫(索摘資料庫),再介紹特定出版社的電子期刊系統。我問:「為什麼呢?」
因為A&I資料庫是跨出版社、甚至跨文章類型廣泛地蒐集特定領域的文獻,從A&I資料庫可以得到領域的概觀。而特定出版社的電子期刊系統只能查特定出版社的(期刊)文章。

這樣說來是沒錯啦, 又不像電機領域的學者只要查IEEE就好了( 小小開玩笑,電機領域的朋友們別見怪)。

但是今年,連我們圖書館都開始思考要不要刪訂LISA (Library & Information Science Abstracts)了!經費雖然不多,但用量不怎麼樣。是因為大家查學術資料都直接用Google (Scholar)了嗎?

前幾年,資源探索服務(Web-Scale Discovery Service)剛出來的時候,有些學科館員和A&I資料庫廠商會大力疾呼不要因為訂購了資源探索服務就不訂A&I資料庫了,據說資深學者還是比較習慣特定領域的A&I資料庫,例如MedLine等等等,有個理由是因為A&I資料庫會有對於控制詞彙如MESH的加值,有助於搜尋的效能(我也搞不清楚是會增加準確度還是回現率了,應該是後者吧)。但是年輕學者真的有在用控制詞彙查找資料嗎?如果沒有,好像資源探索服務就打死了A&I資料庫。

昨日文章第一版出來之後,有不具名專業人士提供下列回饋意見:

其實應該不只是控制詞彙表,A&I出版商還有花人力、時間另外加工過更細緻的Metadata。

比如同一篇Wiley醫學文章,可能被Pubmed收錄、也同時被PsycInfo收,但這兩個資料庫Metadata編寫的側重點會不一樣,Pubmed可能放在用藥MESH的編法,PsycInfo就往心理學要的結構去寫。

我回覆了一句:「只是讀者不一定會用到這些,時代不一樣了。」卻也得到不具名專業人士正面的鼓勵:

確實,讀者是不一定用得到,但是啊,基本真的願意花時間來圖書館聽過教育訓練的人,就會發現確實不一樣,也會學會怎麼正確用,這也是我們做教育訓練的目的與成就。

只是,現在圖書館好像比較少著重在A&I資料庫的教育訓練了。 

在那個網路還不是太發達、電子全文不是太普及的時代,學者們可能先查找(光碟版)的A&I資料庫,發現相關文獻的書目資料之後,再到圖書館架上找(期刊)文章或是利用館際複印。但現在,在電子全文多如牛毛的情形下,若一篇文章看不到電子全文,可能學者們就很乾脆地放棄,另外找尋有電子全文的文獻了,應該很少學者會「獨沽一味」了,除非真的是超超超經典、重要的。畢竟人生有無數的選擇,何必單戀一枝花,哈哈。

所以,如果所有出版社的電子期刊系統都和Google (Scholar)合作,讓Google建立索引;或是如果哪天全天下的文章都Open Access了,也都被Google建立了索引,那麼A&I資料庫、資源探索服務、甚至是聚合式全文資料庫(Aggregate Database)還有存在的必要嗎?

現在看來,似乎無論商業資料庫(如EBSCO、Proquest)或非商業資料庫(如機構典藏)都會和Google (Scholar) 合作的樣子了。如此一來,A&I資料庫的機會好像就更少了?

和A&I資料庫性質相近的是引文資料庫。我最近因為研究的緣故還蠻常用的,引文資料庫因為有引用分析功能的緣故,雖然與A&I資料庫一樣主要靠OpenURL Link Resolver串聯全文,但還比較不會被市場淘汰。當然,大家也知道引文資料庫的另一個功能是做學術成就的評鑑。

講到最後,或許不會被Google (Scholar)打敗的應該是全文資料庫或電子期刊系統了。因為Google再厲害也沒有辦法獲得所有全文的授權,更何況許多全文是放在Deep Web裡(不是Dark Web)。全文怎麼來?電子期刊系統裡放的當然是出版社自己出版的期刊文章。至於全文資料庫,就仰賴資料庫廠商去爭取期刊(、研討會、專書)的授權了。在這裡也得提一下,學者在做研究時應該是以主題去資料庫搜尋,不見得也不應該一開始做搜尋時就限縮特定資料類型(如學位論文),全文資料庫就是因為包含了同一主題下各種資料類型,不管是期刊論文、電子書、研討會論文、學位論文等等,才更有價值。全文資料庫或電子期刊系統各有各的難處、各有各的經營模式,只要Profit Margin不是太過誇張,我想,我們都得承認期刊出版社或全文資料庫廠商對於學術傳播的貢獻。

談一下Open Access。目前我自己手頭上管了幾個期刊,其中有一個正在申請加入DOAJ,雖然這個期刊有自己網站,但我們很願意非專屬有償授權給全文資料庫廠商,甚至也願意全文資料庫廠商幫我們給Google或資源探索服務建置索引,畢竟

大多數學者的使用習慣不是連到單一期刊網站查找資料。而是希望One-Stop Shopping找到同主題的文章。這樣一來,透過全文資料庫廠商、Google、資源探索服務真的可以提升文章的能見度。

說來OA與非專屬有償授權間本來就不需要你死我活。

講一個現在全文資料庫廠商的經營策略 -- RE-PURPOSE

往壞處想,這叫全文資料庫廠商的無所不用其極要賺你錢。往好處想,則是全文資料庫廠商會根據客戶的需求調整讓客戶訂購的資料庫。有時候,客戶沒錢買一個全庫,或者是有特定領域的需求,這時資料庫廠商就會用某種Criteria篩出客戶有興趣、負擔得起的資料庫內容。

要我舉實例的例子也很容易... 一帶一路(One Belt One Road)、UN 2030 SDGs

試想,除非使用者很清楚地知道他要找的資料類型或來源是甚麼、在哪裡,如某期刊的全文,要不然,使用者會仰賴的就是Google (Scholar)、資源探索服務、全文資料庫。

對學者而言,要的是提升學術成果的能見度或影響力,無論是非商業性無償授權、有償授權,實在是多多益善。無償授權和有償授權間不一定非要你死我活,因為無償授權通常會有既定的標的(講白了,例如學位論文);而有償授權透過廠商靈活的Packaging、Re-Purpose會有不同於無償授權的運作模式讓學術成果打入全球的使用者端。

除非有一天,連全文資料庫和資源探索服務都被Google (Scholar)擊垮了!

還是那句老話,承認期刊出版社或全文資料庫廠商對於學術傳播的貢獻吧。 

2 則留言:

  1. 據說資深學者還是比較習慣特定領域的A&I資料庫,例如MedLine等等等,有個理由是因為A&I資料庫會有對於控制詞彙如MESH的加值,有助於搜尋的效能(我也搞不清楚是會增加準確度還是回現率了,應該是後者吧)。但是年輕學者真的有在用控制詞彙查找資料嗎?如果沒有,好像資源探索服務就打死了A&I資料庫 .

    關於這段話,我的觀察如下:

    年輕生醫領域研究者比較不會任意在Google scholar找文獻,而是會去NLM 的免費 A&I 资料庫Pubmed找文獻;但若不明白MeSH的應用,always會找到不少(通常是數量驁人的)相関文獻,但always不知道自己查得多準或多全…
    因此從大學時代,就應譲他們了解Google和PubMed的不同,以及善用MeSH對掌握「相關」研究的幫助⋯我認為這是專業醫圖館員重要的任務之一喔。

    回覆刪除