前言:尋找寫作靈感?中文期刊網用心挑選的期刊被引時間因子研究,希望能為您的閱讀和創作帶來靈感,歡迎大家閱讀并分享。
學術期刊作為知識媒介推動知識的傳播與交流[1],高質量的期刊通??d對應研究領域具有權威影響力的論文[2]。對學術期刊的影響力進行科學評價,有利于提升期刊質量,促進期刊長遠發展[3]。因此,科研人員不斷探尋期刊評價的新方法,其中,借用網頁之間的引用關系以確定網頁重要性的PageR鄄ank[4]是科學評價期刊較受歡迎的方法。PageRank算法最早由美國斯坦福大學研究生Page和Brin所提出[4],其核心思想是根據網頁鏈接到其他網頁和其他網頁鏈接到本網頁的引用關系來計算網頁的得分,并且根據分值進行排序[5]。網頁鏈接與期刊引用之間具有極高的相似性,科研人員將傳統的PageRank算法引入期刊評價能夠解決影響因子只考慮被引數量而不考慮被引質量的缺點[6],如蘇成等人利用傳統的PageR鄄ank算法從排除自引和不排除自引兩個角度計算Pag鄄eRank值來評價期刊影響力[7]。后來經過科研人員的不斷改進,產生了一系列改進的PageRank期刊評價方法,如Cheang等人通過區分引文類型的方法對PageR鄄ank算法進行改進,實現相同學科期刊的橫向評估[8];Yu等人提出一種基于PageRank多鏈接互相強化的期刊排名模型,該方法不僅考慮引文的數量和質量,而且同時考慮了論文、作者、期刊之間的相互強化關系[9];Yan和Ding將引文、作者等因素融入PageRank算法,提出P-Rank算法用于異構網絡中的期刊評價[10]。國內也有不少學者改進PageRank算法來評價期刊,如喻依等人利用PageRank算法和HITS算法分別計算期刊的PageRank值、權威值和中心值,探討三種值在期刊評價中的優缺點[11];蘇成等人構建能消除創刊時長和期刊載文量差異的優化PageRank算法,并探討了該算法的特性、優缺點和適用范圍[12];劉珍提出基于隨機約化算法改進的PageRank算法,將期刊之間的互引關系和引用次數結合,同時兼顧期刊之間不同的引用權重,來評價期刊影響力[13]。多數PageRank改進算法在期刊評價中已取得了不錯的效果,本文擬在PageRank算法的基礎上,用期刊被引網絡中的相對h指數對期刊被引次數加權,結合時間異質性因子,構建評價期刊影響力的新指標———CTIF-PR因子。該因子能綜合期刊的引文數量、引文質量、載文時間異質性等期刊影響力因素,使期刊影響力評價更加科學、合理。
1基于PageRank算法的期刊影響力評價模型
1.1期刊影響力
PageRank算法簡介將期刊之中的相互引用關系替換網頁之間相互引用關系[11],建立期刊之間的互引網絡矩陣,以此方法計算各期刊的PageRank值(下文用PR值代替)。
1.2修正影響因子
影響因子(一般為兩年IF)已成為國際和國內評價期刊的重要指標[14]。傳統的影響因子計算方法如公式(2)。針對以上不足,本文在影響因子的基礎上,提出了一種新的修正影響因子,即在公式(2)中載文量P不變而將被引次數C的引文年限擴展為包含統計年度在內的前兩年及后兩年,其目的是更科學地統計期刊載文年論文的被引數量。
1.3引入加權計算的時間影響因子
俞立平根據傳統影響因子時效性差、隱含權重不合理等問題[15],提出了2年時間影響因子,時間影響因子能夠根據載文時間的差別對期刊被引數量和載文量進行賦權,使影響因子計算更為科學。在修正引文年限的影響因子基礎上,結合時間影響因子計算方法,得出改進的時間影響因子,如公式(3)。
1.4建立期刊被引網絡
期刊的被引質量是評價期刊影響力的關鍵因素,不同期刊的引用價值不同,代表不同的被引質量。期刊h指數是指該期刊所發表的全部論文中最多有h篇論文至少被引用了h次[16]。本文利用李超提出的相對h指數[17]表征引用期刊的質量,首先,建期刊被引網絡,如果期刊j被i1,i2,i3…in期刊引用,那么每個引用期刊j的相對h指數在被引網絡中表示為公式(4)。。
1.5期刊影響力
CTIF-PR算法將PageRank算法用于期刊被引網絡,結合公式(1)、公式(5),得出改進的PageRank新算法,即CTIF-PR算法,見公式(6)。由于PR值的結果和CTIF計算的結果數量級相差較大,我們對期刊的PR值進行了歸一化處理。
2實證研究
2.1數據來源及處理
本文數據來自中國知網CNKI數據庫,在CNKI數據庫下載圖書情報領域的61種期刊論文,檢索時間為2015年1月-2016年12月,去除單年載文量少于30篇的期刊,最終選取44種圖書情報領域期刊(《大學圖書館學報》《國家圖書館學刊》《情報雜志》《情報理論與實踐》《圖書與情報》《中國圖書館學報》等)。為方便表述與計算,給44種期刊編號。下載統計44種期刊2015年、2016年兩年內載文的被引數據,被引年限區間設為2015年1月至2019年10月,排除期刊自引后,根據公式(7)建立期刊間的互引矩陣:淤根據44種期刊2016年的被引關系建立期刊互引矩陣,如表2所示(部分);于根據44種期刊2015年和2016年兩年的被引關系建立期刊互引矩陣,如表3所示(部分)。利用公式(6)計算44種期刊的CTIF-PR值,為對比分析,同時利用傳統的PageRank算法計算44種期刊的PR值。CTIF-PR值排名與PR值排名結果如表4所示(部分)。
2.2結果分析
2.2.1PR值與CTIF-PR值評價結果的排名與對比分析
從表4可以看出,PR值排在前五位的期刊為《圖書情報工作》《農業圖書情報學刊》《圖書館學刊》《新世紀圖書館》《圖書館研究與工作》,這些期刊是在2015年和2016年與其他期刊互引關系最密切的期刊,上述期刊2015年、2016年的載文不僅被其他多個期刊引用,而且也在后續發表的文章中引用了其他多個期刊的論文?!吨袊鴪D書館學報》《圖書情報知識》《圖書與情報》等這幾個優秀期刊的PR值并不高。究其原因在于:淤大部分期刊載文量高。由于每個期刊載文量較大,且都同屬于一個學科大類下,所以期刊之間的互引關系差別并不明顯,因而PR值的差值并不大。于個別優秀期刊引文量低,被引量高。如《中國圖書館學報》作為圖書情報領域的優秀期刊,雖被其他多種期刊引用,但因其引用其他同領域非核心期刊論文較少,導致其評價效果并不理想。CTIF-PR值排名與PR值排名相比,上升變化大于20名的期刊有《中國圖書館學報》《大學圖書館學報》《圖書情報知識》《圖書與情報》《圖書館雜志》《情報學報》,究其原因主要有三點:淤載文量低,被引量高,典型的例子是《中國圖書館學報》《圖書情報知識》以及《大學圖書館學報》,這三種期刊2015年和2016年的載文量非常低,公式(6)時間影響因子CTIFj的表達式[見公式(5)]中,載文量P在分母中,顯然P值越小,CTIF-PR值越高。于載文量高,被引量高,典型代表是《圖書館雜志》和《圖書與情報》,這兩種期刊的被引量極高,且在該期刊的互被引網絡中被h指數高的期刊引用次數也非常多,因此,這兩種期刊的排名上升。盂載文量低,被引率高,如《情報學報》,該期刊PR值較低的原因是,該期刊主要刊載情報學中新算法及實踐應用的文獻,很少涉及圖書館學領域概念,導致與偏向圖書館學研究方向的期刊沒有引用關系,所以其PR值低,但加入CTIF因子后,其被引期刊都是被引次數大,h指數高的期刊,因此該期刊上升名次較多。下降變化大于20次的期刊有《圖書館學刊》《圖書館研究與工作》《農業圖書情報學刊》《河南圖書館學刊》。其原因有兩點:淤載文量過高,《圖書館學刊》《農業圖書情報學刊》《河南圖書館學刊》三種期刊都因其2015年、2016年的載文量都為800篇左右,相比于其他期刊的載文量高很多,導致CTIF值低,因此下降的幅度大。于被引量過低,《圖書館研究與工作》期刊2015年、2016年的載文被其他期引用次數僅為136次,且136次引文是較為平均的分布于其他期刊,其在未來幾年的載文也較多地引用了其他期刊2015年和2016年的載文,導致其PR值排名高。但136次的引文量相比其他期刊的引文量要低得多,公式(6)時間影響因子CTIFj的表達式[見公式(5)]中,引文量C在分子中,顯然C值越小,CTIF-PR值越低。
2.2.2CTIF-PR與影響因子的敏感性對比
為說明CTIF-PR因子的評價效果,繪制44種期刊的CTIF-PR值與各期刊對應的影響因子(2017年)排名變化圖。從圖1可知,CTIF-PR因子與影響因子總體上的排名趨勢具有相似性,如在影響因子排名處于第一、第三位的《中國圖書館學報》(R)和《圖書情報知識》(M)兩種期刊,在CTIF-PR排名中仍然處于第一、第三位;在影響因子排名處于后面幾名的期刊,如《當代圖書館》(AI)、《貴圖學苑》(AK)、《科技文獻信息管理》(AO)、《圖書情報論壇》(AM)等其排名變化名次僅為一或保持不變。但是就各期刊而言,也有一定的差異,如情報學領域期刊《情報雜志》(E)、《數據分析與知識發現》(G)、《中華醫學圖書情報雜志》(T),這三種期刊的CTIF-PR排名較影響因子排名有較大的降低,而圖書館學領域期刊《圖書館建設》(H)、《新世紀圖書館》(W)、《晉圖學刊》(AG)的CTIF-PR排名較影響因子排名有較大的升高。從CTIF-PR與影響因子排名變化中可以發現,大部分圖書館學領域的期刊排名都有所上升,大部分情報學領域的期刊排名都有所下降。由此可推測:2015年1月至2019年10月間,圖書情報學領域的期刊載文中引用2015年1月至2016年12月間圖書館學領域的載文較多,而引用相同時間段內的情報學領域的載文較少。
2.2.3CTIF-PR與影響因子的相關性分析
對44種期刊的CTIF-PR值與影響因子進行Spearman相關性分析。從表5可知CTIF-PR因子與影響因子(2017年)的相關性系數為0.882,具有高度相關性。二者相關性高的原因在于,CTIF-PR因子是在影響因子的基礎上進行改進,擴展了期刊的被引年限使載文充分達到引用峰值,并且融入期刊引文鏈接關系、載文時間異質性、期刊質量等因素計算而來的,同時也說明了CTIF-PR因子的合理性。
2.2.4CTIF-PR與影響因子的區分度分析
利用變異系數(C)進一步分析44種期刊CTIF-PR與影響因子區分程度。變異系數是衡量一組數據中各觀測值變異程度的統計量[19],具體計算公式表示為(7)。
3結語
本文在PageRank算法的基礎上,提出一種融入被引時間因子的期刊評價因子———CTIF-PR因子。從因子的設計原理上看,CTIF-PR因子對期刊影響力的評價更全面,主要表現在:淤該因子對傳統影響因子引文年限進行擴展,能保證被評價期刊的載文年論文達到引用峰值;于在引文鏈接基礎上,突出被評價期刊本學科領域內互引關系,綜合期刊被引質量、被引數量、載文時間異質性等多種期刊影響力因素,使評價結果更加科學;盂在一個期刊的被引網絡中通過利用相對h指數對期刊的引用質量進行加權,能夠區別不同期刊對研究期刊的貢獻度;榆融入時間異質性計算加權時間影響因子,能綜合不同期刊的引用數量和期刊自身載文量,且具有較強的時效性。從因子的評價效果看,對圖書情報領域44種期刊的評價結果顯示,核心期刊排列在前,非核心期刊排列在后,且在期刊評價中比影響因子具有較好的時效性、更高的敏感性和區分度。因此說,CTIF-PR因子能夠科學、合理地評價期刊的影響力。本研究仍有不足之處,如期刊的引用是發表晚的論文引用發表早的論文,本文在建立引文網絡時,只從被引關系的角度考慮待研究期刊兩年載文的被引期刊,而沒有考慮期刊兩年載文所引證的期刊。后續研究中,我們將考慮從期刊引證關系建立互引網絡,以進一步提高期刊影響力評價的科學性和合理性。另外,本文僅以圖書情報學期刊為例分析CTIF-PR因子的應用效果,在他學科領域的期刊評價中是否有效尚需做進一步研究。