學術期刊綜合評價研究

前言:尋找寫作靈感?中文期刊網用心挑選的學術期刊綜合評價研究,希望能為您的閱讀和創作帶來靈感,歡迎大家閱讀并分享。

學術期刊綜合評價研究

1引言

作為傳播科學思想、呈現研究成果和科技水平的一種重要媒介,學術期刊在促進科學知識的創新、科技成果的轉化以及社會科技的進步等方面發揮著重要的作用。不同的學術期刊(以下簡稱“期刊”)有著不同的影響力。期刊的影響力通常指在一定時間內該期刊所發表的學術文獻對后續某段時間內相關科學研究與應用的促進能力,即反映期刊對知識創新的影響程度。期刊影響力的大小通常由某種或某些文獻計量學指標來度量。好的期刊影響力度量對總體評估期刊的學術質量、宏觀考量期刊的辦刊定位與出版策略具有非常重要的參考意義。期刊影響力本質上來源于學術文獻的科學價值與應用價值的大小,但同時也受到該段時間內社會對其價值的認知水平與認同程度、期刊內容的多樣性、學科發展程度、以及期刊自身及其相關渠道的傳播與擴散能力等諸多因素制約,所以對其做出客觀、準確的定量分析是一個具有挑戰的任務?,F有研究工作試圖開發一個合理的期刊影響力度量指標。最常見的期刊影響力度量指標是由美國已故著名學者加菲爾德博士提出將影響因子。目前,許多學者將影響因子作為衡量期刊影響力的指標,認為影響因子越大,期刊影響力就越大。于挨福等利用面板數據建立多元回歸模型,分析了期刊基金論文比、期刊的類型等指標對期刊影響因子的關系;俞立平等利用散點圖、回歸分析和分組統計的方法,系統研究了基金論文比、平均引文數、引用半衰期等指標與影響因子之間的關系;俞立平等基于分位數回歸模型,分析了期刊時效性等指標對期刊影響因子的關系。然而,隨著各個學科知識創新日漸加速、跨學科研究日趨普遍、文獻出版方式日呈多樣化及知識傳播速度日益加快,只使用影響因子來衡量期刊影響力存在一定的缺陷。探索可以較為全面反映學術期刊質量和影響力的新型度量指標,越來越受到學術界的重視。Braun等首次將h指數用于衡量期刊的學術影響力,李啟正等對紡織學科期刊的h指數、總被引頻次和影響因子進行相關性和回歸擬合分析。Egghe提出的基于h指數改進的g指數用于評價期刊影響力,張壘等則利用灰色關聯分析法和相關性分析法分別研究h指數、g指數和影響因子與載文數、被引頻次等指標的相關關系。特征因子的概念由Bergstrom等提出并用于期刊的影響力評價,俞立平等采用面板數據模型研究了期刊影響因子、總被引頻次等文獻計量指標對特征因子的影響關系。我國學者邵作運等在載文量的基礎上來計量被引頻次,提出了一種新型指標f(x)指數評價期刊影響力,然后采用Spearman相關系數分析了f(x)指數與總被引頻次、影響因子等指標的相關性。中國科學文獻評價研究中心在2013年的《中國學術期刊影響因子年報》中,提出一個全新的評價指標:學術期刊影響力指數(AcademicJournalCloutIndex,CI),該指標一種綜合總被引頻次和影響因子的非線性綜合指標。丁筠首次對期刊影響力指數進行了分析,并采用Pearson相關系數研究了CI與影響因子等傳統指標的關聯性。楊浦對學術期刊影響力指數CI進行了非線性分析。目前公認,期刊的影響力是多個方面因素的綜合影響結果,其影響因素指標體系是由一系列具有內在關聯的評價指標所構成。綜合各種指標的期刊影響力評價方法能夠從多個層面反映出期刊影響力的實際情況。近年來,越來越多的研究趨向于利用期刊的多種計量指標對其進行影響力進行綜合評價。程慧平利用主成分分析與熵權TOPSIS方法進行了綜合指標學術影響力評價。俞立平綜合多種文獻計量指標提出了隔年影響因子和隔年h指數。張發明和王偉明運用因子分析和誘導密度算子對學術期刊組合評價。張和平和陳齊海分別利用因子分析-DEMATEL定權法對期刊進行綜合評價。俞立平等對學術期刊影響力指數CI進行了改進研究。綜述所述,從影響力評價指標研究方法上看,盡管多數學者采用相關系數、線性回歸、因子分析等線性分析方法能夠對期刊影響力進行綜合評價,然而這些方法卻無法捕獲期刊計量指標直接的非線性關系。另外,盡管CI提供了一種非線性關系影響力綜合評價指標,但是它主要由影響因子和總被引頻次兩個指標確定,并且受發文量的制約。一個影響因子接近0的期刊短期快速提高CI的最好途徑就是無限增加發文量。為了抑制這種盲目行為,量效指標(JournalMassIndex,JMI)能夠抑制發文量對CI值的過度影響。然而,JMI人工干預過多,其中的參數選擇具有太多主觀性。在人工智能和機器學習領域,深度學習不僅能夠表達變量之間的高度非線性關系,而且能夠壓縮多個變量的關系從而為期刊影響力提供一個可視化的表達和分析。目前在期刊綜合評價領域,尚未有深度學習模型的應用。因此,本文運用深度學習中的自編碼器模型對期刊影響力的影響因素進行系統地定量研究、可視化分析,并應用其為缺少CI值的期刊進行CI預測。

2方法

2.1數據選取

本文數據來源于2017年中國學術期刊影響因子年報(人文社會科學),以公布的“法律”學科中94種期刊為研究樣本。針對其中的每一個期刊,本文選擇學術期刊影響力指數(AcademicJournalCloutIndex,簡稱CI)、期刊量效指數(Jour⁃nalMassIndex,簡稱JMI)作為學術期刊指數(簡稱指數),選擇復合類指標、綜合類指標、人文社科影響因子指標、出版指標、引證指標、網絡傳播指標等多類指標體系作為學術期刊因素(簡稱因素)。“法律”學科總共包含2種指數和24種因素。因為少量期刊缺失個別因素的數據,需要對數據進行篩選。本文采用如下篩選方案:剔除存在缺失數據的因素。經統計,“復合5年影響因子”等7種因素存在缺失數據。此外,《中外法學》、《清華法學》和《比較法研究》的“引用半衰期”并非確切數值(如“>20”)均已20替代。經過數據篩選,篩選方案最終選擇的因素體系如表2所示。另外,針對《安徽警官職業學院學報》缺失CI數值的情況,本文將在后續的實驗中給出其在篩選方案下的CI預測值。

2.2數據預處理

因為所有期刊影響力因素的取值范圍差異很大,比如復合總被引的數值量級可達上萬,而復合影響因子的數值量級只有10左右,所以本文采用數據標準化來減少計算誤差。

2.3深度自編碼器

以神經科學為支撐點,深度學習具有表達變量之間的高度非線性關系的能力,已經被成功地應用在計算機視覺、機器翻譯等諸多領域。深度自編碼器(以下簡稱自編碼器)作為深度學習領域的重要組成部分,是一種無監督的深度神經網絡。它不僅能夠表達高維非線性變量關系,而且能夠將其壓縮為低維關系,從而為期刊影響力提供一個可視化的表達和分析。在實際應用當中,自編碼器具有重建過程簡單、可堆疊多層等優點。自編碼器由輸入層、編碼解碼隱含層和輸出層組成。其中,輸入層和輸出層維度(神經元數目)相等,輸入層和隱含層之間構成編碼器,輸入信號x∈Rd通過編碼過程在編碼隱含層產生含數據特征的激勵a∈Rm,解碼隱含層和輸出層之間構成解碼器,a通過解碼過程得到重構信號y∈Rd。在本文中,x代表期刊,用d個期刊因素表示,y表示重構之后的期刊。自編碼器的訓練目標是使原始輸入y≈x,從而獲取數據中最重要的信息。

2.4CICI和JMI的定義

2013年中國科學文獻計量評價研究中心和清華大學圖書館提出了一種學術期刊影響力指數(AcademicJournalCloutIndex,簡稱CI),能夠對學術期刊影響力進行綜合評價。它將期刊在統計年的總被引頻次(TC)和影響因子(IF)進行組內線性歸一化后并進行向量平均計算所得的數值,用于對組內期刊排序。期刊的CI值越大,該期刊距離組內“影響力最大期刊”的差距越小,即該期刊影響力越大。在2017年發表的“中國學術期刊影響因子年報(人文社會科學)”(以下簡稱“年報”)中,的CI值均乘以1000。以“法學”學科的期刊組為例,組內影響力最大的期刊是《中國法學》,它的總被引頻次和影響因子均為組內最高,因此α=β=k=1,從而CI值為1414.214。然而,CI定義中只采用了TC和IF,并未考慮其它計量指標,如即年指標、半衰期等。一個影響因子接近0的期刊短期快速提高CI的最好途徑就是無限增加發文量。為了抑制這種盲目行為,提出了新的量效指標(JournalMassIndex,JMI)來修正CI值。然而,JMI人工干預過多,k的選擇具有太多主觀性。本文擬利用深度自編碼器綜合復合類指標、綜合類指標、人文社科影響因子指標、出版指標、引證指標、網絡傳播指標等多類計量指標體系,并在深度自編碼器生成的學術期刊隱元空間內調查期刊學術影響力CI的分布,從而幫助期刊進行學術影響力排名。

3實證分析

3.1兩兩因素的相關性分析

針對前述17種期刊因素,我們進行了兩兩因素相關性的統計分析,使用Spearman相關系數對該相關性進行度量。結果表明,在136個Spearman相關系數中,12.5%的相關系數大于0.90,18.38%的相關系數大于0.8,36.03%的相關系數大于0.7,48.53%的相關系數大于0.6,54.68%的相關系數大于0.5。更為重要的是,因素的兩兩相互關系可分為以下四種類型:近似獨立關系、簡單線性關系、單調非線性關系、以及復雜非線性關系。圖2分別展示了這四種關系的一個示例。每種關系具體描述如下:(1)近似獨立關系。即一種因素與另一種因素幾乎無關。例如,“可被引文獻比”與“基金論文比”之間,“可被引用文獻量”與“基金論文比”之間。特別地,“可被引文獻比”與其它所有的因素的相關性均很小,Spearman相關系數絕對值的平均值僅為0.1097。(2)簡單線性關系。這種關系通常存在于各種影響因子相關因素之間。例如,“復合影響因子”與“復合他引影響因子”之間,“復合影響因子”與“綜合他引影響因子”之間,“復合影響因子”與“人文社科影響因子”。其中“復合影響因子”和“復合他引影響因子”之間的Spearman相關系數高達0.9924。(3)單調非線性關系。有些因素之間表現為近似單調曲線關系。例如,“被引期刊數”和“總下載量(萬次)”之間;“復合總被引”與“被引期刊數”之間。兩對因素的Spearman相關系數分別高達0.9515和0.9632。(4)復雜非線性關系。有些因素之間呈現為復雜的非線性關系。例如,“基金論文比”與“被引半衰期”之間;“他引總引比”與“互引指數”之間。此類關系無法使用常規的相關系數表示。綜上所述,大多數期刊因素之間不僅存在較高的線性相關性,而且存在單調和復雜的非線性關系。本文將利用深度自編碼器去除蘊含在多個因素間的冗余信息、刻畫其中的非線性關系,將多個因素映射到一個三維隱元空間內,從而進一步分析綜合因素與期刊學術影響力指標的關聯關系。

3.2期刊影響力指數可視化分布

針對篩選方案中的17種指標因素,應用三層自編碼器進行變換,其中輸入層的神經元數目與指標因素的數目一致,等于17;中間編碼隱含層的神經元數目分別為50和25,輸出層的神經元數目為3。具體網絡結構,請參見圖1。最終,將94種期刊經過自編碼器將其17種指標映射到三維隱元空間,每一個期刊的前三個隱元值分別被視作其三維坐標值。如圖3-a所示,所有期刊可被呈現在三維空間中,其中三個隱元軸分別標記為X、Y和Z,每一個圓點表示一種期刊。利用自編碼器綜合多種因素的隱元空間可以對期刊學術影響力進行評價。為了驗證其有效性,我們對比了2017年《中國學術期刊影響因子年報》(人文社會科學)中提出:學術期刊影響力指數(CI)及其修正的期刊量效指標(JMI)。我們設計了一種可視化方案來進行對比:代表期刊的圓點的直徑與該期刊CI值的自然對數值成正比;同時采用從深藍色逐漸過渡到深紅色的色譜來表示此自然對數值從小到大的變化。圖3-b,圖3-c和圖3-d展示94個法學期刊分布在隱元空間中經過可視化處理之后的三維空間視圖和兩種二維平面視圖。從圖3中,我們觀察到了幾個重要的現象。首先,所有期刊分布在一條曲線上附近。沿著該線,期刊的CI值在總體上呈現明顯的變化趨勢。特別地,根據第一隱元軸,隨著X值從小到大變化,CI值逐漸增加。兩者之間的Spearman相關系數為0.911,p值為0。第二隱元軸Y和第三隱元軸Z與CI的Spearman相關系數分別為0.8961和0.8453。因此,CI與隱元空間高度正相關。換句話說,CI值可以由期刊隱元空間推測獲得。利用這一點,可為無法計算或缺失CI值的期刊提供CI值預測。其次,根據X的數值,這些期刊可以分為三個梯隊。第一個梯隊由《中國法學》和《法學研究》組成,它們的X值大于0.38,對應的CI值分別為1414.214和1235.893,占據CI排名的前兩名。屬于第二梯隊的X值位于[0.23,0.31]之間,該梯隊中的前三位期刊是《中外法學》、《法學》和《法商研究》,其對應的CI值分別為696.566,658.358和578.78。第三梯隊由其它期刊組成,其中排列最后兩位的期刊是《中國刑警學院學報》和《武漢公安干部學院學報》,它們的CI值分別為5.203和1.4。因此,這條期刊分布線可以作為學術期刊影響力評價線,它提供了一種學術期刊影響力可視化評價方法。最后,《法制與社會》顯得與眾不同,它遠離期刊分布曲線,是屬于指標值異常的離群期刊?!斗ㄖ婆c社會》的復合總被引(11596)、期刊綜合總被引(1427)、可被引文獻量(5131)、引用期刊數(2510)、被引期刊數(1370)、總下載量(128.94萬次)都非常高,遠超于其它期刊。然而在所有法學類期刊中它卻具有較小的CI值(11.208)和最小的JMI值(0.019)。為了抑制片面追求總被引頻次盲目擴大發文量CI利用JMI進行了校正,從而可對單一指標的一般性奇異行為具有較好的抑制效果。在這一點上,自編碼器隱元空間是與CI值是一致的。不同的是,CI值是基于人工來設定校正系數的,而本文方法是自動識別的??梢赃M一步利用異常程度(距離遠近)來設定懲罰或矯正系數。偏離越遠、異常程度越大。

3.3自編碼器的應用—預測自編碼器的應用—預測CI值

在本節,我們直接應用深度自編碼器對期刊進行CI值預測。在2017年《中國學術期刊影響因子年報》(人文社會科學)中并未提供《安徽警官職業學院學報》的CI值。針對缺失CI值,我們選擇與CI值相關性最大的隱元空間第一隱元X作為基準,預測《安徽警官職業學院學報》的CI值。我們觀察到,按照CI值從大到小排布時,除了《安徽警官職業學院學報》之外的93種法學期刊的CI值呈現非線性分布。通過曲線擬合得出其分布擬合函數為冪指數f(x)=1846x-0.3416-441.5,如圖4-a所示。因為如果直接利用具有冪指數分布特性的CI值和第一隱元X的關系進行預測,在預測過程當中會由數值差異較大而引起較大的計算誤差,所以我們采用CI的自然對數值來減少計算誤差。

4結語

本文以94種法學期刊為研究樣本,運用深度自編碼器模型對學術期刊的影響力進行了系統地定量研究和可視化分析。首先,分析了復合類指標、綜合類指標、人文社科影響因子指標、出版指標、引證指標和網絡傳播指標等六大類指標包含的17種期刊因素的兩兩相互關系。結果表明,期刊因素的兩兩相互關系存在以下四種類型:近似獨立關系、簡單線性關系、單調非線性關系、以及復雜非線性關系。其次,利用深度自編碼器去除蘊含在多個因素間的冗余信息并刻畫其中的非線性關系,將多個因素映射到一個三維隱元空間內,從而進一步分析綜合因素與期刊學術影響力指標的關聯關系。結果表明,法學期刊在三維隱元空間內呈現顯著曲線分布,這條分布線可以視作學術期刊影響力評價線,不僅與學術期刊影響力指數CI密切相關,而且能夠對學術期刊自動分組,同時能自動發現異常期刊。最后,利用期刊的隱元坐標和期刊的CI值,建立擬合函數,預測《安徽警官職業學院學報》的缺失CI值。結果表明,隱元空間第一隱元X與與CI值相關性最大,同時CI值呈現冪指數分布規律;以此作為基準,所建立的二階有理數分式擬合函數能夠有效地預測《安徽警官職業學院學報》的CI值??偠灾?,本文提出了一種新的多因素期刊學術影響力綜合評價方法,同樣也適用于其它學科的學術期刊,其結論可以為期刊學術影響力建設提供借鑒意義。

亚洲精品一二三区-久久