前言:中文期刊網精心挑選了全文檢索范文供你參考和學習,希望我們的參考范文能激發你的文章創作靈感,歡迎閱讀。
全文檢索范文1
作者簡介:張維剛(1980-),男,湖北咸寧人,講師,博士研究生,CCF會員,主要研究方向:多媒體技術、信息檢索; 徐永東(1974-),男,黑龍江雞西人,副教授,博士,主要研究方向:自然語言處理、自動文摘; 雷小強(1986-),男,湖南耒陽人,碩士研究生,主要研究方向:信息檢索; 何輝(1978-),男,山東濟寧人,工程師,博士研究生,主要研究方向:可信計算、嵌入式計算。
文章編號:1001-9081(2011)08-02261-04doi:10.3724/SP.J.1087.2011.02261
(1.哈爾濱工業大學(威海) 計算機科學與技術學院,山東 威海264209; 2.華中科技大學 計算機科學與技術學院,武漢430074)
()
摘 要:為了更好地為Web站內檢索提供服務,對Web全文檢索的關鍵技術進行了研究,設計并實現了一個用于Web全文檢索的中間件。該中間件通過多線程網頁爬蟲程序來抓取網頁;對抓取結果采用基于Bloom-Filter的大規模URL去重算法來進行高效消重;應用所提出的新的基于標簽的正文提取方法來進行網頁正文提取,實驗結果表明該正文提取方法是有效可行的;此外,為了改善用戶的搜索體驗,該中間件還提供了一些個性化搜索輔助功能。最后,實現了一個完整的博客搜索系統Boso(博搜)來驗證中間件的性能,結果說明該中間件是可以投入實際應用的。
關鍵詞:Web全文檢索;中間件;URL去重;網頁標簽;正文提取
中圖分類號: TP391.3文獻標志碼:A
Design and application of middleware for Web full-text retrieval
ZHANG Wei-gang1, XU Yong-dong1, LEI Xiao-qiang2, HE Hui1
(1. School of Computer Science and Technology, Harbin Institute of Technology at Weihai, Weihai Shandong 264209, China;
2. School of Computer Science and Technology, Huazhong University of Science and Technology, Wuhan Hubei 430074, China)
Abstract: To provide better Web search services, the key techniques of the full-text retrieval were studied and a middleware was designed and implemented. By using a multi-thread website crawler program, the Web pages of the given URLs were collected. Bloom-Filter algorithm was employed to get rid of large-scale duplicate URLs in the collected Web pages. A new content extraction approach based on the Web tags was presented to extract the full-text content of Web pages for indexing and searching. The experimental results verify the efficiency of the content extraction method. Furthermore, to improve the search experience of users, many personalized search assistances were provided by this middleware. Boso, a blog search engine, was developed to test and verify the presented middleware. The results show that the presented middleware can be applied to actual search engines.
Key words: Web full-text retrieval; middleware; URL filter; Web tag; content extraction
0 引言
隨著Web技術的迅速發展,信息量不斷增大,如何快速準確地搜索到所需信息則成為亟須解決的問題。近十年來,隨著搜索引擎技術的誕生和快速發展,傳統的大型搜索引擎已經能夠提供良好的大規模搜索服務。但是,這些大型引擎對于單一的或者某個特定的站點則顯得不夠精確。它們不關注深度遍歷一個特定網站,因此很難提供優質的站內檢索服務。此外,傳統的大型搜索引擎更新速度較慢,因此給出的很多搜索結果并不是最新的網站頁面。同時,由于站點內容及形式的多樣性,傳統搜索引擎難以控制輸出。例如,按照某種特定規則進行檢索結果排序等一些個性化操作在傳統搜索引擎上則難以實現。
現在期望通過分析不同類型網站的網頁布局特點,對網頁數據源依次進行網頁抓取、URL去重、正文提取等操作,并對提取結果建立索引,同時在應用層面上提供簡單易用的程序接口,構建出Web全文檢索中間件,就可以通過這個中間件來開發出滿足個性化需求的Web站內全文檢索服務來。這在實際應用中是非常有意義的。本文在這方面做了一些嘗試工作。本文主要針對Web站內搜索問題,提出了一個Web全文檢索中間件的架構模型;對中間件中所涉及的一些關鍵技術如多線程網頁爬蟲、大規模URL去重和正文提取等做了一些研究。特別是針對網頁的正文信息,提出了一種新的基于標簽的正文提取方法;利用這些關鍵技術,整合Lucene[1]工具包開發實現了一個Web全文檢索中間件,并實現了一個完整的博客搜索系統――Boso來驗證該中間件的性能。
1 全文檢索中間件架構模型
圖1給出了網站全文檢索中間件的架構模型圖。整個中間件由信息采集模塊、信息處理模塊和全文檢索模塊組成。各個模塊的簡要描述如下。
1)信息采集模塊。該模塊主要是負責對Web網頁進行多線程抓取并對抓取所得到的URL進行去重處理。在該模塊中,采集接口面向Web網站,只需給定抓取的起始URL,即可通過寬度優先搜索策略完成整個站點所有網頁的抓取。
2)信息處理模塊。該模塊包含兩個主要內容,一是對采集到的網頁內容進行正文提取,采用所提出的基于標簽的正文提取方法來實現;另一方面就是對提取結果進行分詞并且建立索引,其中分詞功能是通過使用中文分詞組件JE-Analysis[2]來實現。
3)全文檢索模塊。全文檢索模塊提供了用戶檢索功能的接口,其內部封裝了全文檢索、用戶檢索條件解析、對檢索結果進行排序以及若干提高用戶體驗的個性化操作功能,如搜索關鍵詞智能提示、相關關鍵詞搜索和高級檢索等。
圖1 Web全文檢索中間件架構模型
2 關鍵技術
本文所提出的Web全文檢索中間件用到的關鍵技術有:快速網頁抓取,通過一個多線程的網頁爬蟲程序來自動快速抓取網頁;大規模URL去重,使用Bloom-Filter對大規模URL進行去重,避免對相同網頁重復抓取和處理;新提出的基于標簽的正文提取方法,用于正確提取網頁的正文內容和全文檢索的實現。
2.1 多線程網頁抓取
網頁抓取是通過網頁爬蟲程序來實現的。為了提高搜索效率,爬蟲被設計成多線程的。多個線程并發地在網絡上協同工作,既可以充分利用網絡寬帶,又能夠利用多線程的并發性來降低Internet高延遲的副作用,并發抓取網頁。
網頁爬蟲采用寬度優先搜索策略。先搜索完一個Web頁面中所有超鏈接,繼而搜索下一層頁面,直到底層為止。這就保證了對淺層的優先處理。當遇到一個無窮盡的深層分支時,也就不會陷進去出不來了。此外,寬度優先搜索策略還能在兩個HTML文件之間找到最短路徑。
在實現網頁爬蟲時,必須構建多個隊列并根據不同狀態進行隊列選擇:
1)等待隊列。網頁爬蟲在解析HTML文件過程中會不斷獲取新的超鏈接,需要構建一個等待隊列來保存這些超鏈接,以備后續網頁的訪問及抓取。
2)運行隊列。由于采用多線程并發方式,因此需設計一個運行隊列來保存當前正在運行的多個URL抓取動作。
3)錯誤隊列。爬蟲遇到網頁抓取錯誤時,如正被抓取的網頁不存在或多個網頁鏈接構成環路導致進入死循環,則需去除此類鏈接,不再對它進行任何處理。這樣,需要創建一個錯誤隊列來保存這樣的鏈接。
4)完成隊列。為了避免對同一URL進行重復訪問,一個用于保存已成功抓取過的URL隊列是必不可少的。當爬蟲訪問一個新URL時,先查看URL完成隊列,若該隊列不包含此URL,則允許爬蟲訪問;否則跳過,進行下一個新URL的訪問及抓取。
圖2給出了上述四個隊列的運行狀態轉換圖。同一時刻一個URL只能處于一個狀態。
2.2 大規模URL去重
文獻[3]中通過維護兩個隊列來實現URL去重,但對于Hash函數的構造則采用傳統MD5算法,數據量很大時,空間占用問題將成為瓶頸。本文使用Bloom-Filter[4]對大規模URL進行去重[5]。其核心思想是利用多個不同Hash函數來解決“沖突”。結合Hash表的數據結構,運用一個足夠好的Hash函數將一個URL映射到二進制位數組中的某一位。這樣就可以得到Bloom-Filter映射圖,如圖3所示。如果該URL所對應的二進制位值為1,則表示該URL已存在,可去重處理;否則,表明該URL不存在,應把對應位由0置為1,可進行網頁抓取。
圖2 狀態轉換示意圖
圖3 Bloom-Filter映射圖
Hash存在一個沖突(碰撞)[5]的問題,用同一個Hash函數得到的兩個不同URL的Hash值有可能相同。為了減少沖突,引入了多個Hash函數來對同一個URL計算多個Hash值。若其中有一個Hash值在映射圖中所對應二進制位為0,那么該URL肯定不重復;只有當所有Hash值對應位為1時才表明該URL是重復的,應進行去重[6-8]。選擇適當的Hash函數個數,就可使得碰撞發生概率降低到可以接受的程度。
在運用Bloom-Filter進行大規模URL進行去重時,每個URL都要計算多個Hash函數值,因此Hash函數的選擇是很重要的。文獻[9]評價了5種Hash函數,并對它們的URL映射性能進行了比較分析,結果顯示Strhash和Tianlhash的性能較佳;文獻[10]給出了兩種針對URL散列性能很好的函數HfIp和Hf,并通過2000萬URL的實驗進行了評價。結果表明,HfIp是可靠的,并在北大天網搜索引擎系統中得到工程性的驗證。因此在本文所描述的網站全文檢索系統中也采用HfIp作為Hash函數。HfIp函數代碼[10]描述如下:
unsigned int HfIp(char* url, int size) {
unsigned int n0;
char* b(char*)&n;
for (int i0; i
b[i%4]^url[i];
return n%size;
}
2.3 基于標簽的正文提取
對于正文提取,文獻[11]提出了一種基于統計的正文提取方法,在一定范圍內能夠較好地提取正文,但是其有一定的局限性,即只能針對Table布局的網頁進行提取。文獻[12]提出了一種基于包裝器自動生成模板的正文提取方法,具有一定的通用性,但是鑒于網頁的復雜性,該方法在準確率方面還有待提高。本文所新提出的基于標簽的正文提取方法能夠較好地提取網頁的正文內容。
基于標簽的正文提取方法主要有以下步驟。
1)首先用正則對HTML頁面作初步處理,即去掉所有的修飾性標簽如、等以及網頁樣式定義CSS代碼或者引用JavaScript的標簽和除正文外的超鏈接標簽,正文中的超鏈接不能直接刪除,將其格式化成“鏈接文本(超鏈接)”,這樣能夠正確反映原始網頁正文的語義信息。
2)對于經過初步處理完后的HTML頁面,就只剩下若干段可能包含正文的子HTML文本塊。通過觀察發現,剩下的子HTML文本塊中,有兩類顯然不可能是網頁正文,應去除。一類是大部分文字由超鏈接標簽包圍的說明性文字或者超鏈接文本內容構成(如類似于廣告和圖片的描述性內容,這些不能算作正文);另一類是文本塊長度偏短即所包含的文字數偏少,也可認為不是網頁正文。去除這兩類子文本塊后,就可以得到網頁的候選正文塊了。
首先去掉廣告及圖片說明類非正文子HTML文本塊。具體的量化去除方法是統計出每個子文本塊中超鏈接標簽之外的所有漢字總數T,再統計出每個子文本塊中被超鏈接標簽所包圍的說明漢字數量S;計算比值RT/S。如果R小于某個閾值K,則應去除。由于網頁構成的多樣性,閾值K的取值需要視具體測試對象而定。其次,要去除文字偏少的非正文HTML文本塊。具體方法為:統計出子文本塊中非網頁標簽包圍的所有漢字字符總數也就是子文本塊長度W。若W小于某個閾值N,則去除之。
3)從候選正文塊中選擇文字數最多也就是最長的子文本塊作為整個HTML頁面的正文,抽取出來用于后續處理。
基于標簽的正文提取方法描述如下:
String getMainContent(s) {
輸入字符串網頁字符串s;
用正則表達式去掉一些無關標簽,同時格式化超鏈接標簽;
初始化一個保存子文本塊集合的鏈表;
while(true) {
讀入字符串s的下一個字符a;
if(a-1) {
提取結束;
break;
}
else if(a為開始標簽)
push (a的位置);
else if(a為結束標簽) {
pop (b);
strs.subString(b, a);
將子文本塊str保存到鏈表;
}
}
移除鏈表中R小于閾值K和W小于閾值N的子文本塊,鏈表中只剩下候選正文塊;
對鏈表中剩余候選正文塊按長度W值升序排列;
取鏈表最后一個元素也就是長度最長的候選正文塊,去掉所有網頁標簽,作為網頁正文輸出;
}
針對基于標簽的正文提取算法,為了驗證其性能,取新浪博客.cn上所抓取的網頁作為測試集做了實驗。通過大量的對比實驗,在最后的測試中取K為1。圖4給出了基于標簽的正文抽取算法的準確率P與閾值N之間的關系圖。從圖中可以看到,當閾值N選擇在180左右時,正文抽取準確率最高。
表1給出了基于標簽的正文提取算法在一些博客型網頁上所取得的實驗結果。其中,閾值K1,閾值N180。從表1可以看出,抽取.cn和的正文內容的準確率較高;而的準確率則較低,其主要原因是上的博客文字較少,也就是正文內容較少;其他的則比較均勻??偲骄鶞蚀_率為95.8%,這說明所提出的基于標簽的正文提取算法是可行有效的。
圖4 信息抽取閾值選擇分布
表1 信息抽取實驗結果
對于提取出的網頁正文內容,借助于分詞組件JE-Analysis[2],進行分詞和構建索引。該JE分詞組件提供了Lucene分詞接口,支持分詞粒度控制和英文、數字、中文混合分詞,并能夠自定義詞庫,分詞速度較快,可以很方便集成到中間件中。此外,為了更好地改進用戶的搜索體驗,該中間件中還集成了一些個性化功能,如結果的相關度排序、時間排序、搜索關鍵詞提示和高亮顯示、檢索結果數目預估、在初步搜索結果中再次細化檢索等,多個搜索關鍵詞之間還支持加(+),減(-)和非(~)運算。
3 博客搜索系統Boso
為了驗證Web全文檢索中間件的性能,本文開發實現了一個完整的博客搜索系統――Boso(博搜)。Boso系統能夠針對博客網站給用戶提供專門的內容搜索服務。Boso采用J2EE技術結合MVC架構,利用Web全文檢索中間件,采用Java語言開發實現。圖5給出了Boso的系統架構。
圖5 Boso系統架構
1)表示層。用于生成用戶訪問的Web頁面,包括博客搜索引擎的搜索界面、結果的返回頁面、高級搜索頁面,搜索引擎進行初始設置或者調整服務器功能的一些頁面,都集中在表示層。簡單地說,表示層就是該系統與各種用戶的人機接口。
2)邏輯層。邏輯層位于系統的服務器端,包含眾多的功能模塊,是實現Boso和搜索服務功能的核心層次。表示層中提出的各種功能都通過邏輯層相應的代碼模塊實現。邏輯層的設計包含兩個主要的內容:一是面向Internet的網頁信息自動采集功能,通過一個專門的多線程爬蟲程序來實現,并把采集的頁面信息存儲在下面的數據存儲層中;另一個則是分析用戶條件,進行組合搜索,將檢索結果按照特定的緩存策略進行緩存,同時對給予用戶展示的結果按照時間排序或者相關度排序。邏輯層的設計是實現系統健壯性、可重用性、可擴展性和可維護性的關鍵因素。
3)數據存儲層。數據存儲層主要是負責將網頁爬蟲采集到的HTML頁面進行URL去重,然后用本文所描述的基于標簽的正文提取方法對頁面正文進行遞歸地提取,將提取結果封裝成對象的形式,利用Lucene為其建立倒排索引,在索引文件中存儲相應的數據。
圖6給出了Boso的一次搜索界面截圖。
圖6 博客搜索系統Boso的檢索結果截圖
Boso系統還借助本文所述的Web全文檢索中間件上的一些輔助的個性化功能如相關度排序、時間排序、搜索關鍵詞提示和高亮顯示和檢索結果數目預估等來提供對應的更便捷的用戶檢索接口,來改善優化用戶的使用體驗。
4 結語
本文針對Web站內檢索問題,提出一個全文檢索中間件的解決方案。對中間件設計和實現中的關鍵技術進行了研究,包括多線程的網頁爬蟲、基于Bloom-Filter的大規模URL去重和網頁正文內容提取。特別是從網頁布局的角度來分析正文所處的位置,提出了簡單可行的基于標簽的網頁正文抽取方法。實驗表明該方法能夠取得較高的正文提取正確率,是有效的,可引入實際應用中。此外,針對該全文檢索中間件,通過實現的博客搜索系統Boso驗證了其性能。
但由于信息抽取非常復雜,對于網頁結構的復雜性,要做到100%準確是不可能的,但是如何能夠最大限度地提高正文提取的準確率還需進一步研究。并且如何進一步使得中間件的對外接口更簡單高效,更容易快速整合到Web站點中提供站內搜索服務,這也是后續需要繼續完善的工作。
參考文獻:
[1] Lucene. Lucene開源工具包[EB/OL]. [2011-01-25]. .
[2] JEsoft. JE中文分詞組件JE-Analysis [EB/OL]. [2011-01-10]. .
[3] 鄒永斌,陳興蜀,王文賢.一個高性能Web資源收集系統的設計與實現[J].計算機科學,2008,35(4B):339-341.
[4] BLOOM B H. Space/time trade-offs in hash coding with allowable errors [J]. Communications of the ACM, 1970, 13(7): 422-426.
[5] 周登朋.搜索引擎的結果聚類研究[D].上海:上海交通大學,2007.
[6] 肖明忠,代亞非.BloomFilter及其應用綜述[J].計算機科學,2004,31(4):180-183.
[7] MITZENMAEHER M. Compressed bloom filters [C]// Proceedings of the Twentieth Annual ACM Symposium on Principles of Distributed Computing. New York: ACM Press, 2001: 144-150.
[8] 宮學慶.基于BloomFilter的路徑表達式查詢處理[D].上海:復旦大學,2006.
[9] 吳麗輝,白碩,張剛,等.Web信息采集中的哈希函數比較[J].小型微型計算機系統,2006,27(4):673-676.
[10] 李曉明,鳳旺森.兩種對URL的散列效果很好的函數[J].軟件學報,2004,15(2):179-184.
全文檢索范文2
1 關于存儲架構
1.1 存儲架構結構
圖1是非常經典的公司數據存儲和密文全文檢索模型,在這一模型內包含有兩個參與者和專門使用服務器。
上述架構中的首要參與者為公司,公司需要將數據資源放置于云上,公司內有著相應的員工和專用服務器;其次就是云存儲的服務商,主要任務為對公司的數據資源和索引文件等完成存儲;專用服務器的主要作用為:頒發各種訪問控制證書;為上傳文明文本數據建立全文索引,并且對關鍵詞進行加密;加密提交的數據文檔資源;加密處理提交的關鍵詞;增加、闡述和更新數據,對訪問的控制權限以及云存儲索引表進行體現。
1.2 數據加密、檢索的程序
公司中的每一名員工都有專門的服務器所頒發證書,其中對員工的相關屬性信息實行了反應。當員工需要對數據進行上傳時,將數據和相關類別的證書實現數據解密策略,并將其提供至專門服務器上,隨后實行相應的處理。為數據的機密性提供良好的保障,并且很好的對用戶上傳希望存儲和加密的數據進行加密。并且公司員工可以檢索公司大量數據,并且采用專用服務器首先針對數據實行文明建檔再檢索,隨后加密索引表內的關鍵詞,加密后的密文和文件需要被上傳到云存儲平臺上,在該方式的作用下,云存儲服務商便不能得知和查詢中內的關鍵詞和存儲文件具體內容。
2 加密數據和檢索密文
在圖1中,主體公司要加密數據資源同時還要建立相應的索引實現建立,此外還要查找和解密。通過上述方法可以對兩種比較關鍵的技術實現查找。
2.1 密文訪問控制
在過去的不對稱非加密算法內,只能夠利用私鑰加密公鑰實現對密文數據的解密。這就不能實現密文數據的企業內共享。文章對Bethencourt等人所提出的密文規則實行了相應的參考,該方案的基本思想是:密文和私鑰分別為屬于屬性集S和S’相關。屬性集S和S’間的相交屬性個數最小值是k的情況下,容納與其中的屬性集S’私鑰能夠解密加密包含中的屬性集S密文。在CP-ABE訪問控制策略下借助數據屬制定程序,隱含在密文內,這樣使用這一方法針對數據進行加密,對使用哪些策略進行確定,并且對相應的密文數據實行訪問。基于該點可以符合文章內數據加密和密文全文檢索上傳儲存。企業中的用戶將一個詳細的數據進行提交了之后,其他的企業相關用戶可以通過一樣的數據權限來訪問該數據。
Bethencourt等人提出了CP-ABE,反應了能夠實行非對稱密鑰數據加密,但是效率比較低,很難解決內容量較大的工作。對此文章采用的是混合機密機制,在實施了相應的改造后,服務器首先在隨機下產生密鑰K。隨后針對K實時加密對稱,并借助密鑰K實現CP-ABC的非對稱加密,將該算法的效率進行了提升。
2.2 密文檢索
在加密關鍵詞的全文檢索基礎上,第一步是要實現文明數據和加密屬性集,并且要將這一數據提交至專門的服務器內,并且對文明數據實時逐一的分詞,經過這一階段之后,最終可以得到相應的關鍵詞,通過加密方法寫入至索引文件內,索引文件對相應的機密關鍵詞進行了記錄,此外還對關鍵詞的所在位置和對應數據進行了記錄。對此,要想實現在一致性的機密方式下實現對檢索詞的加密。匹配加密后的檢索詞和索引文件中的關鍵詞,如果能夠匹配則可以對相應加密密文找出來,同時進行下載,若是未實現成功,則實現了相應權限解密,這一屬性對數據文檔屬性策略進行了滿足,則能夠找到到相應明文。
全文檢索范文3
Apple系列的Spotlight
Spotlight搜索是iOS內置的一項搜索功能,他和內置應用無縫融合,比如它可以搜索通訊錄、 郵件、提醒事項、語言備忘錄、信息、音樂、視頻等等。要對Spotlight進行設置,需要前往“設置/通用”。輕按“Spotlight”選項,按住右側“ ”上下拖移,可以設定搜索結果類別的順序,輕按名稱可以“啟動/取消”對該程序檢索,從而設定“搜索”所搜索的內容區域(如圖1)。
Spotlight使用Metadata搜索引擎,它被設計為可以找到任何位于電腦中的檔案,包含文件、圖片、音樂、應用程序,也可以是文件或是PDF中指定的字。Spotlight和傳統搜索主要的差異,在于Spotlight是使用索引(Index Search)的方式,而傳統搜索是傳統的文件掃描方式;Spotlight就像是電腦里面所有的文檔建立一個目錄,里面存放索引文件,而要搜索的時候是去搜索這個目錄中的索引文件,所以減少了文檔掃描的時間,而傳統掃描則是把整個文檔內容掃描一遍,所以Spotlight在理論上來說,還是無法取代傳統搜尋功能的。
若要使用Spotlight,在Mac OS X中,只需按一下屏幕右上角的Spotlight,在出現的欄位中輸入你想要尋找的字串(如圖2),或在 Finder、系統偏好設定或支持此功能的應用程序視窗內的搜尋欄位中,輸入你的搜索字串。例如,若你想要找出Mac上所有jpeg圖片,鍵入“*.jpg”;輸入朋友的電子郵件地址及一些關鍵字,便可從朋友寄來的信件之中,找出主題符合你指定關鍵字的電子郵件。而在iPad和iPhone中,則更加簡單,你只需在屏幕任意位置,向下滑動即可(如圖3)。
從你開始輸入的時候起,系統就開始顯示它所找到的文檔,并將搜索結果分門別類(包括文件、影像及 PDF 文件),你輸入的字越多,搜索結果就越精確。
Windows下最強文件搜索神器 Everything
相比Windows下的其他搜索工具,Everything 無論是體積、索引數據庫的大小,還是內存占用都是暫時我所見到最強的!Everything的體積才5百多KB,我硬盤上有300GB的數據,索引數據庫僅有4.85MB(如圖4),而內存占用僅為17MB左右,可以說是完勝其他的搜索工具了。
文件列表功能
在最近的版本中,Everything 增加了一個名為“文件列表”的新功能,你可以將一些完整的文件路徑保存成一個文件列表供搜索之用。譬如你可以將U盤、移動硬盤連接上之后,將其內的所有文件保存成一個“文件列表”文件 (.efu格式),然后在 Everything 的“設置/索引/文件列表”里面添加這個文件列表讓Everything加載它(如圖5)。這樣操作之后,即便平時沒有連接該移動硬盤,一樣可以搜索到它里面的文件!
Everything高效搜索技巧之“與”“或”
在Everything的搜索框中可以輸入多個關鍵詞,以空格分開,表示搜索結果要包括全部關鍵詞。大家肯定對這種做法不會陌生,因為它正是搜索引擎的慣例。對應“與”的還有“或”(OR)運算,用半角豎線表示:|。當你不確信關鍵詞的準確描述時,這種方式非常有用。
Everything的原理與局限
初接觸Everything的你一定會好奇為什么它能快得這么離譜。其實Everything 并沒有全部逐一掃描我們硬盤上的文件,而是通過讀取NTFS文件系統中的USN日志來完成的。NTFS文件系統中的 USN 日志記錄了系統對NTFS分區中的文件所做的所有更改。對于每一卷,NTFS 都使用 USN 日志來跟蹤有關添加、刪除和修改的文件的信息。感興趣的朋友可以研究一下這個USN日志。由于Everything的工作原理是基于NTFS文件系統的,也就是它不能在 FAT32 的文件系統上使用了,這是 Everything 的一個局限之處。
安卓平臺的免費文件快速搜索工具 Search Everything
雖然名字和功能相類似,但Search Everything應用和Windows上的Everything并無關系,它并不是 Everything 的 Android版(如圖6)。
Search Everything 是 Android 平臺上一款免費小巧的快速文件搜索應用,可以在毫秒級的瞬間搜索手機中所有文件或目錄(文件夾)(如圖7),找起文件來快到飛起,對于手機上存有大量文件文檔的朋友來說,它絕對是提高你效率的一大利器。
全文檢索范文4
【關鍵詞】食品安全監督;問題;探討與對策
【中圖分類號】R155 【文獻標識碼】A 【文章編號】1004-7484(2014)-02-01004-02
食品安全問題已被人們所重視,從國家到地方都成立了安全委員會,食品安全監督工作也是解決民生工作的首要工作。現將筆者在日常的食品安全監督工作中常見問題進行探討分析,同時提出解決對策。
1 食品安全監督中所見問題
1.1餐飲服務人員的自身衛生問題 盡管對餐飲服務人員進行定期培訓, 但是餐飲服務人員的自身衛生問題仍存在引發食品安全問題的隱患。有些服務員的指甲很長,在端菜的時候手指接觸到入口食品;還有的服務員沒有把頭發完全置于工作帽內,顧客在吃飯時,時常吃到頭發,從而引發投拆案件。
1.2盛裝食品的容器衛生不達標 進入飯店的后廚,映入眼簾的是色彩濱紛的塑料盆、塑料桶,里面盛裝著直接入口的食品。在對他們的培訓中三令五申的強調直接入口食品是不能用回收塑料容器盛裝的,因為這些塑料制品衛生不達標,甚至致癌。但是這個問題在食品安全監督中屢見不鮮,成為食品安全的隱患。
1.3散裝食品的保質期限問題 很多散裝食品無包裝、無廠家、無廠址,更無保質期限。這些散裝食品因存放環境不符合要求,很快變質,商家為減少損失,將已過期的,變質的食品賣給顧客,顧客食用后引起食物中毒。
2 對食品安全中所見問題進行初步探討
2.1對餐飲服務人員定期培訓 加強對餐飲服務人員的培訓工作,增強餐飲服務人員的衛生意識,避免由于自身衛生問題,引發投訴案件。餐飲服務業內部進行自檢自查,建立健全衛生監督制度,指定專人負責該項工作,避免此類問題的發生。
2.2用衛生合格的容器盛裝食品 提高對食品安全的認識,不用回收塑料制品直接入口的食品。有一些塑料制品不能看出是用回收塑料制成的,外觀上制作工藝粗糙,顏色暗、不透明,這些塑料制品是有毒的,餐飲業應禁止使用。
2.3散裝食品進貨時應索證 在散裝食品進貨時應索要生產廠家的工商執照,衛生許可證,并要該產品的批批檢驗合格證,一旦發現質量問題及時與廠家聯系;并且注意存放環境,確保在保質期內售完。
3 食品安全監督中所見問題的解決對策
3.1提高全民的食品安全意識 民以食為天,病從口入,嚴把食品安全關,防患于未然。從餐飲服務人員的自身衛生問題做起,定期對餐飲服務人員進行培訓,對服務環節加強監督,確保消費者吃了放心。
3.2提高對有毒容器的認知能力 許多塑料容器是有毒的,餐飲業應禁止使用。特別是用回收塑料制成的容器,更是危害消費者身體健康的元素,最好使用不銹鋼制品容器盛裝直接入口食品,讓消費者吃了安心。
3.3加強對散裝食品的監督 建立健全進貨索證制度,食品要放在通風干燥的地方,避免陽光直射,防塵、防蠅、防鼠、防潮,過期變質的散裝食品一律下架消毀,讓百姓吃了開心。
食品安全是民生問題中重中之重,食品安全監督工作關系到百姓的健康問題及生命安危,食品安全監督所見的問題不容忽視,亟待解決確保人民的安康。
參考文獻:
[1] 鄭杰,試論突發公共衛生事件應急體系建設 中國公共衛生管理雜志,2007.12(6)503-504。
[2] 周憲堂,高群,孫曉輝,大連市散裝食品存在的問題與對策,中國公共雜志,2005.3.(6).342。
全文檢索范文5
夯實社會管理基礎,解決影響社會治安的根本問題
如前所述,社會治安問題根源在社會矛盾,源頭在社會管理漏洞。因此,社會治安防控體系建設必須以夯實社會管理基礎為前提。當前,各地流動人口成為違法犯罪的“主力軍”,如廣州市在2001年至2004年期間,流動人口刑事犯罪的比例達80%以上,浙江省近年來流動人口違法犯罪居高不下,流動人口作案已占全部刑事作案人員的60%以上,有的地方甚至高達90%以上[2]。因此,應當重點加強外來流動人口的管理。第一,加強基層組織建設,增強基層組織的社會管控能力。針對很多地區外來流動人口多、社區人口比例倒掛嚴重的特點,應當盡可能吸納外來人口參與基層社會管理。比如,浙江省臺州市路橋區吸收在當地居住3年以上、在本地居民和流動人口中都有良好口碑并經公安派出所政審通過的流動人口,和當地村“兩委”成員、村民隊組長組成“共建共享促進會”領導班子,共同管理當地有關事務,促進新老村民的融合[3]。應當說,這種實踐模式是一種更有效率的流動人口管理組織方式,不僅能更加細膩地關照到流動人口社區自身文化特征和需求,而且對于維系社區內人員的聯系和穩定性、增強外來人口對流入地的家園感、歸屬感都有很好的作用,從而有利于減少流動人口的違法犯罪。第二,支持、引導、規范社會組織發展,發揮社會組織的社會管理功能。社會組織作為特定含義的用語首次提出是在2007年黨的十七大報告中,主要是指政黨、政府之外的各類民間性的社會組織,主要包括社會團體、基金會、民辦非企業單位、部分中介組織以及社區活動團體。長期以來,黨和政府作為公共權力的載體,一直在公共事務管理中處于核心主導地位。但是隨著經濟結構的調整、利益格局的分化和市民社會的發展,社會組織開始加入到社會公共事務管理中來,很多社會事務已由社會組織運用其社會資源與社會權力來治理。從社會治安防控的角度來看,為解決外來流動人口這一影響社會治安的源頭性問題,應當大力引導、規范外來人口同鄉會、農民工協會、行業自治組織等社會組織的發展,以政府購買服務的形式對這些組織進行支持資助,要求它們對各自聯系的外來人口群體進行約束、規制和教育,充分發揮社會組織在治安防控中的作用。第三,嚴格出租屋和流動人口管理,切實加強對實有人口和實有房屋的登記核查,落實出租房主的治安管理責任,進一步加大對違法出租屋業主的行政處罰力度,實現以罰促管的目的。推廣普及“物業式”、“旅業式”、“院區圍合式”、“單位自管式”、“散居包片式”、“公司運作式”、“統租統管式”等小區管理模式,通過加強日常管理預防流動人口違法犯罪。
推行治安防控參與獎勵機制,破解群防群治工作難題
社會治安防控必須走專群結合的路子。大力加強群防群治工作,不僅能夠緩解專門防控力量不足等方面的壓力,而且能夠真正落實“以防為主”的理念,在治安防控工作上取得更好的效益和效果。但很多地方的實際情況是:一方面傳統的組織動員、精神激勵在市場經濟條件下已經難以保證群眾參與的深入性、持久性和連續性;另一方面外來流動人口家園感、歸屬感不強,缺乏維護社會安全的主動性。如何拓展群眾參與治安防控工作的途徑,充分調動和發揮群眾維護社會治安穩定的積極性,是迫切需要解決的問題。針對這一情況,我們建議推行治安防控參與獎勵機制,破解群防群治工作難題。必須認識到,針對犯罪預防計劃的設計要把群眾定位為市場經濟體制下的理性經濟人,其行為的做出基于自身利益的考慮。群防群治工作既要考慮群眾參與防范中的收益,即安全風險的控制、損失的減少等,也要考慮群眾參與過程中要付出的代價,包括物質方面或精神方面,如進行某種防范設置所需要的費用、舉報違法可能招致的報復等。因此,需要建立健全與社會主義市場經濟相適應的參與犯罪預防保護激勵機制[4]。具體來說,應當建立社會治安防控參與獎勵專項基金,由財政撥付???,納入財政專戶管理,并可以接受社會捐助。同時,明確群眾參與治安防控獎勵機制的基本內容:在參與事項上,可以包括及時向公安機關反映可疑情況和違法犯罪線索,參與治安巡邏和看樓護院活動,協助保護案事件現場,積極制止不法侵害,同違法犯罪行為作斗爭等;在參與方式上,群眾可通過直接參加、投寄書信、電話聯系、發送郵件、網上發帖、投訴舉報等方式參與治安防控工作;關于受獎勵人員范圍,除國家公職人員、政府聘用的專職治安輔助力量外,不論是否戶籍人口,凡積極參與治安防控工作的群眾,符合獎勵條件的,均可獲得獎勵;關于獎勵的內容,可以現金、實物為主,同時設置若干榮譽稱號。如果受獎人員是外來人口,可以將參與治安防控的實效和榮譽稱號的獲得適當與申辦城市戶籍聯系起來。在治安防控參與獎勵機制的具體實施上,可以采用積分形式,針對不同的治安防控參與事項賦予不同分值,設計積分換算物質獎勵或評選榮譽稱號的標準。通過推行治安防控獎勵機制,有利于充分調動人民群眾參與社會治安防控的積極性和主動性,有助于破解很多地方警力相對不足、治安防范難度大的困境。
全文檢索范文6
關鍵詞:核安全;醫院管理;文化建設
1核安全文化的定義
核科學技術的進步極大地推動了放射醫學的發展,形成了4類放射診療活動:放射治療、核醫學、介入放射和X射線影像診斷,使醫學診斷學、腫瘤學和循證醫學等學科得到了長足的發展,為疾病診治提供了有力手段[1]。但在獲得醫療便利的同時,放射醫學可能帶來的輻射損害也不容忽視。電離輻射可對生物細胞造成損傷,還可能會誘發腫瘤、增加罹患遺傳疾病的概率。據聯合國原子輻射效應科學委員會的報告,醫療照射是公眾所受電離輻射照射的最大人工來源[2]。加強醫院輻射安全管理,保障從業人員及公眾免受過量照射,已成為放射醫學領域最為關注的問題。在大力倡導核安全文化的大環境下,世界各國均制定了大量的相關法規標準,但要切實到達高標準的輻射安全水平,僅有政策上的手段是不夠的,還要依靠從業人員的職業態度和行為表現[3],這種態度和行為表現即指安全文化。“安全文化”一詞的提出源于對美國三哩島和前蘇聯切爾諾貝利兩次嚴重核事故中人為錯誤的分析,首次出現在國際原子能機構的國際核安全咨詢組1986年的《關于切爾諾貝利事故后評審會的總結報告》(INSAG-1)中[4]。1991年,國際原子能機構在《安全文化》中對安全文化作了系統的論述,提出安全文化的完整概念,強調只有全體員工致力于一個共同目標才能獲得最高水平的安全[5]?!秶H電離輻射防護和輻射源安全的基本安全標準》這樣定義安全文化,“組織機構和人員的種種特性和態度的總和,它確立安全第一的觀念,即防護與安全問題由于其重要性而保證得到應有的重視”[6]。這一原則適用于所有的放射源安全和防護實踐中,是我國《電離輻射防護與輻射安全基本標準》(GB18871-2002)的藍本,它強調人員的工作態度、思維習慣和組織的工作方法與優先性。在這一標準中強調“應當反復灌輸用以支配所有與輻射源有關的個人和組織機構對防護與安全的態度和行為的安全文化”[7]。核安全文化由兩大部分組成:第一,是單位內部的必要體制和管理部門的逐級責任制;第二,是各級人員響應上述體制并從中得益所持的態度。圖1是核安全文化的具體組成部分及職責,核安全文化是所有從事與核安全相關工作的人員參與的結果,它包括相關的操作人員、管理人員及決策層。
2醫院核安全文化建設的必要性
醫療行業是電離輻射技術應用廣泛的領域,是輻射事故的多發行業,醫療照射是公眾接受電離輻射劑量負擔最大的人為來源.我國的醫療機構具有數量多、分布廣、服務面大等特點,現在最大的職業性受照群體即為醫療行業從事放射工作的人員,大量接受放射診療服務的患者或受檢者則成為最大的非職業性受照群體。根據2009年中國衛生年鑒的數據顯示,在輻射衛生被監督的50196家單位中,醫療機構就有46712家,占93.6%。在這些單位中,疑似放射病的人數是490人,其中醫務人員就有481人;職業禁忌的人數有1539人,醫務人員占88.4%;個人劑量監測超標的人數有801人,醫務人員占88.0%[9]。我國1988~1998年發生的輻射事故中80%以上可以避免,不適當的安全文化直接或間接地導致了事故的發生[10]。因此,醫院輻射安全管理既要切實實現輻射防護,還須關注潛在照射的問題,加強核安全文化建設,從思想源頭上杜絕醫療輻射事故的發生[11],保障醫療輻射工作人員及公眾免受過量照射。綜上所述,在醫院輻射安全管理中,技術措施只能實現低層次的基本安全目標,管理和組織措施能實現較高層次的安全目標,但要從根本上保障安全,最終還要靠自身的核安全文化建設,核安全文化不會自然產生和存在,需要經歷一個長期的培育過程,只有提高從業者和管理者對核安全文化建設的認識,不斷更新觀念,倡導“以人為本、安全第一”的理念,才能不斷創造安全醫療服務的新局面。
3醫院核安全文化建設現狀
核安全文化概念已提出二十多年,在核工業、煤炭、建筑業、民航運輸業、工程管理、電力等企業和機構得到初步的重視和發展,但在醫療衛生行業,尚未形成完善統一的核安全文化體系,從輻射安全管理、輻射防護等角度對核安全文化建設的研究也不多,存在的問題主要包括:
3.1核技術的醫療應用專業多,分支細,各專業核安全文化建設差異大。放射醫學主要包括放射腫瘤學、臨床核醫學、介入放射學、X射線診斷學等四大學科,每項專業又有很多細的分支。不同的醫學工作在輻射防護和安全要求上各有側重,且有自己的運行體系。因此各專業核安全文化存在一定差異,在文化建設統一上必然有一定難度。3.2醫院等級不同,工作任務量及種類存在差異,核安全文化建設參差不齊。根據我國的衛生法規,醫院實行等級制度,不同級別的醫院承擔不同的輻射醫療服務工作。等級低的醫院輻射工作單一,工作量相對較輕,等級越高的醫院所從事的輻射醫療服務越全面,醫務人員的工作量越繁重。因此不同的醫院對輻射防護和核安全文化的要求不盡相同,造成醫院間的核安全文化建設參差不齊。3.3醫務人員的個人素質存在差異,輻射安全態度和意識水平不同。我國現階段的醫療教育體制和醫療就業環境,造成醫務人員的學歷高低與醫院級別的高低相對平行,導致不同醫院間的從業人員素質存在一定差異。不同級別的醫院對其醫務人員的再教育程度也不盡相同,使得業內員工不能形成統一的核安全文化水平。即使在一個醫院內部,醫務人員也因職位不同、層級不同、工種不同形成不同的輻射安全態度和意識。在日常工作中,有部分工作人員不認真佩戴個人劑量計,認為“沒有用”;不按規定穿戴防護用具,嫌“麻煩”、“不衛生”;進行介入診療、核醫學等高劑量放射操作時認為“反正就一會兒,時間短,沒多大劑量”,持有這些思想的工作人員不在少數。3.4上級主管部門對核安全文化建設重視不足。我國目前針對輻射安全管理的法規和標準已基本健全,也已多方提及核安全文化的理念,但在實際操作中,(總105)《中國醫刊》2017年第52卷第1期監管部門多把目光放在場所評價、人員管理、設備檢測等方面,對醫療機構核安全文化水平的建設和評價缺乏重視。部分醫院的領導層和管理者對輻射安全不重視,相當一部分工作人員的輻射安全意識有待加強和提高。
4醫院核安全文化建設的建議
在國家大力加強核安全文化宣傳貫徹的大環境下,醫院核安全文化建設存在的問題必須得到正視并積極解決,筆者提出如下幾點解決措施及建議。
4.1建立科學的輻射安全管理機構及制度貫徹核安全文化的首要任務是建立輻射安全管理機構或明確專人負責相關放射醫學設備的安全管理工作。核安全文化是無形的,但其建設水平會直觀的體現在醫院輻射安全業績上,科學的輻射安全管理機構及制度是醫院建設高水平核安全文化的重要保證及有形考核指標。規范合理的操作規范、輻射安全與防護管理制度、輻射事故應急預案等文件,可有效規范約束醫務工作人員的行為,減少其工作中的主觀隨意性,使醫院始終保持高水平的核安全文化水平。4.2重視自我輻射監測,開展輻射工作人員培訓自我輻射監測是醫院開展核安全文化建設的基礎,良好的輻射監測能力是做好自身輻射安全與防護工作的前提。輻射監測可分為工作場所監測和個人監測。就放射醫學而言,工作場所監測重點關注外照射水平、表面污染及空氣污染;個人監測主要關注外照射、內照射和皮膚污染監測。在制訂監測方案及計劃并嚴格執行的基礎上,還要積極培訓相關人員,轉變思想,使他們充分認識輻射監測的重要性。醫院應配備專業監測設備,定期檢定,保證測量數據的真實客觀,并及時記錄,做到有據可循。對于異常監測結果,要積極處理,深究原因,切實解決輻射防護方面存在的問題。4.3加強核安全文化宣傳,培養輻射安全管理人才核安全文化屬于管理的“軟技術”,在某些情況下會對醫院發展成敗起到關鍵作用[13]。國際經驗證明良好的安全文化對保證醫用輻射健康發展、減少事故發生有至關重要的作用,醫院文化一旦形成將具有導向功能、約束作用、激勵作用、凝聚作用、輻射作用,達到轉變工作人員輻射安全觀念的目的,帶動患者轉變輻射安全觀念[14]。加強核安全文化宣傳可利用宣傳展板、宣傳畫、演講、培訓、競賽等多種形式進行。核安全文化建設對醫務人員自身的核安全文化素養有很高要求。輻射安全管理不是一個人的職責,需要與梯隊形管理團隊進行。建設高文化素養的醫院輻射管理人才團隊,需要重視人才的篩選,建立規范合理的用人機制[15]。針對專業型管理人才和業務型管理人才采用不同的培養方式,使他們各司其職,發揮所長,為醫院的核安全文化建設貢獻力量。4.4轉變觀念,院領導帶頭參與核安全文化建設院領導應具有高瞻遠矚的戰略眼光和以人為本的理念,在著眼于醫院效益及業務拓展的同時,帶頭參與核安全文化建設,積極貫徹國家加強輻射安全監管及輻射防護工作的政策,狠抓措施的落實和執行情況,促進醫務人員自覺遵守制度和規程,規范本院的輻射安全管理工作,發展安全文化建設。以科室為單位,建立以科主任為核心的質量管理體制,充分發揮科室自身的約束機制,提高科室乃至全院的整體素質,減少輻射安全事故的發生[16]。
5結語
核安全文化建設在醫院輻射安全管理中有著不可替代的作用,必須得到醫院及有關部門的高度重視。安全文化建設與輻射安全管理工作密不可分,在實際工作中,應建立科學的輻射管理機構及制度、做好自我輻射監測工作、加強輻射工作人員的培訓教育、提高醫務人員核安全文化素養,實現輻射防護目標,保證放射醫學持續健康快速發展,減少輻射事故的發生。
參考文獻:
[1]郭欣,鄧明卓,劉江.對綜合性醫院輻射安全管理的探討[J].中國醫院管理,2011,3(31):59-60.
[2]UNSCEAR.Ionizingradiation:sourcesandbiologicaleffects[M].NewYork:UN,1982.
[3]劉長安,王文學,賈廷珍.貫徹《職業病防治法》,發展輻射安全文化[J].中國工業醫學雜志,2003,16(1):54-56.
[4]INSAC.Thesummaryreportonthepost-accidentreviewmeetingonthechernobylaccident[J].IAEA,1986,5(5):403-404.
[5]INSAG.Safetyculture(IAEASafetySeriesNo.75-INSAG-4)[J].IAEA,1991,7(1):121-129.
[6]GB18871-2002.電離輻射防護與輻射源安全基本標準[S].
[7]19-295-1997.國際電離輻射防護和輻射源安全的基本安全標準,安全叢書No.ll5[S].
[8]范深根.我國放射事故概況與原因分析[J].輻射防護,2002,22(5):277-281.
[9]衛生部.2009年中國衛生年鑒[EB/OL]./publicfiles/business/htmlfiles/zwgkzt/ptjnj/200908/42635.htm.
[10]胡蓮芝.江蘇地區1960-1993年放射事故調查與分析[J].中國輻射衛生,1995,4(4):240.
[11]劉長安,賈廷珍,王文學.培育健康的輻射安全文化[J].中華放射醫學與防護雜志,2002,22(6):457.
[12]張璐.淺談提高企業職工安全文化素質以企業安全文化提升企業安全管理[J].大眾商務,2009(9):91.
[13]張久明.加強醫院文化建設提高醫院管理績效[J].中國醫院管理,2008,28(12):75.
[14]張亞兵,丁牧原.醫院文化建設在醫院管理中的作用[J].中國醫院管理,2008,28(9):59.
[15]戴禮成,劉華瓊.論醫院管理改革與體現以人為本[J].中國醫院管理,2008(6):12.