【摘要】一種計算機操作系統故障現場信息獲取的系統和方法,包括EFI BIOS和運行在EFI BIOS上的操作系統,以及操作系統監視模塊(2),計數器(4)和硬件狗模塊(5);EFI BIOS還包括內存分配模塊(1)和運行時間服務模塊(3);
【摘要】 本發明屬于互聯網信息處理領域,其特征在于: 它首先從引擎用戶訪問日志中提取出用戶的查詢信息,在 此基礎上對用戶查詢進行分類;隨后,對于不同類型的用戶查 詢,根據用戶訪問日志中的用戶點擊信息進行自動分析,得出 對應這些查詢的用戶點擊焦點;最后對待評價引擎的查詢 結果進行抓取,并根據用戶查詢的對應點擊焦點對查詢結果進 行評價,得到引擎性能的數值評價結果。它具有不需要人 工參與,準確客觀和快捷及時的優點。 【專利類型】發明申請 【申請人】清華大學 【申請人類型】學校 【申請人地址】100084北京市100084-82信箱 【申請人地區】中國 【申請人城市】北京市 【申請人區縣】海淀區 【申請號】CN200610144289.X 【申請日】2006-12-01 【申請年份】2006 【公開公告號】CN1963816A 【公開公告日】2007-05-16 【公開公告年份】2007 【授權公告號】CN100440224C 【授權公告日】2008-12-03 【授權公告年份】2008.0 【IPC分類號】G06F17/30 【發明人】劉奕群; 張敏; 金奕江; 馬少平 【主權項內容】1.一種引擎性能評價的自動化處理方法其特征在于該方法依次含有如下步驟: 步驟(1)評價用查詢集合的篩選和分類,引擎服務提供商通過引擎網絡服務獲得引擎用戶日志,其中依次記錄了以下表項:用戶提交的查詢Query、對應這個查詢用戶點擊的結果地址URL、統一標準的資源地址URL按引擎計算的與用戶查詢相關的程度在返回結果中的排名Rank、當某個用戶某次使用引擎時由系統自動分配唯一的用戶標識號ID;接著,按以下步驟進行: 步驟(1.1)數據預處理 步驟(1.1.1)該引擎網絡服務商進行用戶日志編碼轉換,把該服務器記錄的編碼格式從URL格式轉換成國家標準漢字編碼的GBK格式; 步驟(1.1.2)利用字符串匹配技術過濾用戶查詢過程中的冗余信息和噪聲信息,把用戶日志的內容整理成內容項字符串; 步驟(1.2)提取“前N位結果滿足用戶需求率”信息: 取值范圍在0到1之間,其中,N為設定值, “查詢Q的總用戶數”通過對查詢Q的不同Id計數得到, “查詢Q時只點擊前N個結果的用戶數”則通過對查詢Q的不同Id對應的Rank得到; 步驟(1.3)提取“前N次點擊滿足用戶需求率”信息: 取值范圍在0到1之間,其中,N為設定值, “查詢Q時點擊次數小于或等于N次的用戶”通過對查詢Q的不同ID對應的用戶點擊數中只點擊不足N次的用戶數得到; 步驟(1.4)提取“用戶點擊集中度”信息: 取值范圍在0到1之間; 步驟(1.5)待評測查詢的分類: 若:Q的“前5位結果滿足用戶需求率”取值在0.6至1.0之間,則Q為“導航類查詢”, 若:Q的“前5位結果滿足用戶需求率”取值在0至0.6之間,但“前2次點擊滿足用戶需求率”取值在0.9至1之間,則Q為“導航類查詢”,是一種查詢目標唯一的查詢, 否則:Q為“信息類查詢”,是一種查詢目標不唯一的查詢; 步驟(1.6)確定評測用的查詢集合,形成標準答案: 若:某個查詢Q在引擎用戶日志中被不同用戶查詢的次數小于50次,則排除在S之外, 若:某個查詢Q是信息類查詢,對于該查詢,如果“用戶點擊最集中的五個查詢結果”對應的“用戶點擊集中度”之和小于0.8,則排除在S之外; 步驟(2)導航類、信息類查詢答案的自動標注: 對于導航類查詢Q(NAV),其“用戶點擊集中度”最大的網頁即是其標準答案, 對于信息類查詢Q(INF),其“用戶點擊集中度”最大的連續前M個網頁即是其標準答案,其中M滿足:從“用戶點擊集中度”最大的網頁開始,連續前M個網頁的“用戶點擊集中度”之和大于0.8,但連續前M-1個網頁的“用戶點擊集中度”之和小于0.8; 步驟(3)引擎結果的抓取與過濾: 步驟(3.1)針對指定查詢詞的引擎結果頁面抓取:對步驟1挑選出的待評測查詢集合S中的每一個查詢詞Q,對其引擎結果頁面進行抓取,以便進一步獲得引擎針對Q的查詢結果條目,其步驟依次如下: 步驟(3.1.1)選用一種互聯網網頁抓取程序; 步驟(3.1.2)根據不同的查詢類別,利用模式替換的方式生成對應查詢的引擎結果頁面的URL,同時,引擎在該URL中記錄該查詢; 步驟(3.1.3)調用步驟3.1.1中的互聯網網頁抓取程序,自動抓取待評測查詢集合S中的每一個查詢詞對應的查詢結果頁面并保存; 步驟(3.2)引擎結果頁面中結果條目的抓取,依次含有以下步驟: 步驟(3.2.1)找出形成引擎的查詢結果頁面的腳本語言中的HTML文本; 步驟(3.2.2)針對不同的引擎,在瀏覽器中進行一些樣例查詢的,得到陽歷查詢的結果條目; 步驟(3.2.3)通過模式匹配的方法,根據樣例查詢的結果條目與引擎結果頁面中HTML文本的對應關系,得到描述由引擎結果頁面自動生成查詢結果的程序; 步驟(3.2.4)根據步驟3.2.3得到的程序,針對待評測查詢集合中的每一個查詢詞,得到對應的查詢結果條目; 步驟(4)根據步驟1.6得到的標準答案進行引擎結果評價,所用的評測指標如下: A.平均檢索精度AP同時應用于導航和信息類查詢的評測,評價引擎的綜合性能: 其中, K表示標準答案的數目, B.排序倒數RR,用于導航類查詢評測: 其中Rank(1)表示第1個標準答案出現的排序值,RR是第1個標準答案的排序倒數; C.前十位結果精度,用于信息類查詢評測,用Precision@10表示: Precision@10表示引擎返回的前10個結果的精度,在大多數引擎返回的結果頁面首頁中都包含有10個結果,因此Precision@10也代表了引擎返回的第1頁結果的精度。 【當前權利人】清華大學; 北京搜狗科技發展有限公司 【當前專利權人地址】北京市海淀區清華園; 北京市海淀區中關村東路1號院9號樓搜狐網絡大廈9層01房間 【專利權人類型】公立 【統一社會信用代碼】12100000400000624D 【被引證次數】38 【被自引次數】3.0 【被他引次數】35.0 【家族引證次數】2.0 【家族被引證次數】38
未經允許不得轉載:http://m.mhvdw.cn/1776131600.html
喜歡就贊一下






