摘要:論文一本體論在自動(dòng)問(wèn)答系統(tǒng)中的應(yīng)用駱正華基于本體來(lái)組織問(wèn)句的方法,并探討在基礎(chǔ)上分析問(wèn)句的方法,并利用本體向量來(lái)聯(lián)系問(wèn)句實(shí)例和領(lǐng)域知識(shí),達(dá)到問(wèn)題和答案的連接。領(lǐng)域具體事實(shí)知識(shí)的表示采用標(biāo)記規(guī)范,主題操作事件或業(yè)務(wù)實(shí)體描述或?qū)傩浴?/p>
論文 一、本體論在自動(dòng)問(wèn)答系統(tǒng)中的應(yīng)用_駱正華
基于本體來(lái)組織問(wèn)句的方法,并探討在基礎(chǔ)上分析問(wèn)句的方法,并利用本體向量
來(lái)聯(lián)系問(wèn)句實(shí)例和領(lǐng)域知識(shí),達(dá)到問(wèn)題和答案的連接。
用戶提交的問(wèn)句
進(jìn)行分詞、 詞性標(biāo)注、 語(yǔ)塊劃分等淺層句法分析
在語(yǔ)塊結(jié)構(gòu)化的問(wèn)句實(shí)例中找相似的問(wèn)句
構(gòu)造本體的目的都是為了實(shí)現(xiàn)某種程度的知識(shí)共享和重用。
領(lǐng)域知識(shí)可劃分為三個(gè)層次,通用概念知識(shí)->領(lǐng)域概念知識(shí)->具體事實(shí)知識(shí)。
領(lǐng)域具體事實(shí)知識(shí)的表示
采用XML標(biāo)記規(guī)范,主題、操作事件或業(yè)務(wù)實(shí)體、描述或?qū)傩浴?/p>
問(wèn)句語(yǔ)義的表示
主題、疑問(wèn)塊、問(wèn)句語(yǔ)義表示
問(wèn)句向量本質(zhì)上有三種情況
主題+實(shí)體+屬性
主題+事件+角色
向量是一組無(wú)序的關(guān)鍵字
二、一種基于加權(quán)語(yǔ)義相似度模型的自動(dòng)問(wèn)答系統(tǒng)_劉亞軍利用語(yǔ)義樹(shù)中詞語(yǔ)間的距離和語(yǔ)義樹(shù)的高度來(lái)計(jì)算詞語(yǔ)間的語(yǔ)義相似度
利用詞語(yǔ)間的語(yǔ)義相似度和詞語(yǔ)的權(quán)重進(jìn)一步計(jì)算用戶問(wèn)題與答案庫(kù)中問(wèn)題間的語(yǔ)義相似度。
關(guān)鍵詞語(yǔ)(權(quán)重高的詞語(yǔ))
三、自動(dòng)問(wèn)答系統(tǒng)中的問(wèn)題理解研究_曹志娟QA系統(tǒng)主要分為五個(gè)部分
問(wèn)題理解、信息檢索、信息處理、答案抽取、FAQ系統(tǒng)。
主要是三個(gè)主要部分
問(wèn)題理解
信息檢索
答案抽取
講述問(wèn)題理解的兩個(gè)關(guān)鍵點(diǎn):?jiǎn)栴}分類和問(wèn)句擴(kuò)展。
問(wèn)題分類
詞法分析:?jiǎn)柧浞衷~和標(biāo)注
問(wèn)題分類:基于答案對(duì)象的類型分類,增加疑問(wèn)詞短語(yǔ)分類、問(wèn)題標(biāo)準(zhǔn)型、特征詞分類
1. 識(shí)別問(wèn)句中的疑問(wèn)詞,根據(jù)疑問(wèn)詞找到句型模式集合 - 人、地點(diǎn)、具體時(shí)間、持續(xù)事件、數(shù)量、原因、方法、其他 2. 與集合中的句型規(guī)則進(jìn)行匹配,從而得到問(wèn)題標(biāo)準(zhǔn)型 - 通過(guò)形式語(yǔ)言制定具體規(guī)則 - 通過(guò)概率分類的方法 3. 再根據(jù)特征詞確定問(wèn)題領(lǐng)域 - 特征詞的擴(kuò)充
問(wèn)句擴(kuò)展
問(wèn)句重寫-更改為定制的模板
關(guān)鍵詞擴(kuò)展
名詞、動(dòng)詞的關(guān)鍵詞
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://www.ezyhdfw.cn/yun/43286.html
摘要:考慮這樣一個(gè)計(jì)算集合,它可以被允許在每一個(gè)節(jié)點(diǎn)和可能的圖結(jié)構(gòu)中,并定義了一個(gè)函數(shù)族。傳統(tǒng)的前饋神經(jīng)網(wǎng)絡(luò)能夠被看做擁有等于層數(shù)的深度比如對(duì)于輸出層為隱層數(shù)加。理論結(jié)果證實(shí)那些事實(shí)上所需要的節(jié)點(diǎn)數(shù)隨著輸入的大小指數(shù)增長(zhǎng)的函數(shù)族是存在的。 查看論文 Yoshua Bengio, Learning Deep Architectures for AI, Foundations and Trends i...
摘要:實(shí)驗(yàn)結(jié)果實(shí)驗(yàn)數(shù)據(jù)集數(shù)據(jù)集都是新聞?lì)惥W(wǎng)頁(yè),從五個(gè)中文新聞網(wǎng)站中收集一百個(gè)頁(yè)面這最多也就五類吧,而且也就五百個(gè),好像有點(diǎn)少了吧結(jié)果與驗(yàn)證性能指標(biāo)這這這比較文本長(zhǎng)度就了那不是只要包含新聞?wù)牟痪秃昧恕? 《Web Content Extraction Using Clustering with Web Structure》引用 Huang X, Gao Y, Huang L, et al. ...
摘要:分塊效果如圖所示聚類由于不同網(wǎng)頁(yè)之間設(shè)計(jì)和布局存在較大差異,作者選擇了作為聚類算法來(lái)解決簇?cái)?shù)目未知簇形狀未知噪聲等問(wèn)題未給出距離函數(shù)。 《Web Content Extraction Through Machine Learning》 通過(guò)機(jī)器學(xué)習(xí)來(lái)提取網(wǎng)頁(yè)內(nèi)容 2014年,未見(jiàn)期刊會(huì)議上登載,作者 Ziyan Zhou @stanford.edu 簡(jiǎn)介 數(shù)據(jù)集 以新聞文章網(wǎng)站為主數(shù)...
摘要:后文將圍繞做一些介紹。盡管如此,的使用對(duì)新手而言仍然充滿了困難。本系列文章基本為個(gè)人見(jiàn)解,難免有錯(cuò)誤與誤解,如有客觀錯(cuò)誤歡迎提出。 前言 說(shuō)到Android的污點(diǎn)分析框架,網(wǎng)上的搜索結(jié)果大多指向靜態(tài)的FlowDroid與動(dòng)態(tài)的TaintDroid。盡管由于加固、混淆等技術(shù)使得針對(duì)Android的靜態(tài)分析越來(lái)越困難,但靜態(tài)分析的無(wú)先驗(yàn)分析能力無(wú)法被動(dòng)態(tài)分析取代,使得靜態(tài)分析仍有發(fā)揮空間。...
閱讀 1770·2021-10-28 09:32
閱讀 679·2021-09-24 09:47
閱讀 3022·2021-09-02 15:11
閱讀 2804·2021-08-09 13:46
閱讀 2939·2019-08-30 15:55
閱讀 1125·2019-08-30 15:54
閱讀 3359·2019-08-29 14:12
閱讀 873·2019-08-26 13:40