亚洲中字慕日产2020,大陆极品少妇内射AAAAAA,无码av大香线蕉伊人久久,久久精品国产亚洲av麻豆网站

資訊專欄INFORMATION COLUMN

1.3-知識(shí)圖譜怎么去做?

Martin91 / 3597人閱讀

摘要:圖數(shù)據(jù)庫(kù)逐步成為目前主要的知識(shí)圖譜存儲(chǔ)方式。知識(shí)圖譜的補(bǔ)全是通過(guò)現(xiàn)有知識(shí)圖譜來(lái)預(yù)測(cè)實(shí)體之間的關(guān)系,是對(duì)關(guān)系抽取的重要補(bǔ)充。相關(guān)資料大規(guī)模知識(shí)圖譜的構(gòu)建推理及應(yīng)用肖仰華大規(guī)模知識(shí)圖譜構(gòu)建與應(yīng)用

知識(shí)圖譜怎么去做,這當(dāng)然不是幾句話說(shuō)得清楚的。首先肯定要先基于自身的業(yè)務(wù)進(jìn)行思考,這里整理一些知識(shí)圖譜構(gòu)建的主要路徑。

構(gòu)建的邏輯思路

1、梳理業(yè)務(wù),構(gòu)建本體:是否需要用知識(shí)圖譜?成本怎么樣,能達(dá)到怎么的效果?是否有能力構(gòu)建知識(shí)圖譜?數(shù)據(jù)、團(tuán)隊(duì)等情況是否能支撐?如果有必要,如何根據(jù)業(yè)務(wù)梳理一套本體框架?

2、編輯本體,給出業(yè)務(wù)知識(shí)表示框架:可以利用Protege進(jìn)行本體編輯,獲得一個(gè)用OWL表示的知識(shí)表示文件。

3、給本體補(bǔ)充實(shí)例數(shù)據(jù):先找一些示例數(shù)據(jù),便于理解。

構(gòu)建的不同方式

自頂向下的構(gòu)建方式:先定義本體和數(shù)據(jù)模式,再將實(shí)體加入知識(shí)庫(kù)。利用一些現(xiàn)有的結(jié)構(gòu)化知識(shí)庫(kù)作為其基礎(chǔ)知識(shí)庫(kù)。

自底向上的構(gòu)建方式:從一些開(kāi)放鏈接數(shù)據(jù)中提取出實(shí)體,選擇其中置信度較高的加入到知識(shí)庫(kù),再構(gòu)建頂層的本體模式。

構(gòu)建過(guò)程中的關(guān)鍵技術(shù)

大體包含五個(gè)方面:知識(shí)抽取、知識(shí)表示、知識(shí)融合、知識(shí)加工、知識(shí)評(píng)估

通過(guò)知識(shí)提取技術(shù),可以從一些公開(kāi)的半結(jié)構(gòu)化、非結(jié)構(gòu)化和第三方結(jié)構(gòu)化數(shù)據(jù)庫(kù)的數(shù)據(jù)中提取出實(shí)體、關(guān)系、屬性等知識(shí)要素。

知識(shí)表示則通過(guò)一定有效手段對(duì)知識(shí)要素表示,便于進(jìn)一步處理使用。分布式的知識(shí)表示形成的綜合向量對(duì)知識(shí)庫(kù)的構(gòu)建、推理、融合以及應(yīng)用均具有重要的意義。

然后通過(guò)知識(shí)融合,可消除實(shí)體、關(guān)系、屬性等指稱項(xiàng)與事實(shí)對(duì)象之間的歧義,形成高質(zhì)量的知識(shí)庫(kù)。

知識(shí)加工則是在已有的知識(shí)庫(kù)基礎(chǔ)上進(jìn)一步挖掘隱含的知識(shí),構(gòu)建新本體,補(bǔ)全關(guān)系,從而豐富、擴(kuò)展知識(shí)庫(kù)。

知識(shí)評(píng)估可以對(duì)知識(shí)的可信度進(jìn)行量化,保留置信度較高的,舍棄置信度較低的,有效確保知識(shí)的質(zhì)量。

除此之外,大規(guī)模知識(shí)圖譜構(gòu)建,還需要多種技術(shù)的支持:分布式存儲(chǔ)和計(jì)算、圖數(shù)據(jù)庫(kù)、圖推理、內(nèi)存數(shù)據(jù)庫(kù)等。

數(shù)據(jù)的存儲(chǔ)數(shù)據(jù)庫(kù)選擇

知識(shí)圖譜的存儲(chǔ)和查詢語(yǔ)言也經(jīng)歷了歷史的洗滌,從RDF到OWL以及SPARQL查詢,都逐漸因?yàn)槭褂蒙系牟槐慵案甙旱某杀荆还I(yè)界主流所遺棄。

圖數(shù)據(jù)庫(kù)逐步成為目前主要的知識(shí)圖譜存儲(chǔ)方式。

目前應(yīng)用比較廣泛的圖數(shù)據(jù)庫(kù)包括Neo4j、graphsql、sparkgraphx(包含圖計(jì)算引擎)、基于hbase的Titan、BlazeGraph等,各家的存儲(chǔ)語(yǔ)言和查詢語(yǔ)言也不盡相同。

實(shí)際應(yīng)用場(chǎng)景下,OrientDB和postgresql也有很多的應(yīng)用,主要原因是其相對(duì)低廉的實(shí)現(xiàn)成本和性能優(yōu)勢(shì)。

應(yīng)用推理和知識(shí)自學(xué)習(xí)

在知識(shí)圖譜構(gòu)建過(guò)程中,還存在很多關(guān)系補(bǔ)全問(wèn)題。雖然一個(gè)普通的知識(shí)圖譜可能存在數(shù)百萬(wàn)的實(shí)體和數(shù)億的關(guān)系事實(shí),但相距補(bǔ)全還差很遠(yuǎn)。

知識(shí)圖譜的補(bǔ)全是通過(guò)現(xiàn)有知識(shí)圖譜來(lái)預(yù)測(cè)實(shí)體之間的關(guān)系,是對(duì)關(guān)系抽取的重要補(bǔ)充。

傳統(tǒng)方法TransE和TransH通過(guò)把關(guān)系作為從實(shí)體A到實(shí)體B的翻譯來(lái)建立實(shí)體和關(guān)系嵌入,但是這些模型僅僅簡(jiǎn)單地假設(shè)實(shí)體和關(guān)系處于相同的語(yǔ)義空間。

而事實(shí)上,一個(gè)實(shí)體是由多種屬性組成的綜合體,不同關(guān)系關(guān)注實(shí)體的不同屬性,所以僅僅在一個(gè)空間內(nèi)對(duì)他們進(jìn)行建模是不夠的。

相關(guān)資料

大規(guī)模知識(shí)圖譜的構(gòu)建、推理及應(yīng)用

肖仰華 | 大規(guī)模知識(shí)圖譜構(gòu)建與應(yīng)用

文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請(qǐng)注明本文地址:http://www.ezyhdfw.cn/yun/74870.html

相關(guān)文章

  • 3月1日云棲精選夜讀 | 阿里與瑞金醫(yī)院發(fā)布首個(gè)機(jī)器智能糖尿病知識(shí)圖譜,由近2000位開(kāi)發(fā)者參建

    摘要:月日,由阿里云與上海瑞金醫(yī)院阿里健康聯(lián)合舉辦的新一輪天池大賽瑞金醫(yī)院人工智能輔助構(gòu)建知識(shí)圖譜大賽決賽結(jié)果頒布,兩位來(lái)自哈工大的歲研究生在全球近位開(kāi)發(fā)者當(dāng)中脫穎而出,獲得冠軍。3月1日,由阿里云與上海瑞金醫(yī)院、阿里健康聯(lián)合舉辦的新一輪天池大賽——瑞金醫(yī)院MMC人工智能輔助構(gòu)建知識(shí)圖譜大賽決賽結(jié)果頒布,兩位來(lái)自哈工大的22歲研究生在全球近2000位開(kāi)發(fā)者當(dāng)中脫穎而出,獲得冠軍。 熱點(diǎn)熱議 阿里...

    alighters 評(píng)論0 收藏0
  • 一篇寫(xiě)給新手入門(mén)PHP的文章

    摘要:如果在學(xué)習(xí)過(guò)程中有什么問(wèn)題可以關(guān)注我公眾號(hào)琉憶編程庫(kù)給我留言。有興趣可以深入學(xué)習(xí)最后附上學(xué)習(xí)的知識(shí)結(jié)構(gòu)圖譜,可以按著下面的這個(gè)知識(shí)結(jié)構(gòu)圖進(jìn)行學(xué)習(xí)不一定完整,更多資料,面試題,都可以關(guān)注公眾號(hào)琉憶編程庫(kù)獲取。 你好,是我——琉憶。PHP程序員面試系列圖書(shū)作者。 作為一名PHP開(kāi)發(fā)者過(guò)來(lái)人,也是經(jīng)歷了菜鳥(niǎo)到老手的過(guò)程,在此給那些想學(xué)PHP的同學(xué)指條路,即使你是轉(zhuǎn)行學(xué)PHP一樣可以學(xué)會(huì)PHP...

    Ilikewhite 評(píng)論0 收藏0

發(fā)表評(píng)論

0條評(píng)論

閱讀需要支付1元查看
<