亚洲中字慕日产2020,大陆极品少妇内射AAAAAA,无码av大香线蕉伊人久久,久久精品国产亚洲av麻豆网站

資訊專欄INFORMATION COLUMN

greenplum集群實例頻繁宕機

IT那活兒 / 3541人閱讀
greenplum集群實例頻繁宕機

點擊上方“IT那活兒”,關(guān)注后了解更多內(nèi)容,不管IT什么活兒,干就完了!??!





環(huán)境描述



名稱:操作系統(tǒng)   

版本:Linux version:redhat 7.4

名稱:Greenplum

版本:Database:greenplum4.3.30.4





問題描述



在生產(chǎn)環(huán)境中我們所維護的greenplum集群偶爾會遇到segments節(jié)點實例宕停的情況,導(dǎo)致實例宕停的因素比較多。

如:硬件上的磁盤故障導(dǎo)致io較高,內(nèi)網(wǎng)的網(wǎng)絡(luò)波動。sql語法的不規(guī)范導(dǎo)致資源消耗過大,大批量的調(diào)度語句集中在一個時間點導(dǎo)致集群壓力太大。相關(guān)參數(shù)上的設(shè)置過小等等.....

這樣的原因都會導(dǎo)致集群某一個或多個mirrror實例在固定的時間點宕機,以上的情況一般不會導(dǎo)致primary宕機,但是也不一定遇到primary也可以按照以下方法排查原因。





排查方法



1. 排查是否是硬件的問題,查看主機日志messages

路徑:/var/log/messages

查看是否是降級導(dǎo)致的,磁盤降級的關(guān)鍵詞根據(jù)主機廠商不同一般不一樣。

如果是內(nèi)存或者別的硬件導(dǎo)致的就執(zhí)行以下命令(如果是硬件導(dǎo)致可能會有primary實例宕停)。

cat /var/log/messages | grep ker

具體的報錯信息需根據(jù)經(jīng)驗判斷。

2. 查看數(shù)據(jù)庫日志
需要查看的是宕停實例的數(shù)據(jù)庫日志,并且需要快速獲取路徑。
查看數(shù)據(jù)庫狀態(tài):
gpstate -e


  
這樣看到的只是宕機的實例主機名無法獲取到詳細的路徑,執(zhí)行以下命令:

可以看到主機名后面的就是宕停實例的目錄路徑。

登錄gp2切換到pg_log目錄下:

可以看到按日期生成的.csv文件,這就是數(shù)據(jù)庫日志。

但是有的文件后綴不是000000,是為什么?

數(shù)據(jù)庫日志文件本身就是“gpdb-年-月-日_時間“,顯示000000是因為在凌晨12點整生成的,而那些不是000000的則是因為該實例宕停不在記錄日志信息只有把實例拉起時才會繼續(xù)記錄,而拉起宕停實例的時間就會自動生成一個對應(yīng)的.csv文件。

查看相應(yīng)的日志文件可以看到紅色標記的哪一行有“WARING“關(guān)鍵詞,而后面的信息就是當該實例宕停時所打印的信息。而報錯信息的大概意思就是”在連接時收到了關(guān)閉信息并且成功了“,為什么會導(dǎo)致這樣的情況?

根據(jù)網(wǎng)上得到的方案可以修改的參數(shù)有這兩個:

這個參數(shù)簡單的說就是在Master和Segment之間的探測超時時長。

導(dǎo)致的原因可能時那個時間點集群的壓力過大,通信超時,可以將時間調(diào)高點。

這里引用greenplum6.0.1的解釋:

“等待Mirror響應(yīng)的最長時間,缺省為600,單位是秒。在FTS檢測之外,gp_segment_connect_timeout參數(shù)限制的是Primary等待 Mirror響應(yīng)的時間,在Primary向Mirror發(fā)送數(shù)據(jù)時,超過該參數(shù)設(shè)置的時間仍無法成功,Primary將會報告Master修改Mirror的狀態(tài)為down,然后Primary將會持 續(xù)記錄WAL日志,對于6之前的版本,Primary將進入change tracking狀態(tài)。不過, 對于該參數(shù),至少在6之前的版本,真正的超時時間是設(shè)定值的75%。”

3. sql語句的原因

這里就需要在master主機部署一個記錄集群會話的腳本,將宕機時間點的sql反饋給應(yīng)用讓他們檢查是否有問題,或者將宕機時間點的會話分散執(zhí)行。




本文作者:徐 瑞

本文來源:IT那活兒(上海新炬王翦團隊)

文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址:http://www.ezyhdfw.cn/yun/129540.html

相關(guān)文章

  • 數(shù)據(jù)倉庫架構(gòu)的變遷

    摘要:前面我們簡單闡述了分布式數(shù)據(jù)庫的架構(gòu),并通過一條簡單的查詢語句解釋了分布式的執(zhí)行計劃。 引言 第八屆中國架構(gòu)師大會(SACC2016)10月27號到29號在北京萬達索菲特大飯店成功舉辦。大會以架構(gòu)創(chuàng)新之路為主題,云集了國內(nèi)外頂尖專家,共同探討云計算和大數(shù)據(jù)等技術(shù)背景下,如何通過架構(gòu)創(chuàng)新及各種IT新技術(shù)來帶動企業(yè)轉(zhuǎn)型增效。作為一家專注于云端數(shù)據(jù)倉庫的初創(chuàng)公司,酷克數(shù)據(jù)受邀在SACC201...

    Raaabbit 評論0 收藏0
  • centos7.3下 greenplum-db 安裝、配置文檔

    摘要:下安裝配置文檔一系統(tǒng)要求系統(tǒng)版本要求根據(jù)官方文檔支持以下幾種系統(tǒng)文件系統(tǒng)要求數(shù)據(jù)存儲目錄為文件系統(tǒng)二下安裝服務(wù)器列表主節(jié)點數(shù)據(jù)節(jié)點數(shù)據(jù)節(jié)點主節(jié)點切換備用節(jié)點修改系統(tǒng)配置項關(guān)閉關(guān)閉防火墻修改內(nèi)核配置參數(shù)并執(zhí)行使之生 centos7.3下 greenplum-db 安裝、配置文檔 一.系統(tǒng)要求 1.系統(tǒng)版本要求:根據(jù)官方文檔: greenplumd-b支持以下幾種linux系統(tǒng): ...

    neuSnail 評論0 收藏0
  • 探索Greenplum的實踐,了解新一代大數(shù)據(jù)處理利器

    摘要:上有主節(jié)點和從節(jié)點兩部分,兩者主要的功能是生成查詢計劃并派發(fā),以及協(xié)調(diào)并行計算,同時在上保存著,這個全局目錄存著一組數(shù)據(jù)庫系統(tǒng)本身所具有的元數(shù)據(jù)的系統(tǒng)表。 前言:近年來,互聯(lián)網(wǎng)的快速發(fā)展積累了海量大數(shù)據(jù),而在這些大數(shù)據(jù)的處理上,不同技術(shù)棧所具備的性能也有所不同,如何快速有效地處理這些龐大的數(shù)據(jù)倉,成為很多運營者為之苦惱的問題!隨著Greenplum的異軍突起,以往大數(shù)據(jù)倉庫所面臨的很多...

    supernavy 評論0 收藏0
  • “Satellite”:在生產(chǎn)過程中監(jiān)控Kubernetes

    摘要:冒煙類型測試冒煙測試這個術(shù)語的定義一系列初步的測試來揭示一些簡單的故障的嚴重性,以此來拒絕預(yù)期中軟件的發(fā)布。冒煙測試最頻繁的特點就是它運行的很快,通常是秒級的。 Satellite是硅谷初創(chuàng)公司Gravitational公司旗下一個用Go寫的開源項目,可用來收集Kubernetes集群的健康信息,它既是一個library,也是一個應(yīng)用。作為library,可以用做監(jiān)控方案。在這篇文章里...

    mumumu 評論0 收藏0

發(fā)表評論

0條評論

IT那活兒

|高級講師

TA的文章

閱讀更多
最新活動
閱讀需要支付1元查看
<