亚洲中字慕日产2020,大陆极品少妇内射AAAAAA,无码av大香线蕉伊人久久,久久精品国产亚洲av麻豆网站

資訊專欄INFORMATION COLUMN

數(shù)據(jù)庫的最簡單實現(xiàn)

legendaryedu / 3222人閱讀

摘要:二叉查找樹是一種查找效率非常高的數(shù)據(jù)結構,它有三個特點。二叉查找樹的結構不適合數(shù)據(jù)庫,因為它的查找效率與層數(shù)相關。樹是對二叉查找樹的改進。備份機制保存數(shù)據(jù)庫的副本。

轉載自:阮一峰的網(wǎng)絡日志

  

所有應用軟件之中,數(shù)據(jù)庫可能是最復雜的。
MySQL的手冊有3000多頁,PostgreSQL的手冊有2000多頁,Oracle的手冊更是比它們相加還要厚。
但是,自己寫一個最簡單的數(shù)據(jù)庫,做起來并不難。Reddit上面有一個帖子,只用了幾百個字,就把原理講清楚了。下面是我根據(jù)這個帖子整理的內(nèi)容。

數(shù)據(jù)以文本形式保存

    

第一步,就是將所要保存的數(shù)據(jù),寫入文本文件。這個文本文件就是你的數(shù)據(jù)庫。
為了方便讀取,數(shù)據(jù)必須分成記錄,每一條記錄的長度規(guī)定為等長。比如,假定每條記錄的長度是800字節(jié),那么第5條記錄的開始位置就在3200字節(jié)。
大多數(shù)時候,我們不知道某一條記錄在第幾個位置,只知道主鍵(primary key)的值。這時為了讀取數(shù)據(jù),可以一條條比對記錄。但是這樣做效率太低,實際應用中,數(shù)據(jù)庫往往采用B樹(B-tree)格式儲存數(shù)據(jù)。

什么是B樹?

  

要理解B樹,必須從二叉查找樹(Binary search tree)講起。

二叉查找樹是一種查找效率非常高的數(shù)據(jù)結構,它有三個特點。

1. 每個節(jié)點最多只有兩個子樹。
2. 左子樹都為小于父節(jié)點的值,右子樹都為大于父節(jié)點的值。
3. 在n個節(jié)點中找到目標值,一般只需要log(n)次比較。
  

二叉查找樹的結構不適合數(shù)據(jù)庫,因為它的查找效率與層數(shù)相關。越處在下層的數(shù)據(jù),就需要越多次比較。極端情況下,n個數(shù)據(jù)需要n次比較才能找到目標值。對于數(shù)據(jù)庫來說,每進入一層,就要從硬盤讀取一次數(shù)據(jù),這非常致命,因為硬盤的讀取時間遠遠大于數(shù)據(jù)處理時間,數(shù)據(jù)庫讀取硬盤的次數(shù)越少越好。
B樹是對二叉查找樹的改進。它的設計思想是,將相關數(shù)據(jù)盡量集中在一起,以便一次讀取多個數(shù)據(jù),減少硬盤操作次數(shù)。

B樹的特點也有三個。

1. 一個節(jié)點可以容納多個值。比如上圖中,最多的一個節(jié)點容納了4個值。
2. 除非數(shù)據(jù)已經(jīng)填滿,否則不會增加新的層。也就是說,B樹追求"層"越少越好。
3. 子節(jié)點中的值,與父節(jié)點中的值,有嚴格的大小對應關系。一般來說,如果父節(jié)點有a個值,那么就有a+1個子節(jié)點。比如上圖中,父節(jié)點有兩個值(7和16),就對應三個子節(jié)點,第一個子節(jié)點都是小于7的值,最后一個子節(jié)點都是大于16的值,中間的子節(jié)點就是7和16之間的值。
  

這種數(shù)據(jù)結構,非常有利于減少讀取硬盤的次數(shù)。假定一個節(jié)點可以容納100(a)個值,那么3(n)層的B樹最大可以容納1030300((a+1)^(n-1)*a)個數(shù)據(jù),如果換成二叉查找樹,則需要20層!假定操作系統(tǒng)一次讀取一個節(jié)點,并且根節(jié)點保留在內(nèi)存中,那么B樹在100萬個數(shù)據(jù)中查找目標值,只需要讀取兩次硬盤。

索引

    

數(shù)據(jù)庫以B樹格式儲存,只解決了按照"主鍵"查找數(shù)據(jù)的問題。如果想查找其他字段,就需要建立索引(index)。
所謂索引,就是以某個字段為關鍵字的B樹文件。假定有一張"雇員表",包含了員工號(主鍵)和姓名兩個字段??梢詫π彰⑺饕募撐募訠樹格式對姓名進行儲存,每個姓名后面是其在數(shù)據(jù)庫中的位置(即第幾條記錄)。查找姓名的時候,先從索引中找到對應第幾條記錄,然后再從表格中讀取。
這種索引查找方法,叫做"索引順序存取方法"(Indexed Sequential Access Method),縮寫為ISAM。它已經(jīng)有多種實現(xiàn)(比如C-ISAM庫和D-ISAM庫),只要使用這些代碼庫,就能自己寫一個最簡單的數(shù)據(jù)庫。

高級功能

  

部署了最基本的數(shù)據(jù)存?。òㄋ饕┮院螅€可以實現(xiàn)一些高級功能。
(1)SQL語言是數(shù)據(jù)庫通用操作語言,所以需要一個SQL解析器,將SQL命令解析為對應的ISAM操作。
(2)數(shù)據(jù)庫連接(join)是指數(shù)據(jù)庫的兩張表通過"外鍵",建立連接關系。你需要對這種操作進行優(yōu)化。
(3)數(shù)據(jù)庫交易(transaction)是指批量進行一系列數(shù)據(jù)庫操作,只要有一步不成功,整個操作都不成功。所以需要有一個"操作日志",以便失敗時對操作進行回滾。
(4)備份機制:保存數(shù)據(jù)庫的副本。
(5)遠程操作:使得用戶可以在不同的機器上,通過TCP/IP協(xié)議操作數(shù)據(jù)庫。
(完)

文章版權歸作者所有,未經(jīng)允許請勿轉載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉載請注明本文地址:http://www.ezyhdfw.cn/yun/17449.html

相關文章

  • 你想不到的最簡單php操作MySQL

    摘要:千鋒出品之天龍八部操作必須先開啟擴展函數(shù)庫首先先開啟開啟成功呢我就可以開始連接數(shù)據(jù)庫了,第一步連接數(shù)據(jù)庫服務器地址用戶名,密碼第二步判斷連接數(shù)據(jù)庫是否成功連接錯誤號連接錯誤信息第三步選擇數(shù)據(jù)庫數(shù)據(jù)庫名稱第四步設置字符集第五步準備語句表名第六  千鋒PHP出品之天龍八部: Php操作mysql必須先開啟mysq擴展函數(shù)庫   首先先開啟extension = mysqli_dll;   ...

    pkhope 評論0 收藏0
  • 單源點最短路徑(Bellman-Ford)原理及js實現(xiàn)

    摘要:說明算法運行結束后,會得到從源節(jié)點到其它所有節(jié)點的最短路徑,同時得到每個節(jié)點的前驅節(jié)點,不能包含負權回路如圖但可以包含圖,這里所說的負權環(huán)路是指環(huán)路的權值總和為正或為負圖圖松弛操作概念松弛操作針對的操作對象是圖中的邊,對圖中任意一條邊, 1. 說明 Bellman-Ford算法運行結束后,會得到從源節(jié)點 s 到其它所有節(jié)點的最短路徑,同時得到每個節(jié)點的前驅節(jié)點,Bellman-Ford...

    Michael_Lin 評論0 收藏0

發(fā)表評論

0條評論

最新活動
閱讀需要支付1元查看
<