① 學會如何應用資料庫——資料庫規范化技巧 (1)
簡介在設計資料庫時,最重要的步驟是要確保數據正確分布到資料庫的表中。使用正確的數據結構,可以極大地簡化應用程序的其他內容(查詢、窗體、報表、代碼等)。正確進行表設計的正式名稱是「資料庫規范化」。 本文簡要介紹資料庫規范化的基本概念和一些需要注意並力求避免的常見問題。 理解您的數據在設計表之前,應明確您打算如何處理數據,還要了解隨著時間的推移數據會發生什麼樣的變化。您所做的假設將會影響最終的設計。 您需要什麼樣的數據? 設計應用程序時,關鍵要了解設計的最終結果,以便確保您准備好所有必需的數據並知道其來源。例如,報表的外觀、每個數據的來源以及所需的所有數據是否都存在。對項目損失最大的莫過於在項目後期發現重要報表缺少數據。 知道需要什麼樣的數據後,就必須確定數據的來源。數據是否從其他數據源中導入?數據是否需要清理或驗證?用戶是否需要輸入數據? 明確所需數據的類型和來源是資料庫設計的第一步。 您打算如何處理這些數據?用戶是否需要編輯這些數據?如果需要,應如何顯示數據以便於用戶理解和編輯?有沒有驗證規則和相關的查找表?要求對編輯和刪除保留備份的數據輸入有沒有相關聯的審核問題?需要為用戶顯示哪些摘要信息?是否需要生成導出文件?了解這些信息後,就可以想像欄位之間是如何相互關聯的了。 數據之間如何相互關聯?將數據分組放入相關欄位(例如與客戶相關的信息、與發票相關的信息等),每個欄位組都代表要建立的表。然後考慮如何將這些表相互關聯。例如,哪些表具有一對多關系(例如,一個客戶可能持有多張發票)?哪些表具有一對一關系(這種情況下,通常會考慮將其組合到一個表中)? 隨著時間的推移數據會發生什麼樣的變化?設計表之後,常常會由於沒有考慮時間的影響而導致以後出現嚴重問題。許多表設計在當時使用時效果非常好,但是,常常會因為用戶修改數據、添加數據以及隨時間的推移而崩潰。開發人員經常會發現需要重新設計表的結構來適應這些變化。表的結構發生變化時,所有相關的內容(查詢、窗體、報表、代碼等)也必須隨之更新。理解並預測數據會隨時間推移發生哪些變化,可以實現更好的設計,減少問題的發生。 學習如何使用查詢了解如何分析和管理數據同樣很重要。您應該深刻理解查詢的工作原理,理解如何使用查詢在多個表之間鏈接數據,如何使用查詢對數據進行分組和匯總,以及如何在不需要以規范化格式顯示數據時使用交叉表查詢。 好的數據設計的最終目標就是要平衡兩個需要:既要隨著時間的推移有效地存儲數據,又要輕松地檢索和分析數據。理解查詢的功能對正確設計表很有幫助。 資料庫規范化概念這部分介紹資料庫規范化所涉及的基本概念,而不是對資料庫規范化進行理論性的探討。如何在您的實際情況中應用這些概念可能會隨著應用程序需要的不同而有所變化。這部分的目的是理解這些基本概念、根據實際需要應用它們,並理解偏離這些概念將會出現哪些問題。 將唯一信息存儲在一個地方大部分資料庫開發人員都理解資料庫規范化的基本概念。理想情況下,您希望將相同的數據存儲在同一個地方,並在需要引用時使用 ID 來進行引用。因此,如果某些信息發生了變化,則可以在一個地方進行更改,而整個程序中的相應信息也會隨之更改。 例如,客戶表會存儲每個客戶的記錄,包括姓名、地址、電話號碼、電子郵件地址以及其他特徵信息。客戶表中可能包含唯一的 CustomerID 欄位(通常是 Autonumber 欄位),這個欄位即該表的主鍵欄位,其他表使用它來引用該客戶。因此,發票表可以只引用客戶的 ID 值,而不是在每張發票中存儲客戶的所有信息(因為同一個客戶可能會持有多張發票),這樣利用客戶的 ID 值即可從客戶表中查找客戶的詳細信息。使用 Access 中功能強大的窗體(使用組合框和子窗體),可以輕松地完成這項工作。如果需要修改客戶信息(例如新增電話號碼),只需在客戶表中修改,應用程序中引用該信息的任何其他部分都會隨之自動更新。 使用正確規范化的資料庫,通過簡單的編輯即可輕松處理數據隨時間推移而發生的更改。使用未正確規范化的資料庫,通常需要利用編程或查詢來更改多條記錄或多個表。這不僅會增加工作量,還會增加由於未正確執行代碼或查詢而導致數據不一致的可能性。 記錄是免費的,而新欄位非常昂貴理想的資料庫應該只需要隨著時間的推移添加新的記錄,資料庫表應該能夠保存大量記錄。但是,如果您發現需要增加更多欄位,則可能會碰到設計問題。 電子表格專家經常會遇到上述問題,因為他們習慣於按照設計電子表格的方式設計資料庫。設計經常隨時間變化的欄位(例如,年、季度、產品和銷售人員)需要在將來添加新欄位。而正確的設計應該是轉換信息並將隨時間變化的數據放在一個欄位內,這樣就可以添加更多記錄。例如,只需創建「年」欄位,然後在該欄位中輸入各記錄相應的年份值即可,無需為每年創建一個單獨的欄位。 增加額外的欄位可能會產生問題,因為表結構的變化會對應用程序的其他部分產生影響。在表中添加更多欄位時,依賴該表的對象和代碼也需要更新。例如,查詢需要獲取額外的欄位,窗體需要顯示這些欄位,而報表則需要包含這些欄位,等等。但是,如果數據已經規范化,則現有對象會自動檢索新數據,並正確計算或顯示這些數據。查詢功能尤其強大,因為它允許您按「年」欄位進行分組,以逐年顯示摘要(不管表中包含哪些年份)。 但是,數據規范化並不意味著不能顯示或使用隨時間而變化或依賴時間的欄位。需要瀏覽或顯示這類信息的開發人員通常可以使用交叉表查詢來達到這一目的。如果您不熟悉交叉表查詢,應該學習如何使用它們。雖然它們與表有所不同(尤其是用戶無法編輯交叉表查詢的結果),但它們的確可以用於在數據表中顯示信息(最多可以達到 255 個欄位)。如果要在報表中使用它們,則會更加復雜,因為報表需要包含額外的或不斷變化的欄位名。這就是為什麼大多數報表將數據作為獨立的分組(而不是獨立的列)顯示的原因。對於那些別無選擇的情況,您必須花時間去解決這個問題。希望所有人都能夠理解這種決定會隨著時間的變化對其他資源產生的影響。 這就是為什麼增加記錄是免費的(這是資料庫的巨大優勢)而增加欄位是如此昂貴的原因。