A. 大數據中的日誌數據包括哪些
日誌數據的類型包括:1.錯誤日誌(errorlog);2.慢查詢日誌(slow query log) ;3.一般查詢日誌(general log);4.二進制日誌(binlog);5.中繼日誌(relay log);。
日誌一般分成Undo與Redo:Undo一般用於事務的取消與回滾,記錄的是數據被修改前的值;Redo一般用於恢復已確認但未寫入資料庫的數據,記錄的是數據修改後的值。例如:資料庫忽然斷電重啟,資料庫啟動時一般要做一致性檢查,會把已寫到Redo的數據但未寫入資料庫的數據重做一遍。
大數據以容量大、類型多、存取速度快、應用價值高為主要特徵的數據集合,最早應用於IT行業,目前正快速發展為對數量巨大、來源分散、格式多樣的數據進行採集、存儲和關聯分析,從中發現新知識、創造新價值、提升新能力的新一代信息技術和服務業態。大數據必須採用分布式架構,對海量數據進行分布式數據挖掘,因此必須依託雲計算的分布式處理、分布式資料庫和雲存儲、虛擬化技術。