Ⅰ es 欄位類型
| 一級分類 | 二級分類 | 具體類型 |
| 核心類型 | 字元串類型 | string,text,keyword |
| 整數類型 | integer,long,short,byte |
| 浮點類型 | double,float,half_float,scaled_float |
| 邏輯類型 | boolean |
| 日期類型 | date |
| 范圍類型 | range |
| 二進制類型 | binary |
| 復合類型 | 數組類型 | array |
| 對象類型 | object |
| 嵌套類型 | nested |
| 地理類型 | 地理坐標類型 | geo_point |
| 地理地圖 | geo_shape |
| 特殊類型 | IP類型 | ip |
| 范圍類型 | completion |
| 令牌計數類型 | token_count |
| 附件類型 | attachment |
| 抽取類型 | percolator |
(1)string
string類型在ElasticSearch 舊版本中使用較多,從ElasticSearch 5.x開始不再支持string,由text和keyword類型替代。
(2)text
當一個欄位是要被全文搜索的,比如Email內容、產品描述,應該使用text類型。設置text類型以後,欄位內容會被分析,在生成倒排索引以前,字元串會被分析器分成一個一個詞項。text類型的欄位不用於排序,很少用於聚合。
(3)keyword
keyword類型適用於索引結構化的欄位,比如email地址、主機名、狀態碼和標簽。如果欄位需要進行過濾(比如查找已發布博客中status屬性為published的文章)、排序、聚合。keyword類型的欄位只能通過精確值搜索到。
在滿足需求的情況下,盡可能選擇范圍小的數據類型。比如,某個欄位的取值最大值不會超過100,那麼選擇byte類型即可。迄今為止吉尼斯記錄的人類的年齡的最大值為134歲,對於年齡欄位,short足矣。欄位的長度越短,索引和搜索的效率越高。
對於float、half_float和scaled_float,-0.0和+0.0是不同的值,使用term查詢查找-0.0不會匹配+0.0,同樣range查詢中上邊界是-0.0不會匹配+0.0,下邊界是+0.0不會匹配-0.0。
其中scaled_float,比如價格只需要精確到分,price為57.34的欄位縮放因子為100,存起來就是5734
優先考慮使用帶縮放因子的scaled_float浮點類型。
我們人類使用的計時系統是相當復雜的:秒是基本單位, 60秒為1分鍾, 60分鍾為1小時, 24小時是一天……如果計算機也使用相同的方式來計時, 那顯然就要用多個變數來分別存放年月日時分秒, 不停的進行進位運算, 而且還要處理偶爾的閏年和閏秒以及協調不同的時區. 基於」追求簡單」的設計理念, UNIX在內部採用了一種最簡單的計時方式:
日期類型表示格式可以是以下幾種:
(1)日期格式的 字元串 ,比如 「2018-01-13」 或 「2018-01-13 12:10:30」
(2)long類型的 毫秒數 ( milliseconds-since-the-epoch,epoch就是指UNIX誕生的UTC時間1970年1月1日0時0分0秒)
(3)integer的 秒數 (seconds-since-the-epoch)
ElasticSearch 內部會將日期數據轉換為UTC,並存儲為milliseconds-since-the-epoch的long型整數。
例子:日期格式數據
(1)創建索引
(2)寫入文檔
(3)批量查詢
邏輯類型(布爾類型)可以接受true/false/」true」/」false」值
(1)先刪除已經存在的索引,再創建
(2)添加文檔
(3)查看文檔
二進制欄位是指用base64來表示索引中存儲的二進制數據,可用來存儲二進制形式的數據,例如圖像。默認情況下,該類型的欄位只存儲不索引。二進制類型只支持index_name屬性。
在ElasticSearch中,沒有專門的數組(Array)數據類型,但是,在默認情況下,任意一個欄位都可以包含0或多個值,這意味著每個欄位默認都是數組類型,只不過,數組類型的各個元素值的數據類型必須相同。在ElasticSearch中,數組是開箱即用的(out of box),不需要進行任何配置,就可以直接使用。
在同一個數組中,數組元素的數據類型是相同的,ElasticSearch不支持元素為多個數據類型:[ 10, 「some string」 ],常用的數組類型是:
(1)字元數組: [ 「one」, 「two」 ]
(2)整數數組: proctid:[ 1, 2 ]
(3)對象(文檔)數組: 「user」:[ { 「name」: 「Mary」, 「age」: 12 }, { 「name」: 「John」, 「age」: 10 }],ElasticSearch內部把對象數組展開為 {「user.name」: [「Mary」, 「John」], 「user.age」: [12,10]}
JSON天生具有層級關系,文檔會包含嵌套的對象
上面文檔整體是一個JSON,JSON中包含一個employee,employee又包含一個fullname。
ip類型的欄位用於存儲IPv4或者IPv6的地址
(1)創建索引
(2)查詢欄位