字段類型與合理的選擇字段類型

2018-02-24 16:16 更新

本篇博客稍微有點(diǎn)長(zhǎng),它實(shí)際上包括兩個(gè)內(nèi)容:一是mysql字段類型的介紹,二是在mysql建表過(guò)程中是如何正確選擇這些字段類型;

字段類型

數(shù)值

MySQL 的數(shù)值數(shù)據(jù)類型可以大致劃分為兩個(gè)類別,一個(gè)是整數(shù),另一個(gè)是浮點(diǎn)數(shù)或小數(shù)。
許多不同的子類型對(duì)這些類別中的每一個(gè)都是可用的,每個(gè)子類型支持不同大小的數(shù)據(jù),并且 MySQL 允許我們指定數(shù)值字段中的值是否有正負(fù)之分(UNSIGNED)或者用零填補(bǔ)(ZEROFILL)。

  • INT
    在 MySQL 中支持的 5 個(gè)主要整數(shù)類型是 TINYINT,SMALLINT,MEDIUMINT,INT 和 BIGINT。這些類型在很大程度上是相同的,只有它們存儲(chǔ)的值的大小是不相同的。

MySQL 以一個(gè)可選的顯示寬度指示器的形式對(duì) SQL 標(biāo)準(zhǔn)進(jìn)行擴(kuò)展(如 INT(6),6即是其寬度指示器,該寬度指示器并不會(huì)影響int列存儲(chǔ)字段的大小,也就是說(shuō),超過(guò)6位它不會(huì)自動(dòng)截取,依然會(huì)存儲(chǔ),只有超過(guò)它本身的存儲(chǔ)范圍才會(huì)截取;此處寬度指示器的作用在于該字段是否有zerofill,如果有就未滿足6位的部分就會(huì)用0來(lái)填充),這樣當(dāng)從數(shù)據(jù)庫(kù)檢索一個(gè)值時(shí),可以把這個(gè)值加長(zhǎng)到指定的長(zhǎng)度。例如,指定一個(gè)字段的類型為 INT(6),就可以保證所包含數(shù)字少于 6 個(gè)的值從數(shù)據(jù)庫(kù)中檢索出來(lái)時(shí)能夠自動(dòng)地用空格填充。需要注意的是,使用一個(gè)寬度指示器不會(huì)影響字段的大小和它可以存儲(chǔ)的值的范圍。

萬(wàn)一我們需要對(duì)一個(gè)字段存儲(chǔ)一個(gè)超出許可范圍的數(shù)字,MySQL 會(huì)根據(jù)允許范圍最接近它的一端截短后再進(jìn)行存儲(chǔ)。還有一個(gè)比較特別的地方是,MySQL 會(huì)在不合規(guī)定的值插入表前自動(dòng)修改為 0。

  • unsigned 和 zerofill
    UNSIGNED 修飾符規(guī)定字段只保存正值,即無(wú)符號(hào),而mysql字段默認(rèn)是有符號(hào)的。因?yàn)椴恍枰4鏀?shù)字的正、負(fù)符號(hào),可以在儲(chǔ)時(shí)節(jié)約一個(gè)"位"的空間(即翻一倍)。從而增大這個(gè)字段可以存儲(chǔ)的值的范圍。注意這個(gè)修飾符要緊跟在數(shù)值類型后面;
    ZEROFILL 修飾符規(guī)定 0(不是空格)可以用來(lái)真補(bǔ)輸出的值。使用這個(gè)修飾符可以阻止 MySQL 數(shù)據(jù)庫(kù)存儲(chǔ)負(fù)值,如果某列設(shè)置為zerofill,那它自動(dòng)就unsigned。這個(gè)值要配合int,tinyint,smallint,midiumint等字段的寬度指示器來(lái)用;XXint(M),如果沒(méi)有zerofill,這個(gè)M的寬度指示器是沒(méi)有意義的.(注意,測(cè)試前導(dǎo)0的時(shí)候,還是去黑窗口測(cè)試;)

為什么mysql存儲(chǔ)的值要分有符號(hào)和無(wú)符號(hào)呢?因?yàn)橐粋€(gè)字節(jié),占8bit;也就1個(gè)bit有0和1兩種可能,8個(gè)bit就是2^8 = 256種可能,也就是0~255;但如果是有符號(hào)的話,就得拿一個(gè)1bit來(lái)存儲(chǔ)這個(gè)負(fù)號(hào),本來(lái)8bit只剩7bit,2^7 = 128,也就是-128~127(正數(shù)部分包含一個(gè)0);

  • FLOAT、DOUBLE 和 DECIMAL 類型
    MySQL 支持的三個(gè)浮點(diǎn)類型是 FLOAT、DOUBLE 和 DECIMAL 類型。FLOAT 數(shù)值類型用于表示單精度浮點(diǎn)數(shù)值,而 DOUBLE 數(shù)值類型用于表示雙精度浮點(diǎn)數(shù)值。
    與整數(shù)一樣,這些類型也帶有附加參數(shù):一個(gè)顯示寬度指示器和一個(gè)小數(shù)點(diǎn)指示器(必須要帶有指示器,要不然會(huì)查不到結(jié)果,并且寬度指示器和XXint類型的寬度指示器不同,這里是有實(shí)際限制寬度的)。比如語(yǔ)句 FLOAT(7,3) 規(guī)定顯示的值不會(huì)超過(guò) 7 位數(shù)字(包括小數(shù)位),小數(shù)點(diǎn)后面帶有 3 位數(shù)字。對(duì)于小數(shù)點(diǎn)后面的位數(shù)超過(guò)允許范圍的值,MySQL 會(huì)自動(dòng)將它四舍五入為最接近它的值,再插入它。
    DECIMAL 數(shù)據(jù)類型用于精度要求非常高的計(jì)算中,這種類型允許指定數(shù)值的精度和計(jì)數(shù)方法作為選擇參數(shù)。精度在這里指為這個(gè)值保存的有效數(shù)字的總個(gè)數(shù),而計(jì)數(shù)方法表示小數(shù)點(diǎn)后數(shù)字的位數(shù)。比如語(yǔ)句 DECIMAL(7,3) 規(guī)定了存儲(chǔ)的值不會(huì)超過(guò) 7 位數(shù)字,并且小數(shù)點(diǎn)后不超過(guò) 3 位。
    FLOAT 類型在長(zhǎng)度比較高比如 float(10,2)和 decimal(10,2)同時(shí)插入一個(gè)符合(10,2)寬度的數(shù)值,float 就會(huì)出現(xiàn)最后小數(shù)點(diǎn)出現(xiàn)一些出入;
    UNSIGNED 和 ZEROFILL 修飾符也可以被 FLOAT、DOUBLE 和 DECIMAL 數(shù)據(jù)類型使用。并且效果與 INT 數(shù)據(jù)類型相同。

關(guān)于flaot和double
在這里我建議,干脆忘記mysql有double這個(gè)數(shù)據(jù)類型。至于why?就不要管它了

字符串類型

MySQL 提供了 8 個(gè)基本的字符串類型,可以存儲(chǔ)的范圍從簡(jiǎn)單的一個(gè)字符到巨大的文本塊或二進(jìn)制字符串?dāng)?shù)據(jù)。

  • BINARY
    BINARY不是函數(shù),是類型轉(zhuǎn)換運(yùn)算符,它用來(lái)強(qiáng)制它后面的字符串為一個(gè)二進(jìn)制字符串,可以理解為在字符串比較的時(shí)候區(qū)分大小寫

    SELECT BINARY 'ABCD' = 'abcd' as COM1,'ABCD' = 'abcd' as COM2; -- COM1輸出為0,COM2輸出為1;
  • CHAR 和 VARCHAR 類型
    CHAR 類型用于定長(zhǎng)字符串,并且必須在圓括號(hào)內(nèi)用一個(gè)大小修飾符來(lái)定義。這個(gè)大小修飾符的范圍從 0-255。比指定長(zhǎng)度大的值將被截短,而比指定長(zhǎng)度小的值將會(huì)用空格作填補(bǔ)。

CHAR 類型可以使用 BINARY 修飾符。當(dāng)用于比較運(yùn)算時(shí),這個(gè)修飾符使 CHAR 以二進(jìn)制方式參于運(yùn)算,而不是以傳統(tǒng)的區(qū)分大小寫的方式。

CHAR 類型的一個(gè)變體是 VARCHAR 類型。它是一種可變長(zhǎng)度的字符串類型,并且也必須帶有一個(gè)范圍在 0-255 之間的指示器。

CHAR 和 VARCHGAR 不同之處在于 MYSQL 數(shù)據(jù)庫(kù)處理這個(gè)指示器的方式:CHAR 把這個(gè)大小視為值的大小,不長(zhǎng)度不足的情況下就用空格補(bǔ)足。而 VARCHAR 類型把它視為最大值并且只使用存儲(chǔ)字符串實(shí)際需要的長(zhǎng)度(增加一個(gè)額外字節(jié)來(lái)存儲(chǔ)字符串本身的長(zhǎng)度)來(lái)存儲(chǔ)值。所以短于指示器長(zhǎng)度的 VARCHAR 類型不會(huì)被空格填補(bǔ),但長(zhǎng)于指示器的值仍然會(huì)被截短。

因?yàn)?VARCHAR 類型可以根據(jù)實(shí)際內(nèi)容動(dòng)態(tài)改變存儲(chǔ)值的長(zhǎng)度,所以在不能確定字段需要多少字符時(shí)使用 VARCHAR 類型可以大大地節(jié)約磁盤空間、提高存儲(chǔ)效率。但如果確切知道字符串長(zhǎng)度,比如就在50~55之間,那就用 CHAR 因?yàn)?CHAR 類型由于本身定長(zhǎng)的特性使其性能要高于 VARCHAR;

VARCHAR 類型在使用 BINARY 修飾符時(shí)與 CHAR 類型完全相同。

  • TEXT 和 BLOB 類型
    對(duì)于字段長(zhǎng)度要求超過(guò) 255 個(gè)的情況下,MySQL 提供了 TEXT 和 BLOB 兩種類型。根據(jù)存儲(chǔ)數(shù)據(jù)的大小,它們都有不同的子類型。這些大型的數(shù)據(jù)用于存儲(chǔ)文本塊或圖像、聲音文件等二進(jìn)制數(shù)據(jù)類型。

TEXT 和 BLOB 類型在分類和比較上存在區(qū)別。BLOB 類型區(qū)分大小寫,而 TEXT 不區(qū)分大小寫。大小修飾符不用于各種 BLOB 和 TEXT 子類型。比指定類型支持的最大范圍大的值將被自動(dòng)截短。

時(shí)間類型

在處理日期和時(shí)間類型的值時(shí),MySQL 帶有 5 個(gè)不同的數(shù)據(jù)類型可供選擇。

  • DATE、TIME 和 YEAR 類型
    MySQL 用 DATE 和 YEAR 類型存儲(chǔ)簡(jiǎn)單的日期值,使用 TIME 類型存儲(chǔ)時(shí)間值。這些類型可以描述為字符串或不帶分隔符的整數(shù)序列。如果描述為字符串,DATE 類型的值應(yīng)該使用連字號(hào)作為分隔符分開,而 TIME 類型的值應(yīng)該使用冒號(hào)作為分隔符分開。

需要注意的是,沒(méi)有冒號(hào)分隔符的 TIME 類型值,將會(huì)被 MySQL 理解為持續(xù)的時(shí)間,而不是時(shí)間戳。

MySQL 還對(duì)日期的年份中的兩個(gè)數(shù)字的值,或是 SQL 語(yǔ)句中為 YEAR 類型輸入的兩個(gè)數(shù)字進(jìn)行最大限度的通譯。因?yàn)樗?YEAR 類型的值必須用 4 個(gè)數(shù)字存儲(chǔ)。MySQL 試圖將 2 個(gè)數(shù)字的年份轉(zhuǎn)換為 4 個(gè)數(shù)字的值。把在 00-69 范圍內(nèi)的值轉(zhuǎn)換到 2000-2069 范圍內(nèi)。把 70-99 范圍內(nèi)的值轉(zhuǎn)換到 1970-1979 之內(nèi)。如果 MySQL 自動(dòng)轉(zhuǎn)換后的值并不符合我們的需要,請(qǐng)輸入 4 個(gè)數(shù)字表示的年份。

  • DATETIME 和 TIMESTAMP 類型
    除了日期和時(shí)間數(shù)據(jù)類型,MySQL 還支持 DATETIME 和 TIMESTAMP 這兩種混合類型。它們可以把日期和時(shí)間作為單個(gè)的值進(jìn)行存儲(chǔ)。這兩種類型通常用于自動(dòng)存儲(chǔ)包含當(dāng)前日期和時(shí)間的時(shí)間戳,并可在需要執(zhí)行大量數(shù)據(jù)庫(kù)事務(wù)和需要建立一個(gè)調(diào)試和審查用途的審計(jì)跟蹤的應(yīng)用程序中發(fā)揮良好作用。

如果我們對(duì) TIMESTAMP 類型的字段沒(méi)有明確賦值,或是被賦與了 null 值。MySQL 會(huì)自動(dòng)使用系統(tǒng)當(dāng)前的日期和時(shí)間來(lái)填充它。

復(fù)合類型

MySQL 還支持兩種復(fù)合數(shù)據(jù)類型 ENUM 和 SET,它們擴(kuò)展了 SQL 規(guī)范。雖然這些類型在技術(shù)上是字符串類型,但是可以被視為不同的數(shù)據(jù)類型。一個(gè) ENUM 類型只允許從一個(gè)集合中取得一個(gè)值;而 SET 類型允許從一個(gè)集合中取得任意多個(gè)值。

  • ENUM 類型
    ENUM 類型因?yàn)橹辉试S在集合中取得一個(gè)值,有點(diǎn)類似于單選項(xiàng)。在處理相互排拆的數(shù)據(jù)時(shí)容易讓人理解,比如人類的性別。ENUM 類型字段可以從集合中取得一個(gè)值或使用 null 值,除此之外的輸入將會(huì)使 MySQL 在這個(gè)字段中插入一個(gè)空字符串。另外如果插入值的大小寫與集合中值的大小寫不匹配,MySQL 會(huì)自動(dòng)使用插入值的大小寫轉(zhuǎn)換成與集合中大小寫一致的值。

ENUM 類型在系統(tǒng)內(nèi)部可以存儲(chǔ)為數(shù)字,并且從 1 開始用數(shù)字做索引。一個(gè) ENUM 類型最多可以包含 65536 個(gè)元素,其中一個(gè)元素被 MySQL 保留,用來(lái)存儲(chǔ)錯(cuò)誤信息,這個(gè)錯(cuò)誤值用索引 0 或者一個(gè)空字符串表示。

MySQL 認(rèn)為 ENUM 類型集合中出現(xiàn)的值是合法輸入,除此之外其它任何輸入都將失敗。這說(shuō)明通過(guò)搜索包含空字符串或?qū)?yīng)數(shù)字索引為 0 的行就可以很容易地找到錯(cuò)誤記錄的位置。

  • SET 類型
    SET 類型與 ENUM 類型相似但不相同。SET 類型可以從預(yù)定義的集合中取得任意數(shù)量的值。并且與 ENUM 類型相同的是任何試圖在 SET 類型字段中插入非預(yù)定義的值都會(huì)使 MySQL 插入一個(gè)空字符串。如果插入一個(gè)即有合法的元素又有非法的元素的記錄,MySQL 將會(huì)保留合法的元素,除去非法的元素。
    一個(gè) SET 類型最多可以包含 64 項(xiàng)元素。還去除了重復(fù)的元素,所以 SET 類型中不可能包含兩個(gè)相同的元素。
    希望從 SET 類型字段中找出非法的記錄只需查找包含空字符串或二進(jìn)制值為 0 的行。

字段類型總結(jié)

  1. 雖然上面列出了很多字段類型,但最常用也就是 varchar(255),char(255),text,tinyint(4),smallint(6),mediumint,int(11)幾種。

  2. 復(fù)合類型我們一般用tinyint,更快的時(shí)間更省的空間以及更容易擴(kuò)展

  3. 關(guān)于手機(jī)號(hào),推薦用char(11),char(11)在查詢上更有效率,因?yàn)槭謾C(jī)號(hào)是一個(gè)活躍字段參與邏輯會(huì)很多。

  4. 一些常用字段舉例
    姓名:char(20)
    價(jià)格:DECIMAL(7, 3)
    產(chǎn)品序列號(hào):SMALLINT(5) unsigned
    文章內(nèi)容: TEXT
    MD5: CHAR(32)
    ip: char(15)
    time: int(10)
    email char(32)

合理的選擇數(shù)據(jù)類型

  • 選擇合理范圍內(nèi)最小的
    我們應(yīng)該選擇最小的數(shù)據(jù)范圍,因?yàn)檫@樣可以大大減少磁盤空間及磁盤I/0讀寫開銷,減少內(nèi)存占用,減少CPU的占用率。

  • 選擇相對(duì)簡(jiǎn)單的數(shù)據(jù)類型
    數(shù)字類型相對(duì)字符串類型要簡(jiǎn)單的多,尤其是在比較運(yùn)算時(shí),所以我們應(yīng)該選擇最簡(jiǎn)單的數(shù)據(jù)類型,比如說(shuō)在保存時(shí)間時(shí),因?yàn)镻HP可以良好的處理LINUX時(shí)間戳所以我們可以將日期存為int(10)要方便、合適、快速的多。

但是,工作中隨著項(xiàng)目越做越多,業(yè)務(wù)邏輯的處理越來(lái)越難以后,我發(fā)現(xiàn)時(shí)間類型還是用時(shí)間類型本身的字段類型要好一些,因?yàn)閙ysql有著豐富的時(shí)間函數(shù)供我使用,方便我完成很多與時(shí)間相關(guān)的邏輯,比如月排行榜,周排行榜,當(dāng)日熱門,生日多少天等等邏輯

  • 不要使用null
    為什么這么說(shuō)呢,因?yàn)镸YSQL對(duì)NULL字段索引優(yōu)化不佳,增加更多的計(jì)算難度,同時(shí)在保存與處理NULL類形時(shí),也會(huì)做更多的工作,所以從效率上來(lái)說(shuō),不建議用過(guò)多的NULL。有些值他確實(shí)有可能沒(méi)有值,怎么辦呢?解決方法是數(shù)值弄用整數(shù)0,字符串用空來(lái)定義默認(rèn)值即可。

  • 字符串類型的使用
    字符串?dāng)?shù)據(jù)類型是一個(gè)萬(wàn)能數(shù)據(jù)類型,可以儲(chǔ)存數(shù)值、字符串、日期等。
    保存數(shù)值類型最好不要用字符串?dāng)?shù)據(jù)類型,這樣存儲(chǔ)的空間顯然是會(huì)更大,而且在排序時(shí)字符串的9是大于22的,其實(shí)如果進(jìn)行運(yùn)算時(shí)mysql會(huì)將字符串轉(zhuǎn)換為數(shù)值類型,大大降低效果,而且這種轉(zhuǎn)換是不會(huì)走原有的索引的。
    如果明確數(shù)據(jù)在一個(gè)完整的集合中如男,女,那么可以使用set或enum數(shù)據(jù)類型,這種數(shù)據(jù)類型在運(yùn)算及儲(chǔ)存時(shí)以數(shù)值方式操作,所以效率要比字符串更好,同時(shí)空間占用更少。

  • VARCHAR與CHAR
    VARCHAR是可變長(zhǎng)度字符串類型,那么即然長(zhǎng)度是可變的就會(huì)使用1,2個(gè)字節(jié)來(lái)保存字符的長(zhǎng)度,如果長(zhǎng)度在255內(nèi)使用1個(gè)字節(jié)來(lái)保存字符長(zhǎng)度,否則使用2個(gè)字符來(lái)保存長(zhǎng)度。由于varchar是根據(jù)儲(chǔ)存的值來(lái)保存數(shù)據(jù),所以可以大大節(jié)約磁盤空間。
    如果數(shù)據(jù)經(jīng)常被執(zhí)行更新操作,由于VARCHAR是根據(jù)內(nèi)容來(lái)進(jìn)行儲(chǔ)存的,所以mysql將做更多的工作來(lái)完成更新操作,如果新數(shù)據(jù)長(zhǎng)度大于老數(shù)據(jù)長(zhǎng)度一些存儲(chǔ)引擎會(huì)進(jìn)行拆分操作處理。同時(shí)varchar會(huì)完全保留內(nèi)部所有數(shù)據(jù),最典型的說(shuō)明就是尾部的空格。
    CHAR固定長(zhǎng)度的字符串保存類型,CHAR會(huì)去掉尾部的空格。在數(shù)據(jù)長(zhǎng)度相近時(shí)使用char類型比較合適,比如md5加密的密碼用戶名等。
    如果數(shù)據(jù)經(jīng)常進(jìn)行更新修改操作,那么CHAR更好些,因?yàn)閏har長(zhǎng)度固定,性能上要快。

  • 數(shù)值類型的選擇
    數(shù)值數(shù)據(jù)類型要比字符串執(zhí)行更快,區(qū)間小的數(shù)據(jù)類型占用空間更少,處理速度更快,如tinyint可比bigint要快的多

    選擇數(shù)據(jù)類型時(shí)要考慮內(nèi)容長(zhǎng)度,比如是保存毫米單位還是米而選擇不同的數(shù)值類型

    整數(shù)

    整數(shù)類型很多比如tinyint、int、smallint、bigint等,那么我們要根據(jù)自己需要存儲(chǔ)的數(shù)據(jù)長(zhǎng)度決定使用的類型,同時(shí)tinyint(10)與tinyint(100)在儲(chǔ)存與計(jì)算上并無(wú)任何差別,區(qū)別只是顯示層面上,但是我們也要選擇適合合適的數(shù)據(jù)類型長(zhǎng)度。可以通過(guò)指定zerofill屬性查看顯示時(shí)區(qū)別。

    浮點(diǎn)數(shù)與精度數(shù)值

    浮點(diǎn)數(shù)float在儲(chǔ)存空間及運(yùn)行效率上要優(yōu)于精度數(shù)值類型decimal,但float與double會(huì)有舍入錯(cuò)誤而decimal則可以提供更加準(zhǔn)確的小數(shù)級(jí)精確運(yùn)算不會(huì)有錯(cuò)誤產(chǎn)生計(jì)算更精確,適用于金融類型數(shù)據(jù)的存儲(chǔ)。

以上內(nèi)容是否對(duì)您有幫助:
在線筆記
App下載
App下載

掃描二維碼

下載編程獅App

公眾號(hào)
微信公眾號(hào)

編程獅公眾號(hào)