本篇博客稍微有點(diǎn)長(zhǎng),它實(shí)際上包括兩個(gè)內(nèi)容:一是mysql字段類型的介紹,二是在mysql建表過(guò)程中是如何正確選擇這些字段類型;
MySQL 的數(shù)值數(shù)據(jù)類型可以大致劃分為兩個(gè)類別,一個(gè)是整數(shù),另一個(gè)是浮點(diǎn)數(shù)或小數(shù)。
許多不同的子類型對(duì)這些類別中的每一個(gè)都是可用的,每個(gè)子類型支持不同大小的數(shù)據(jù),并且 MySQL 允許我們指定數(shù)值字段中的值是否有正負(fù)之分(UNSIGNED)或者用零填補(bǔ)(ZEROFILL)。
MySQL 以一個(gè)可選的顯示寬度指示器的形式對(duì) SQL 標(biāo)準(zhǔn)進(jìn)行擴(kuò)展(如 INT(6),6即是其寬度指示器,該寬度指示器并不會(huì)影響int列存儲(chǔ)字段的大小,也就是說(shuō),超過(guò)6位它不會(huì)自動(dòng)截取,依然會(huì)存儲(chǔ),只有超過(guò)它本身的存儲(chǔ)范圍才會(huì)截取;此處寬度指示器的作用在于該字段是否有zerofill,如果有就未滿足6位的部分就會(huì)用0來(lái)填充),這樣當(dāng)從數(shù)據(jù)庫(kù)檢索一個(gè)值時(shí),可以把這個(gè)值加長(zhǎng)到指定的長(zhǎng)度。例如,指定一個(gè)字段的類型為 INT(6),就可以保證所包含數(shù)字少于 6 個(gè)的值從數(shù)據(jù)庫(kù)中檢索出來(lái)時(shí)能夠自動(dòng)地用空格填充。需要注意的是,使用一個(gè)寬度指示器不會(huì)影響字段的大小和它可以存儲(chǔ)的值的范圍。
萬(wàn)一我們需要對(duì)一個(gè)字段存儲(chǔ)一個(gè)超出許可范圍的數(shù)字,MySQL 會(huì)根據(jù)允許范圍最接近它的一端截短后再進(jìn)行存儲(chǔ)。還有一個(gè)比較特別的地方是,MySQL 會(huì)在不合規(guī)定的值插入表前自動(dòng)修改為 0。
為什么mysql存儲(chǔ)的值要分有符號(hào)和無(wú)符號(hào)呢?因?yàn)橐粋€(gè)字節(jié),占8bit;也就1個(gè)bit有0和1兩種可能,8個(gè)bit就是2^8 = 256種可能,也就是0~255;但如果是有符號(hào)的話,就得拿一個(gè)1bit來(lái)存儲(chǔ)這個(gè)負(fù)號(hào),本來(lái)8bit只剩7bit,2^7 = 128,也就是-128~127(正數(shù)部分包含一個(gè)0);
關(guān)于flaot和double
在這里我建議,干脆忘記mysql有double這個(gè)數(shù)據(jù)類型。至于why?就不要管它了
MySQL 提供了 8 個(gè)基本的字符串類型,可以存儲(chǔ)的范圍從簡(jiǎn)單的一個(gè)字符到巨大的文本塊或二進(jìn)制字符串?dāng)?shù)據(jù)。
BINARY
BINARY不是函數(shù),是類型轉(zhuǎn)換運(yùn)算符,它用來(lái)強(qiáng)制它后面的字符串為一個(gè)二進(jìn)制字符串,可以理解為在字符串比較的時(shí)候區(qū)分大小寫
SELECT BINARY 'ABCD' = 'abcd' as COM1,'ABCD' = 'abcd' as COM2; -- COM1輸出為0,COM2輸出為1;
CHAR 類型可以使用 BINARY 修飾符。當(dāng)用于比較運(yùn)算時(shí),這個(gè)修飾符使 CHAR 以二進(jìn)制方式參于運(yùn)算,而不是以傳統(tǒng)的區(qū)分大小寫的方式。
CHAR 類型的一個(gè)變體是 VARCHAR 類型。它是一種可變長(zhǎng)度的字符串類型,并且也必須帶有一個(gè)范圍在 0-255 之間的指示器。
CHAR 和 VARCHGAR 不同之處在于 MYSQL 數(shù)據(jù)庫(kù)處理這個(gè)指示器的方式:CHAR 把這個(gè)大小視為值的大小,不長(zhǎng)度不足的情況下就用空格補(bǔ)足。而 VARCHAR 類型把它視為最大值并且只使用存儲(chǔ)字符串實(shí)際需要的長(zhǎng)度(增加一個(gè)額外字節(jié)來(lái)存儲(chǔ)字符串本身的長(zhǎng)度)來(lái)存儲(chǔ)值。所以短于指示器長(zhǎng)度的 VARCHAR 類型不會(huì)被空格填補(bǔ),但長(zhǎng)于指示器的值仍然會(huì)被截短。
因?yàn)?VARCHAR 類型可以根據(jù)實(shí)際內(nèi)容動(dòng)態(tài)改變存儲(chǔ)值的長(zhǎng)度,所以在不能確定字段需要多少字符時(shí)使用 VARCHAR 類型可以大大地節(jié)約磁盤空間、提高存儲(chǔ)效率。但如果確切知道字符串長(zhǎng)度,比如就在50~55之間,那就用 CHAR 因?yàn)?CHAR 類型由于本身定長(zhǎng)的特性使其性能要高于 VARCHAR;
VARCHAR 類型在使用 BINARY 修飾符時(shí)與 CHAR 類型完全相同。
TEXT 和 BLOB 類型在分類和比較上存在區(qū)別。BLOB 類型區(qū)分大小寫,而 TEXT 不區(qū)分大小寫。大小修飾符不用于各種 BLOB 和 TEXT 子類型。比指定類型支持的最大范圍大的值將被自動(dòng)截短。
在處理日期和時(shí)間類型的值時(shí),MySQL 帶有 5 個(gè)不同的數(shù)據(jù)類型可供選擇。
需要注意的是,沒(méi)有冒號(hào)分隔符的 TIME 類型值,將會(huì)被 MySQL 理解為持續(xù)的時(shí)間,而不是時(shí)間戳。
MySQL 還對(duì)日期的年份中的兩個(gè)數(shù)字的值,或是 SQL 語(yǔ)句中為 YEAR 類型輸入的兩個(gè)數(shù)字進(jìn)行最大限度的通譯。因?yàn)樗?YEAR 類型的值必須用 4 個(gè)數(shù)字存儲(chǔ)。MySQL 試圖將 2 個(gè)數(shù)字的年份轉(zhuǎn)換為 4 個(gè)數(shù)字的值。把在 00-69 范圍內(nèi)的值轉(zhuǎn)換到 2000-2069 范圍內(nèi)。把 70-99 范圍內(nèi)的值轉(zhuǎn)換到 1970-1979 之內(nèi)。如果 MySQL 自動(dòng)轉(zhuǎn)換后的值并不符合我們的需要,請(qǐng)輸入 4 個(gè)數(shù)字表示的年份。
如果我們對(duì) TIMESTAMP 類型的字段沒(méi)有明確賦值,或是被賦與了 null 值。MySQL 會(huì)自動(dòng)使用系統(tǒng)當(dāng)前的日期和時(shí)間來(lái)填充它。
MySQL 還支持兩種復(fù)合數(shù)據(jù)類型 ENUM 和 SET,它們擴(kuò)展了 SQL 規(guī)范。雖然這些類型在技術(shù)上是字符串類型,但是可以被視為不同的數(shù)據(jù)類型。一個(gè) ENUM 類型只允許從一個(gè)集合中取得一個(gè)值;而 SET 類型允許從一個(gè)集合中取得任意多個(gè)值。
ENUM 類型在系統(tǒng)內(nèi)部可以存儲(chǔ)為數(shù)字,并且從 1 開始用數(shù)字做索引。一個(gè) ENUM 類型最多可以包含 65536 個(gè)元素,其中一個(gè)元素被 MySQL 保留,用來(lái)存儲(chǔ)錯(cuò)誤信息,這個(gè)錯(cuò)誤值用索引 0 或者一個(gè)空字符串表示。
MySQL 認(rèn)為 ENUM 類型集合中出現(xiàn)的值是合法輸入,除此之外其它任何輸入都將失敗。這說(shuō)明通過(guò)搜索包含空字符串或?qū)?yīng)數(shù)字索引為 0 的行就可以很容易地找到錯(cuò)誤記錄的位置。
雖然上面列出了很多字段類型,但最常用也就是 varchar(255),char(255),text,tinyint(4),smallint(6),mediumint,int(11)幾種。
復(fù)合類型我們一般用tinyint,更快的時(shí)間更省的空間以及更容易擴(kuò)展
關(guān)于手機(jī)號(hào),推薦用char(11),char(11)在查詢上更有效率,因?yàn)槭謾C(jī)號(hào)是一個(gè)活躍字段參與邏輯會(huì)很多。
選擇合理范圍內(nèi)最小的
我們應(yīng)該選擇最小的數(shù)據(jù)范圍,因?yàn)檫@樣可以大大減少磁盤空間及磁盤I/0讀寫開銷,減少內(nèi)存占用,減少CPU的占用率。
但是,工作中隨著項(xiàng)目越做越多,業(yè)務(wù)邏輯的處理越來(lái)越難以后,我發(fā)現(xiàn)時(shí)間類型還是用時(shí)間類型本身的字段類型要好一些,因?yàn)閙ysql有著豐富的時(shí)間函數(shù)供我使用,方便我完成很多與時(shí)間相關(guān)的邏輯,比如月排行榜,周排行榜,當(dāng)日熱門,生日多少天等等邏輯
不要使用null
為什么這么說(shuō)呢,因?yàn)镸YSQL對(duì)NULL字段索引優(yōu)化不佳,增加更多的計(jì)算難度,同時(shí)在保存與處理NULL類形時(shí),也會(huì)做更多的工作,所以從效率上來(lái)說(shuō),不建議用過(guò)多的NULL。有些值他確實(shí)有可能沒(méi)有值,怎么辦呢?解決方法是數(shù)值弄用整數(shù)0,字符串用空來(lái)定義默認(rèn)值即可。
字符串類型的使用
字符串?dāng)?shù)據(jù)類型是一個(gè)萬(wàn)能數(shù)據(jù)類型,可以儲(chǔ)存數(shù)值、字符串、日期等。
保存數(shù)值類型最好不要用字符串?dāng)?shù)據(jù)類型,這樣存儲(chǔ)的空間顯然是會(huì)更大,而且在排序時(shí)字符串的9是大于22的,其實(shí)如果進(jìn)行運(yùn)算時(shí)mysql會(huì)將字符串轉(zhuǎn)換為數(shù)值類型,大大降低效果,而且這種轉(zhuǎn)換是不會(huì)走原有的索引的。
如果明確數(shù)據(jù)在一個(gè)完整的集合中如男,女,那么可以使用set或enum數(shù)據(jù)類型,這種數(shù)據(jù)類型在運(yùn)算及儲(chǔ)存時(shí)以數(shù)值方式操作,所以效率要比字符串更好,同時(shí)空間占用更少。
VARCHAR與CHAR
VARCHAR是可變長(zhǎng)度字符串類型,那么即然長(zhǎng)度是可變的就會(huì)使用1,2個(gè)字節(jié)來(lái)保存字符的長(zhǎng)度,如果長(zhǎng)度在255內(nèi)使用1個(gè)字節(jié)來(lái)保存字符長(zhǎng)度,否則使用2個(gè)字符來(lái)保存長(zhǎng)度。由于varchar是根據(jù)儲(chǔ)存的值來(lái)保存數(shù)據(jù),所以可以大大節(jié)約磁盤空間。
如果數(shù)據(jù)經(jīng)常被執(zhí)行更新操作,由于VARCHAR是根據(jù)內(nèi)容來(lái)進(jìn)行儲(chǔ)存的,所以mysql將做更多的工作來(lái)完成更新操作,如果新數(shù)據(jù)長(zhǎng)度大于老數(shù)據(jù)長(zhǎng)度一些存儲(chǔ)引擎會(huì)進(jìn)行拆分操作處理。同時(shí)varchar會(huì)完全保留內(nèi)部所有數(shù)據(jù),最典型的說(shuō)明就是尾部的空格。
CHAR固定長(zhǎng)度的字符串保存類型,CHAR會(huì)去掉尾部的空格。在數(shù)據(jù)長(zhǎng)度相近時(shí)使用char類型比較合適,比如md5加密的密碼用戶名等。
如果數(shù)據(jù)經(jīng)常進(jìn)行更新修改操作,那么CHAR更好些,因?yàn)閏har長(zhǎng)度固定,性能上要快。
數(shù)值類型的選擇
數(shù)值數(shù)據(jù)類型要比字符串執(zhí)行更快,區(qū)間小的數(shù)據(jù)類型占用空間更少,處理速度更快,如tinyint可比bigint要快的多
選擇數(shù)據(jù)類型時(shí)要考慮內(nèi)容長(zhǎng)度,比如是保存毫米單位還是米而選擇不同的數(shù)值類型
整數(shù)
整數(shù)類型很多比如tinyint、int、smallint、bigint等,那么我們要根據(jù)自己需要存儲(chǔ)的數(shù)據(jù)長(zhǎng)度決定使用的類型,同時(shí)tinyint(10)與tinyint(100)在儲(chǔ)存與計(jì)算上并無(wú)任何差別,區(qū)別只是顯示層面上,但是我們也要選擇適合合適的數(shù)據(jù)類型長(zhǎng)度。可以通過(guò)指定zerofill屬性查看顯示時(shí)區(qū)別。
浮點(diǎn)數(shù)與精度數(shù)值
浮點(diǎn)數(shù)float在儲(chǔ)存空間及運(yùn)行效率上要優(yōu)于精度數(shù)值類型decimal,但float與double會(huì)有舍入錯(cuò)誤而decimal則可以提供更加準(zhǔn)確的小數(shù)級(jí)精確運(yùn)算不會(huì)有錯(cuò)誤產(chǎn)生計(jì)算更精確,適用于金融類型數(shù)據(jù)的存儲(chǔ)。
更多建議: