前言:
由于很多業務表因為歷史原因或者性能原因,都使用了違反第一范式的設計模式。即同一個列中存儲了多個屬性值(具體結構見下表)。
這種模式下,應用常常需要將這個列依據分隔符進行分割,并得到列轉行的結果。
表數據:
| ID | Value | 
| 1 | tiny,small,big | 
| 2 | small,medium | 
| 3 | tiny,big | 
期望得到結果:
| ID | Value | 
| 1 | tiny | 
| 1 | small | 
| 1 | big | 
| 2 | small | 
| 2 | medium | 
| 3 | tiny | 
| 3 | big | 
正文:
#需要處理的表create table tbl_name (ID int ,mSize varchar(100));insert into tbl_name values (1,'tiny,small,big');insert into tbl_name values (2,'small,medium');insert into tbl_name values (3,'tiny,big');#用于循環的自增表create table incre_table (AutoIncreID int);insert into incre_table values (1);insert into incre_table values (2);insert into incre_table values (3);
select a.ID,substring_index(substring_index(a.mSize,',',b.AutoIncreID),',',-1) from tbl_name ajoinincre_table bon b.AutoIncreID <= (length(a.mSize) - length(replace(a.mSize,',',''))+1)order by a.ID;
原理分析:
這個join最基本原理是笛卡爾積。通過這個方式來實現循環。
以下是具體問題分析:
length(a.Size) - length(replace(a.mSize,',',''))+1 表示了,按照逗號分割后,改列擁有的數值數量,下面簡稱n
join過程的偽代碼:
根據ID進行循環
{
判斷:i 是否 <= n
{
獲取最靠近第 i 個逗號之前的數據, 即 substring_index(substring_index(a.mSize,',',b.ID),',',-1)
i = i +1
}
ID = ID +1
}
總結:
這種方法的缺點在于,我們需要一個擁有連續數列的獨立表(這里是incre_table)。并且連續數列的最大值一定要大于符合分割的值的個數。
例如有一行的mSize 有100個逗號分割的值,那么我們的incre_table 就需要有至少100個連續行。
當然,mysql內部也有現成的連續數列表可用。如mysql.help_topic: help_topic_id 共有504個數值,一般能滿足于大部分需求了。
改寫后如下:
select a.ID,substring_index(substring_index(a.mSize,',',b.help_topic_id+1),',',-1) from tbl_name ajoinmysql.help_topic bon b.help_topic_id < (length(a.mSize) - length(replace(a.mSize,',',''))+1)order by a.ID;
以上這篇mysql 列轉行的技巧(分享)就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持VeVb武林網。
新聞熱點
疑難解答