C++基數(shù)排序

2023-09-20 09:21 更新

上一節(jié)我們介紹了計數(shù)排序,它適用于數(shù)據(jù)量 n 較大但數(shù)據(jù)范圍 m 較小的情況。假設(shè)我們需要對 n=106 個學(xué)號進行排序,而學(xué)號是一個 8 位數(shù)字,這意味著數(shù)據(jù)范圍 m=108 非常大,使用計數(shù)排序需要分配大量內(nèi)存空間,而基數(shù)排序可以避免這種情況。

「基數(shù)排序 radix sort」的核心思想與計數(shù)排序一致,也通過統(tǒng)計個數(shù)來實現(xiàn)排序。在此基礎(chǔ)上,基數(shù)排序利用數(shù)字各位之間的遞進關(guān)系,依次對每一位進行排序,從而得到最終的排序結(jié)果。

算法流程

以學(xué)號數(shù)據(jù)為例,假設(shè)數(shù)字的最低位是第 1 位,最高位是第 8 位,基數(shù)排序的流程如圖 11-18 所示。

  1. 初始化位數(shù) k=1 。
  2. 對學(xué)號的第 k 位執(zhí)行“計數(shù)排序”。完成后,數(shù)據(jù)會根據(jù)第 k 位從小到大排序。
  3. k 增加 1 ,然后返回步驟 2. 繼續(xù)迭代,直到所有位都排序完成后結(jié)束。

基數(shù)排序算法流程

圖 11-18   基數(shù)排序算法流程

下面來剖析代碼實現(xiàn)。對于一個 d 進制的數(shù)字 x ,要獲取其第 k x k ,可以使用以下計算公式:

x k = ? x d k ? 1 ? mod d

其中 ?a? 表示對浮點數(shù) a 向下取整,而 modd 表示對 d 取余。對于學(xué)號數(shù)據(jù),d=10 k [ 1 , 8 ]

此外,我們需要小幅改動計數(shù)排序代碼,使之可以根據(jù)數(shù)字的第 k 位進行排序。

radix_sort.cpp

/* 獲取元素 num 的第 k 位,其中 exp = 10^(k-1) */
int digit(int num, int exp) {
    // 傳入 exp 而非 k 可以避免在此重復(fù)執(zhí)行昂貴的次方計算
    return (num / exp) % 10;
}

/* 計數(shù)排序(根據(jù) nums 第 k 位排序) */
void countingSortDigit(vector<int> &nums, int exp) {
    // 十進制的位范圍為 0~9 ,因此需要長度為 10 的桶
    vector<int> counter(10, 0);
    int n = nums.size();
    // 統(tǒng)計 0~9 各數(shù)字的出現(xiàn)次數(shù)
    for (int i = 0; i < n; i++) {
        int d = digit(nums[i], exp); // 獲取 nums[i] 第 k 位,記為 d
        counter[d]++;                // 統(tǒng)計數(shù)字 d 的出現(xiàn)次數(shù)
    }
    // 求前綴和,將“出現(xiàn)個數(shù)”轉(zhuǎn)換為“數(shù)組索引”
    for (int i = 1; i < 10; i++) {
        counter[i] += counter[i - 1];
    }
    // 倒序遍歷,根據(jù)桶內(nèi)統(tǒng)計結(jié)果,將各元素填入 res
    vector<int> res(n, 0);
    for (int i = n - 1; i >= 0; i--) {
        int d = digit(nums[i], exp);
        int j = counter[d] - 1; // 獲取 d 在數(shù)組中的索引 j
        res[j] = nums[i];       // 將當前元素填入索引 j
        counter[d]--;           // 將 d 的數(shù)量減 1
    }
    // 使用結(jié)果覆蓋原數(shù)組 nums
    for (int i = 0; i < n; i++)
        nums[i] = res[i];
}

/* 基數(shù)排序 */
void radixSort(vector<int> &nums) {
    // 獲取數(shù)組的最大元素,用于判斷最大位數(shù)
    int m = *max_element(nums.begin(), nums.end());
    // 按照從低位到高位的順序遍歷
    for (int exp = 1; exp <= m; exp *= 10)
        // 對數(shù)組元素的第 k 位執(zhí)行計數(shù)排序
        // k = 1 -> exp = 1
        // k = 2 -> exp = 10
        // 即 exp = 10^(k-1)
        countingSortDigit(nums, exp);
}

為什么從最低位開始排序?

在連續(xù)的排序輪次中,后一輪排序會覆蓋前一輪排序的結(jié)果。舉例來說,如果第一輪排序結(jié)果 a<b ,而第二輪排序結(jié)果 a > b ,那么第二輪的結(jié)果將取代第一輪的結(jié)果。由于數(shù)字的高位優(yōu)先級高于低位,我們應(yīng)該先排序低位再排序高位。

算法特性

相較于計數(shù)排序,基數(shù)排序適用于數(shù)值范圍較大的情況,但前提是數(shù)據(jù)必須可以表示為固定位數(shù)的格式,且位數(shù)不能過大。例如,浮點數(shù)不適合使用基數(shù)排序,因為其位數(shù) k 過大,可能導(dǎo)致時間復(fù)雜度 O ( n k ) ? O ( n 2 ) 。

  • 時間復(fù)雜度 O(nk):設(shè)數(shù)據(jù)量為 n 、數(shù)據(jù)為 d 進制、最大位數(shù)為 k ,則對某一位執(zhí)行計數(shù)排序使用 O(n+d) 時間,排序所有 k 位使用 O((n+d)k) 時間。通常情況下, d k 都相對較小,時間復(fù)雜度趨向 O ( n ) 。
  • 空間復(fù)雜度 O(n+d)、非原地排序:與計數(shù)排序相同,基數(shù)排序需要借助長度為 n d 的數(shù)組 rescounter 。
  • 穩(wěn)定排序:與計數(shù)排序相同。
以上內(nèi)容是否對您有幫助:
在線筆記
App下載
App下載

掃描二維碼

下載編程獅App

公眾號
微信公眾號

編程獅公眾號