C++二分查找插入點(diǎn)

2023-09-20 09:20 更新

圖 10-4   二分查找插入點(diǎn)示例數(shù)據(jù)二分查找不僅可用于搜索目標(biāo)元素,還具有許多變種問(wèn)題,比如搜索目標(biāo)元素的插入位置。

10.2.1   無(wú)重復(fù)元素的情況

Question

給定一個(gè)長(zhǎng)度為 n 的有序數(shù)組 ?nums? 和一個(gè)元素 ?target? ,數(shù)組不存在重復(fù)元素?,F(xiàn)將 ?target? 插入到數(shù)組 ?nums? 中,并保持其有序性。若數(shù)組中已存在元素 ?target? ,則插入到其左方。請(qǐng)返回插入后 ?target? 在數(shù)組中的索引。

二分查找插入點(diǎn)示例數(shù)據(jù)

圖 10-4   二分查找插入點(diǎn)示例數(shù)據(jù)

如果想要復(fù)用上節(jié)的二分查找代碼,則需要回答以下兩個(gè)問(wèn)題。

問(wèn)題一:當(dāng)數(shù)組中包含 target 時(shí),插入點(diǎn)的索引是否是該元素的索引?

題目要求將 target 插入到相等元素的左邊,這意味著新插入的 target 替換原來(lái) target 的位置。也就是說(shuō),當(dāng)數(shù)組包含 target 時(shí),插入點(diǎn)的索引就是該 target 的索引。

問(wèn)題二:當(dāng)數(shù)組中不存在 target 時(shí),插入點(diǎn)是哪個(gè)元素的索引?

進(jìn)一步思考二分查找過(guò)程:當(dāng) nums[m] < target 時(shí) i 移動(dòng),這意味著指針 i 在向大于等于 target 的元素靠近。同理,指針 j 始終在向小于等于 target 的元素靠近。

因此二分結(jié)束時(shí)一定有:i 指向首個(gè)大于 target 的元素,j 指向首個(gè)小于 target 的元素。易得當(dāng)數(shù)組不包含 target 時(shí),插入索引為 i 。

binary_search_insertion.cpp

/* 二分查找插入點(diǎn)(無(wú)重復(fù)元素) */
int binarySearchInsertionSimple(vector<int> &nums, int target) {
    int i = 0, j = nums.size() - 1; // 初始化雙閉區(qū)間 [0, n-1]
    while (i <= j) {
        int m = i + (j - i) / 2; // 計(jì)算中點(diǎn)索引 m
        if (nums[m] < target) {
            i = m + 1; // target 在區(qū)間 [m+1, j] 中
        } else if (nums[m] > target) {
            j = m - 1; // target 在區(qū)間 [i, m-1] 中
        } else {
            return m; // 找到 target ,返回插入點(diǎn) m
        }
    }
    // 未找到 target ,返回插入點(diǎn) i
    return i;
}

存在重復(fù)元素的情況

Question

在上一題的基礎(chǔ)上,規(guī)定數(shù)組可能包含重復(fù)元素,其余不變。

假設(shè)數(shù)組中存在多個(gè) target ,則普通二分查找只能返回其中一個(gè) target 的索引,而無(wú)法確定該元素的左邊和右邊還有多少 target。

題目要求將目標(biāo)元素插入到最左邊,所以我們需要查找數(shù)組中最左一個(gè) target 的索引。初步考慮通過(guò)圖 10-5 所示的步驟實(shí)現(xiàn)。

  1. 執(zhí)行二分查找,得到任意一個(gè) target 的索引,記為 k 。
  2. 從索引 k 開(kāi)始,向左進(jìn)行線性遍歷,當(dāng)找到最左邊的 target 時(shí)返回。

線性查找重復(fù)元素的插入點(diǎn)

圖 10-5   線性查找重復(fù)元素的插入點(diǎn)

此方法雖然可用,但其包含線性查找,因此時(shí)間復(fù)雜度為 O(n) 。當(dāng)數(shù)組中存在很多重復(fù)的 target 時(shí),該方法效率很低。

現(xiàn)考慮拓展二分查找代碼。如圖 10-6 所示,整體流程保持不變,每輪先計(jì)算中點(diǎn)索引 m ,再判斷 target 和 nums[m] 大小關(guān)系,分為以下幾種情況。

  • 當(dāng) nums[m] < target 或 nums[m] > target 時(shí),說(shuō)明還沒(méi)有找到 target ,因此采用普通二分查找的縮小區(qū)間操作,從而使指針 i 和 j 向 target 靠近
  • 當(dāng) nums[m] == target 時(shí),說(shuō)明小于 target 的元素在區(qū)間 [i,m?1] 中,因此采用 j=m?1 來(lái)縮小區(qū)間,從而使指針 j 向小于 target 的元素靠近。

循環(huán)完成后,i 指向最左邊的 target ,j 指向首個(gè)小于 target 的元素,因此索引 i 就是插入點(diǎn)

二分查找重復(fù)元素的插入點(diǎn)的步驟

binary_search_insertion_step2

binary_search_insertion_step3

binary_search_insertion_step4

binary_search_insertion_step5

binary_search_insertion_step6

binary_search_insertion_step7

binary_search_insertion_step8

圖 10-6   二分查找重復(fù)元素的插入點(diǎn)的步驟

觀察以下代碼,判斷分支 nums[m] > target 和 nums[m] == target 的操作相同,因此兩者可以合并。

即便如此,我們?nèi)匀豢梢詫⑴袛鄺l件保持展開(kāi),因?yàn)槠溥壿嫺忧逦?、可讀性更好。

binary_search_insertion.cpp

/* 二分查找插入點(diǎn)(存在重復(fù)元素) */
int binarySearchInsertion(vector<int> &nums, int target) {
    int i = 0, j = nums.size() - 1; // 初始化雙閉區(qū)間 [0, n-1]
    while (i <= j) {
        int m = i + (j - i) / 2; // 計(jì)算中點(diǎn)索引 m
        if (nums[m] < target) {
            i = m + 1; // target 在區(qū)間 [m+1, j] 中
        } else if (nums[m] > target) {
            j = m - 1; // target 在區(qū)間 [i, m-1] 中
        } else {
            j = m - 1; // 首個(gè)小于 target 的元素在區(qū)間 [i, m-1] 中
        }
    }
    // 返回插入點(diǎn) i
    return i;
}

Tip

本節(jié)的代碼都是“雙閉區(qū)間”寫(xiě)法。有興趣的讀者可以自行實(shí)現(xiàn)“左閉右開(kāi)”寫(xiě)法。

總的來(lái)看,二分查找無(wú)非就是給指針 i 和 j分別設(shè)定搜索目標(biāo),目標(biāo)可能是一個(gè)具體的元素(例如 target ),也可能是一個(gè)元素范圍(例如小于 target 的元素)。

在不斷的循環(huán)二分中,指針 i 和 j 都逐漸逼近預(yù)先設(shè)定的目標(biāo)。最終,它們或是成功找到答案,或是越過(guò)邊界后停止。


以上內(nèi)容是否對(duì)您有幫助:
在線筆記
App下載
App下載

掃描二維碼

下載編程獅App

公眾號(hào)
微信公眾號(hào)

編程獅公眾號(hào)