详解使用「前缀异或」&「哈希表」来加速查找|Java 刷题打卡

本文正在参加「Java主题月 – Java 刷题打卡」,详情查看 活动链接

题目描述

这是 LeetCode 上的 1442. 形成两个异或相等数组的三元组数目 ,难度为 中等

Tag : 「数学」、「前缀和」

给你一个整数数组 arr 。

现需要从数组中取三个下标 i、j 和 k ,其中 (0 <= i < j <= k < arr.length) 。

a 和 b 定义如下:

  • a = arr[i] ^ arr[i + 1] ^ … ^ arr[j – 1]
  • b = arr[j] ^ arr[j + 1] ^ … ^ arr[k]

注意:^ 表示 按位异或 操作。

请返回能够令 a == b 成立的三元组 (i, j , k) 的数目。

示例 1:

输入:arr = [2,3,1,6,7]

输出:4

解释:满足题意的三元组分别是 (0,1,2), (0,2,2), (2,3,4) 以及 (2,4,4)
复制代码

示例 2:

输入:arr = [1,1,1,1,1]

输出:10
复制代码

示例 3:

输入:arr = [2,3]

输出:0
复制代码

示例 4:

输入:arr = [1,3,5,7,9]

输出:3
复制代码

示例 5:

输入:arr = [7,11,12,9,5,2,7,17,22]

输出:8
复制代码

提示:

  • 1 <= arr.length <= 300
  • 1 <= arr[i] <= 10810^8

基本分析

数据范围是 10210^2,三元组包含 iijjkk 三个下标,因此通过「枚举下标」并「每次循环计算异或结果」的 O(n4)O(n^4) 朴素做法不用考虑了。

相信做过 1310. 子数组异或查询 的同学不难想到可以使用「树状数组」或者「前缀异或」来优化我们「每次循环计算异或结果」的过程。

由于不涉及修改操作,我们优先使用「前缀异或」。经过这样优化之后的复杂度是 O(n3)O(n^3),可以过。


前缀异或

预处理出「前缀异或」数组,并枚举三元组的下标。

本质上是利用集合(区间结果)的容斥原理。只不过前缀和需要利用「减法(逆运算)」做容斥,而前缀异或是利用「相同数值进行异或结果为 00(偶数次的异或结果为 00)」的特性实现容斥。

代码:

class Solution {
    public int countTriplets(int[] arr) {
        int n = arr.length;
        int[] sum = new int[n + 1];
        for (int i = 1; i <= n; i++) sum[i] = sum[i - 1] ^ arr[i - 1];
        int ans = 0;
        for (int i = 1; i <= n; i++) {
            for (int j = i + 1; j <= n; j++) {
                for (int k = j; k <= n; k++) {
                    int a = sum[j - 1] ^ sum[i - 1];
                    int b = sum[k] ^ sum[j - 1];
                    if (a == b) ans++;
                }
            }
        }
        return ans;
    }
}
复制代码
  • 时间复杂度:O(n3)O(n^3)
  • 空间复杂度:O(n)O(n)

前缀异或 & 哈希表

我们重新审视一下这道题。

题目其实是要我们 取得连续的一段区间 [i,k][i, k],并在这一段中找到分割点 jj,使得区间内分割点左边的异或结果为 aa,分割点右边的异或结果为 bb。并最终让 aabb 相等。

aabb 相等,我们可以推导出 ab=0a ⊕ b = 0,再结合 aabb 的由来,可以推导出 [i,k][i, k] 连续一段的异或结果为 00

再结合我们预处理的「前缀异或」数组,可得:

Xor(i,k)=sum[k]sum[i1]=0Xor(i, k) = sum[k] ⊕ sum[i – 1] = 0

根据公式和「相同数值异或结果为 00」特性,我们可以知道 sum[k]sum[k]sum[i1]sum[i – 1] 数值相等,因此我们可以使用「哈希表」记录每个出现过的异或结果对应的下标集合,从而实现在确定 kk 的情况下,通过 O(1)O(1) 的复杂度找到所有符合条件的 ii

需要注意的是,因为我们「前缀异或」数组的下标是从 11 开始,所以我们需要先往「哈希表」存入一个哨兵 00 作为边界,当然这一步不需要特殊操作,只需要让 kk00 开始执行循环即可(利用「前缀异或」数组中下标 00 的值本身为 00)。

代码:

class Solution {
    public int countTriplets(int[] arr) {
        int n = arr.length;
        // 预处理前缀异或数组
        int[] sum = new int[n + 1];
        for (int i = 1; i <= n; i++) sum[i] = sum[i - 1] ^ arr[i - 1];
        int ans = 0;
        // 记录出现过的异或结果,存储格式:{ 异或结果 : [下标1, 下标2 ...] }
        Map<Integer, List<Integer>> map = new HashMap<>();
        for (int k = 0; k <= n; k++) {
            List<Integer> list = map.getOrDefault(sum[k], new ArrayList<>());
            for (int idx : list) {
                int i = idx + 1;
                ans += k - i;
            }
            list.add(k);
            map.put(sum[k], list);
        }
        return ans;
    }
}
复制代码
class Solution {
    public int countTriplets(int[] arr) {
        int n = arr.length;
        // 事实上,甚至可以不预处理「前缀异或数组」,使用一个变量 xor 边遍历边计算即可
        int xor = 0, ans = 0;
        Map<Integer, List<Integer>> map = new HashMap<>();
        for (int k = 0; k <= n; k++) {
            if (k >= 1) xor ^= arr[k - 1];
            List<Integer> list = map.getOrDefault(xor, new ArrayList<>());
            for (int idx : list) {
                int i = idx + 1;
                ans += k - i;
            }
            list.add(k);
            map.put(xor, list);
        }
        return ans;
    }
}
复制代码
  • 时间复杂度:O(n2)O(n^2)
  • 空间复杂度:O(n)O(n)

最后

这是我们「刷穿 LeetCode」系列文章的第 No.1442 篇,系列开始于 2021/01/01,截止于起始日 LeetCode 上共有 1916 道题目,部分是有锁题,我们将先将所有不带锁的题目刷完。

在这个系列文章里面,除了讲解解题思路以外,还会尽可能给出最为简洁的代码。如果涉及通解还会相应的代码模板。

为了方便各位同学能够电脑上进行调试和提交代码,我建立了相关的仓库:github.com/SharingSour…

在仓库地址里,你可以看到系列文章的题解链接、系列文章的相应代码、LeetCode 原题链接和其他优选题解。

© 版权声明
THE END
喜欢就支持一下吧
点赞0 分享