两个超大文件求交集_两个大文件,每行一个字符串,找交集-CSDN博客

网站介绍:题目背景给定a、b两个文件,各存放50亿个url,每个url各占64字节,内存限制是4G,让你找出a、b文件共同的url主体思路分治+hash实现步骤遍历文件A,对每个url使用hash(url) % 1000,根据所得的取值将url存储到1000个小文件中(a1,a2,…,a1000)(根据内存大小设定hash函数)遍历文件B,使用同样的hash函数将B中的url存储到1000个小文..._两个大文件,每行一个字符串,找交集