python1000000个数，怎么找出重复的数字.md · chenp/blog

set + list

import random
import time

list_test = []
for i in range(100000):
    list_test.append(random.randint(0,1000000))
myset = set(list_test)
k = 0
start_time = time.time()
for i in myset:
    if list_test.count(i) >= 1:
        k += 1
print("重复数字有%d个" % k)
print("共花费%s" % str(time.time() - start_time))

Counter

counter用法https://www.cnblogs.com/Eva-J/articles/7291842.html

from collections import Counter
import random
import time

list_test = []
for i in range(100000):
    list_test.append(random.randint(0,1000000))
start_time = time.time()
a = Counter(list_test)
k = 0
for key, val in a.items():
    if val >= 1:
        k += 1

print('重复数字有%d个' % k)
print("共花费%s" % str(time.time() - start_time))

defaultdict

from collections import Counter, defaultdict
import random
import time

list_test = []
for i in range(100000):
    list_test.append(random.randint(0,1000000))
start_time = time.time()
count_dict = defaultdict(int)
for item in list_test:
    count_dict[item] += 1
k = 0
for key, val in count_dict.items():
    if val >= 1:
        k += 1
print('重复数字有%d个' % k)
print("共花费%s" % str(time.time() - start_time))

list + dict

from collections import Counter, defaultdict
import random
import time

list_test = []
for i in range(100000):
    list_test.append(random.randint(0,1000000))
start_time = time.time()
a = {}
for i in list_test:
    if list_test.count(i) >= 1:
        a[i] = list_test.count(i)
print(len(a))
print("共花费%s" % str(time.time() - start_time))

速度很慢

总结

collections模块的两个库速度比较快

chenp / blog

set + list

Counter

defaultdict

list + dict

总结

简介

发行版

贡献者

近期动态

chenp / blog .gitee-modal { width: 500px !important; }

set + list

Counter

defaultdict

list + dict

总结

简介

发行版

贡献者

近期动态

搜索帮助

chenp / blog