list.sort 和 sorted 用哪个比较好?

Python七号

共 2142字,需浏览 5分钟

 ·

2021-11-06 14:17

排序是编程经常遇到的场景,在 Python 中,对一个列表进行排序有两种方法,一个是 list.sort 可以对列表原地排序,另一个是 Python 的内建方法 sorted,它不改变原始列表,而是返回一个新的列表,那到底用哪一个呢?

如果你不想改变原始列表,那肯定选择 sorted 啊,如果改变不改变都无所谓呢?本文就来回到这个问题。

可以先大胆猜测一下,sorted 不改变原始列表,相当于内部对列表进行了深 copy,这个过程必然更占用内存,更慢一些。

现在我们通过实际运行来比较一下:

内存占用比较

先看下结果:

代码:

import random
import resource
import sys
import time
from sniffing import FunctionSniffingClass

def list_sort(arr):
    return arr.sort()


def sorted_builtin(arr):
    return sorted(arr)

if __name__ == "__main__":
    if len(sys.argv) != 2:
        sys.exit("Please run: python (sort|sorted)")
    elif sys.argv[1] == "sorted":
        func = sorted_builtin
    elif sys.argv[1] == "sort":
        func = list_sort
    else:
        sys.exit("Please run: python (sort|sorted)")

    # Lib Testing Code
    arr = [random.randint(050for r in range(1_000_000)]
    mythread = FunctionSniffingClass(func, arr)
    mythread.start()

    used_mem = 0
    max_memory = 0
    memory_usage_refresh = 0.005  # Seconds

    while 1:
        time.sleep(memory_usage_refresh)
        used_mem = resource.getrusage(resource.RUSAGE_SELF).ru_maxrss
        if used_mem > max_memory:
            max_memory = used_mem

        # Check to see if the function call is complete
        if mythread.isShutdown():
            # Uncomment if yu want to see the results
            # print(mythread.results)
            break

    print("\nMAX Memory Usage:", round(max_memory / (2 ** 20), 3), "MB")

很明显,内建的 sorted 函数占用的内存更多。代码用到了 FunctionSniffingClass 类,这里就不展开了,完整代码请访问:https://github.com/DahlitzFlorian/list-sort-vs-sorted-list/tree/master/memory_measurement

速度比较

测试代码:

import random

from somedecorators import timeit

@timeit()
def list_sort(arr):
    return arr.sort()


@timeit()
def sorted_builtin(arr):
    return sorted(arr)


def main():
    arr = [random.randint(050for r in range(10_000_000)]

    sorted_builtin(arr)

    list_sort(arr)

if __name__ == "__main__":
    main()

最后

从结果来看,符合预期,如果不考虑是否改变原始列表的顺序,无论是内存占用还是速度,list.sort 总是更优秀。

但是,请记住,这 list.sort 仅适用于列表,而 sorted 接受任何可迭代对象。此外,如果您使用 list.sort,您将丢失原始列表的次序。

如果有帮助,请点赞、在看、关注支持,感谢。



浏览 23
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报