一文带你搞清楚python的多线程和多进程-kb88凯时官网登录

来自：网络

时间：2024-06-12

阅读：

本文分享自云社区，作者：柠檬味拥抱。

python作为一种高级编程语言，提供了多种并发编程的方式，其中多线程与多进程是最常见的两种方式之一。在本文中，我们将探讨python中多线程与多进程的概念、区别以及如何使用线程池与进程池来提高并发执行效率。

多线程与多进程的概念

多线程

多线程是指在同一进程内，多个线程并发执行。每个线程都拥有自己的执行栈和局部变量，但共享进程的全局变量、静态变量等资源。多线程适合用于i/o密集型任务，如网络请求、文件操作等，因为线程在等待i/o操作完成时可以释放gil（全局解释器锁），允许其他线程执行。

多进程

多进程是指在操作系统中同时运行多个进程，每个进程都有自己独立的内存空间，相互之间不受影响。多进程适合用于cpu密集型任务，如计算密集型算法、图像处理等，因为多进程可以利用多核cpu并行执行任务，提高整体运算速度。

线程池与进程池的介绍

线程池

线程池是一种预先创建一定数量的线程并维护这些线程，以便在需要时重复使用它们的技术。线程池可以减少线程创建和销毁的开销，提高线程的重复利用率。在python中，可以使用concurrent.futures.threadpoolexecutor来创建线程池。

进程池

进程池类似于线程池，不同之处在于进程池预先创建一定数量的进程并维护这些进程，以便在需要时重复使用它们。进程池可以利用多核cpu并行执行任务，提高整体运算速度。在python中，可以使用concurrent.futures.processpoolexecutor来创建进程池。

线程池与进程池的应用示例

下面是一个简单的示例，演示了如何使用线程池和进程池来执行一组任务。

import concurrent.futures
import time
def task(n):
    print(f"start task {n}")
    time.sleep(2)
    print(f"end task {n}")
    return f"task {n} result"
def main():
    # 使用线程池
    with concurrent.futures.threadpoolexecutor(max_workers=3) as executor:
        results = executor.map(task, range(5))
        for result in results:
            print(result)
    # 使用进程池
    with concurrent.futures.processpoolexecutor(max_workers=3) as executor:
        results = executor.map(task, range(5))
        for result in results:
            print(result)
if __name__ == "__main__":
    main()

在上面的示例中，我们定义了一个task函数，模拟了一个耗时的任务。然后，我们使用threadpoolexecutor创建了一个线程池，并使用map方法将任务提交给线程池执行。同样地，我们也使用processpoolexecutor创建了一个进程池，并使用map方法提交任务。最后，我们打印出每个任务的结果。

线程池与进程池的性能比较

一文带你搞清楚python的多线程和多进程

虽然线程池与进程池都可以用来实现并发执行任务，但它们之间存在一些性能上的差异。

线程池的优势

轻量级: 线程比进程更轻量级，创建和销毁线程的开销比创建和销毁进程要小。
共享内存: 线程共享同一进程的内存空间，可以方便地共享数据。
低开销: 在切换线程时，线程只需保存和恢复栈和寄存器的状态，开销较低。

进程池的优势

真正的并行: 进程可以利用多核cpu真正并行执行任务，而线程受到gil的限制，在多核cpu上无法真正并行执行。
稳定性: 进程之间相互独立，一个进程崩溃不会影响其他进程，提高了程序的稳定性。
资源隔离: 每个进程有自己独立的内存空间，可以避免多个线程之间的内存共享问题。

性能比较示例

下面是一个简单的性能比较示例，演示了线程池和进程池在执行cpu密集型任务时的性能差异。

import concurrent.futures
import time
def cpu_bound_task(n):
    result = 0
    for i in range(n):
        result  = i
    return result
def main():
    start_time = time.time()
    # 使用线程池执行cpu密集型任务
    with concurrent.futures.threadpoolexecutor(max_workers=3) as executor:
        results = executor.map(cpu_bound_task, [1000000] * 3)
    print("time taken with threadpoolexecutor:", time.time() - start_time)
    start_time = time.time()
    # 使用进程池执行cpu密集型任务
    with concurrent.futures.processpoolexecutor(max_workers=3) as executor:
        results = executor.map(cpu_bound_task, [1000000] * 3)
    print("time taken with processpoolexecutor:", time.time() - start_time)
if __name__ == "__main__":
    main()

在上面的示例中，我们定义了一个cpu_bound_task函数，模拟了一个cpu密集型任务。然后，我们使用threadpoolexecutor和processpoolexecutor分别创建线程池和进程池，并使用map方法提交任务。最后，我们比较了两种方式执行任务所花费的时间。

通过运行以上代码，你会发现使用进程池执行cpu密集型任务的时间通常会比使用线程池执行快，这是因为进程池可以利用多核cpu真正并行执行任务，而线程池受到gil的限制，在多核cpu上无法真正并行执行。

一文带你搞清楚python的多线程和多进程

当考虑如何实现一个能够同时下载多个文件的程序时，线程池和进程池就成为了很有用的工具。让我们看看如何用线程池和进程池来实现这个功能。

首先，我们需要导入相应的库：

import concurrent.futures
import requests
import time

然后，我们定义一个函数来下载文件：

def download_file(url):
    filename = url.split("/")[-1]
    print(f"downloading {filename}")
    response = requests.get(url)
    with open(filename, "wb") as file:
        file.write(response.content)
    print(f"downloaded {filename}")
    return filename

接下来，我们定义一个函数来下载多个文件，这里我们使用线程池和进程池来分别执行：

def download_files_with_thread_pool(urls):
    start_time = time.time()
    with concurrent.futures.threadpoolexecutor() as executor:
        results = executor.map(download_file, urls)
    print("time taken with threadpoolexecutor:", time.time() - start_time)
def download_files_with_process_pool(urls):
    start_time = time.time()
    with concurrent.futures.processpoolexecutor() as executor:
        results = executor.map(download_file, urls)
    print("time taken with processpoolexecutor:", time.time() - start_time)

最后，我们定义一个主函数来测试这两种方式的性能：

def main():
    urls = [
        "https://www.example.com/file1.txt",
        "https://www.example.com/file2.txt",
        "https://www.example.com/file3.txt",
        # add more urls if needed
    ]
    download_files_with_thread_pool(urls)
    download_files_with_process_pool(urls)
if __name__ == "__main__":
    main()

通过运行以上代码，你可以比较使用线程池和进程池下载文件所花费的时间。通常情况下，当下载大量文件时，使用进程池的性能会更好，因为它可以利用多核cpu实现真正的并行下载。而使用线程池则更适合于i/o密集型任务，如网络请求，因为线程在等待i/o操作完成时可以释放gil，允许其他线程执行。

这个例子展示了如何利用线程池和进程池来提高并发下载文件的效率，同时也强调了根据任务特点选择合适的并发编程方式的重要性。

并发编程中的注意事项

虽然线程池与进程池提供了方便的并发执行任务的方式，但在实际应用中还需要注意一些问题，以避免出现潜在的并发问题和性能瓶颈。

共享资源的同步

在多线程编程中，共享资源的访问需要进行同步，以避免竞争条件和数据不一致性问题。可以使用锁、信号量等同步机制来保护关键资源的访问。
在多进程编程中，由于进程之间相互独立，共享资源的同步相对简单，可以使用进程间通信（如管道、队列）来传递数据，避免数据竞争问题。

内存消耗与上下文切换

创建大量线程或进程可能会导致内存消耗增加，甚至引起内存泄漏问题。因此，在设计并发程序时需要注意资源的合理利用，避免创建过多的线程或进程。
上下文切换也会带来一定的开销，特别是在频繁切换的情况下。因此，在选择并发编程方式时，需要综合考虑任务的特点和系统资源的限制，以及上下文切换的开销。

异常处理与任务超时

在并发执行任务时，需要注意异常处理机制，及时捕获和处理任务中可能出现的异常，以保证程序的稳定性和可靠性。
另外，为了避免任务阻塞导致整个程序停滞，可以设置任务的超时时间，并在超时后取消任务或进行相应的处理。

最佳实践与建议

在实际应用中，为了编写高效、稳定的并发程序，可以遵循以下一些最佳实践和建议：

合理设置并发度: 根据系统资源和任务特点，合理设置线程池或进程池的大小，避免创建过多的线程或进程。
合理分配任务: 根据任务的类型和特点，合理分配任务到线程池或进程池中，以充分利用系统资源。
注意异常处理: 在任务执行过程中及时捕获和处理异常，保证程序的稳定性和可靠性。
监控与调优: 使用监控工具和性能分析工具对并发程序进行监控和调优，及时发现和解决性能瓶颈和潜在问题。

通过遵循以上最佳实践和建议，可以编写出高效、稳定的并发程序，提高程序的执行效率和性能。同时，也可以避免一些常见的并发编程陷阱和问题，确保程序的质量和可靠性。

总结

本文介绍了在python中使用线程池和进程池来实现并发编程的方法，并提供了相应的代码示例。首先，我们讨论了多线程和多进程的概念及其在并发编程中的应用场景。然后，我们深入探讨了线程池和进程池的工作原理以及它们之间的性能比较。

在代码示例部分，我们演示了如何使用线程池和进程池来执行多个任务，其中包括下载多个文件的示例。通过比较两种方式执行任务所花费的时间，我们可以更好地了解它们在不同场景下的优劣势。

此外，文章还提供了一些并发编程中的注意事项和最佳实践，包括共享资源的同步、内存消耗与上下文切换、异常处理与任务超时等。这些建议有助于开发者编写高效、稳定的并发程序，提高程序的执行效率和性能。

总的来说，线程池和进程池是python中强大的工具，能够帮助开发者轻松实现并发编程，并充分利用计算资源。选择合适的并发编程方式，并结合实际场景和任务特点，可以编写出高效、可靠的并发程序，提升应用的性能和用户体验。

本文分享自华为云社区《python中的多线程与多进程编程大全【python指南】》，作者：柠檬味拥抱。python作为一种高级编程语言，提供了多种并发编程的方式，其中多线程与多进程是最常

2024-06-12 11:46:11

目录单星号(*)双星号(**)示例代码示例1：使用单星号(*)处理位置参数示例2：使用双星号(**)处理关键字参数示例3：同时使用单星号(*)和双星号(**)注意事项在python中，参数传递是一个

2024-06-07 00:18:49

目录前言使用python为excel文件添加预设文档属性使用python为excel文件添加自定义文档属性前言向excel文件添加文档属性是专业地组织和管理电子表格数据的关键步骤。这些属

2024-06-07 00:18:47

目录前言示例 1: 使用单个字符作为分隔符示例 2: 使用多个字符作为分隔符示例 3: 使用更复杂的正则表达式示例 4: 保留分隔符总结前言在python中，你可以使用re模块的split()

2024-06-07 00:18:45

问题背景：我想通过google或者其他网站通过精准搜索确认该产品是否存在，但是即使该产品不存在google也会返回一些相关的url链接，现在想通过python实现搜索结果的精准匹配以确

2024-06-07 00:18:43

目录通过plotly dash进行仪表板设计的步骤和技巧步骤1. 导入必要的库2. 创建应用程序3. 设计布局4. 运行应用程序技巧1. 使用markdown2. 添加交互元素3. 部署到服务器完整示

2024-06-07 00:18:40

目录1 前言1.1 功能上的区别1.2 参数上的区别1.3 调用时机上的区别2 使用2.1 简单示例2.2 __new__的作用1 前言在python中，每个对象都有两个特殊的方法：__new__和__init__。这

2024-06-07 00:18:39

目录在mysql中建库时指定字符集在mysql中建表时指定字符集在create table语句中指定字符集使用alter table语句修改表的字符集可以在建立数据库时指定字符集，也可以建表的时

2024-06-07 00:18:34

目录方法一方法二方法三方法一示例代码：# ansi escape codes for some colorsred = '\033[91m'green = '\033[92m'yellow = '\033[93m'blue = '\033[94m'magenta = '\033[95m

2024-06-07 00:18:33

目录通过folium在地图上展示数据python地理可视化的入门准备工作创建地图在地图上展示数据自定义图层样式地图上绘制形状添加图例在地图上添加文本标签总结通过folium在地图

2024-06-07 00:18:30

目录效果图运行环境完整代码实现思路1. 导入库和定义常量2. 创建cube类3. 实现cube类的draw方法4. 实现主函数效果图运行环境python版本：python3.x依赖包：$ pip install pygam

2024-06-07 00:18:29

目录1. 代码目录2. 每个目录的代码parent 主目录pack 包pack2 包1. 代码目录创建自定义包的时候，原理是当 python 检测到一个目录下存在 __init__.py 文件时，python 就会把它

2024-06-07 00:18:25

目录前言密码生成的要求使用secrets模块生成密码使用random模块生成密码使用第三方库生成密码示例：生成多种类型的随机密码 1. 生成只包含字母的密码 2. 生成只包含数字的密

2024-06-07 00:18:23

目录引言正文示例1示例2示例3示例4引言今天遇到了一个比较棘手的问题，于是终于打算要对正则表达式中的 (?=...) 和 (?<=...) 符号动手了。正文(?=...) 表示当 … 匹配

2024-06-07 00:18:21

目录使用matplotlib创建基本图表的完全指南安装 matplotlib导入 matplotlib折线图散点图柱状图饼图自定义图表样式子图保存图表使用数据集创建图表绘制多系列数据使用样式表

2024-06-07 00:18:19

目录在python中利用mpld3创建交互式matplotlib图表安装 mpld3示例：创建交互式散点图示例：创建交互式折线图示例：创建交互式直方图总结在python中利用mpld3创建交互式matplotlib

2024-06-07 00:18:16

代码如下:import redef check_password(password): # 检查长度是否在6-20之间 if not 6 <= len(password) <= 20: return false # 检查是否包含小写字母

2024-06-07 00:18:14

目录方法一. 利用pytorch自身方法二. 利用torchsummary方法一. 利用pytorch自身pytorch是一个流行的深度学习框架，它允许研究人员和开发者快速构建和训练神经网络。计算一个p

2024-06-07 00:18:12

目录time 说明time 常用函数time 示例参考文档time 说明python 的 time 模块提供了各种与时间处理相关的功能，包括获取当前时间、操作日期/时间以及执行与时间相关的各种其它

2024-06-07 00:18:10

目录前言版本案例kb88凯时官网登录的解决方案qthreadqtimer局部变量创建异步线程导致 ui 未响应如果 qtimer 不使用 self.time 写法前言在pyqt5中，gui线程通常指的是qt的主事件循环线程，也称为主

2024-06-07 00:18:08

目录构建python中的分布式系统celery与rabbitmq的结合什么是celery和rabbitmq？为什么要结合celery和rabbitmq？如何结合celery和rabbitmq？高级功能：任务调度和结果处理任务调度结

2024-06-07 00:18:06

目录前言用python复制幻灯片母版并应用于powerpoint演示文稿中的指定幻灯片代码示例：前言在专业演示文稿设计与制作领域，多场演示间保持一致性至关重要。在powerpoint演示文稿

2024-06-07 00:18:04

安装opencv-python 超时失败1、解释说明pip install opencv-python这个错误是由于在尝试安装opencv-python时，从files.pythonhosted.org下载文件时发生了超时。这可能是由于

2024-06-07 00:18:01

目录pip安装报错“error: microsoft visual c 14.0 or greater is required”方法一：使用 microsoft build tools for visual studio安装包方法二：使用 visual st

2024-06-07 00:17:59

目录安装第一个示例模拟用户交互处理弹窗执行自定义脚本playwright是一个强大而灵活的python库，用于自动化浏览器操作和测试。它提供了一套简洁、直观的api，使得编写可靠、可

2024-06-07 00:17:54

目录前言使用 cython 加密 python 代码环境python 源代码编写 cython 编译配置文件编译查看输出文件使用问题error: microsoft visual c 14.0 or greater is requiredpyco

2024-06-07 00:17:52

目录使用pygal库创建可缩放的矢量图表什么是pygal？安装pygal自定义图表添加交互功能创建复合图表添加数据标签和网格线添加图例和注释添加动画效果和交互功能创建地图总结使

2024-06-07 00:17:49

目录引言获取代理ip动态ip的设置和管理总结引言大家好，今天我来给大家分享一下如何通过编程技术来获取和设置代理的动态ip。在网络世界中，代理和动态ip是非常常见的概念，尤其对

2024-06-07 00:17:47

目录1 基本概念1.1 registry 类1.2 核心功能2 实现示例2.1 简化的registry类实现2.2 这个注册表类mmengine.registry 是一个在多个开源项目（如 mmengine 和 mm系列工具包，例如

2024-06-07 00:17:45

目录使用python的matplotlib库创建动态图表的技巧与实践准备工作示例：创建动态的折线图示例：创建动态的散点图示例：创建动态的柱状图示例：创建动态的饼图示例：创建动态的热力图总

2024-06-07 00:17:43

2020-10-21

2021-03-02

2020-05-07

2020-05-26

2021-01-13

2021-04-02

2020-05-09

2020-05-10