Yêu cầu web song song bằng Python

Apr 10 2022
Thực hiện song song các yêu cầu web giúp cải thiện hiệu suất một cách đáng kể. Việc triển khai Python được đề xuất sử dụng Queue và Thread để tạo ra một phương pháp đơn giản tiết kiệm rất nhiều thời gian.

Thực hiện song song các yêu cầu web giúp cải thiện hiệu suất một cách đáng kể. Việc triển khai Python được đề xuất sử dụng Queue và Thread để tạo ra một phương pháp đơn giản tiết kiệm rất nhiều thời gian.

Ảnh từ E Kemmel trên Unsplash

Gần đây tôi đã đăng một số bài báo sử dụng Công cụ lập kế hoạch chuyến đi mở làm nguồn phân tích về phương tiện giao thông công cộng. Định tuyến chuyến đi được lấy từ OTP thông qua API REST của nó. OTP đang chạy trên máy cục bộ nhưng vẫn mất rất nhiều thời gian để thực hiện tất cả các yêu cầu bắt buộc. Việc thực hiện được hiển thị trong các bài viết là tuần tự. Để đơn giản, tôi đã đăng triển khai tuần tự này nhưng trong các trường hợp khác, tôi sử dụng triển khai song song. Bài viết này cho thấy một cách triển khai song song để thực hiện nhiều truy vấn web.

Mặc dù tôi có một số kinh nghiệm nhưng tôi thấy các hướng dẫn này khá khó để thành thạo. Bài viết này chứa các bài học kinh nghiệm của tôi và có thể được sử dụng để thực hiện các yêu cầu web song song.

Cốt lõi của hàm là một hàng đợi với tất cả các yêu cầu được thực hiện. Trong trường hợp này, một yêu cầu được chỉ định bởi url của nó:

Hàng đợi gói python thực hiện một hàng đợi với nhiều nhà sản xuất và người tiêu dùng. Điều này có nghĩa là hàng đợi có thể được lấp đầy từ nhiều nguồn ( Queue.put () ) và nhiều công nhân ( Luồng) có thể lấy một mục từ hàng đợi. Việc triển khai mặc định là hàng đợi First In First Out (FIFO), có nghĩa là phần tử đầu tiên được thêm vào là phần tử đầu tiên được trích xuất. Đối với mục đích này, hành vi mặc định là tốt.

Thành phần thứ hai là công nhân. Công nhân lấy một phần tử từ hàng đợi, thực thi logic cần thiết và lặp lại điều này cho tất cả các phần tử mà nó có thể lấy được từ hàng đợi.

Khi một worker được xây dựng, cần có tham chiếu đến hàng đợi (dòng 2). Worker mở rộng Luồng lớp Python . Nó kế thừa phương thức start () từ Thread . Khi phương thức này được gọi, một luồng mới được tạo và run ()phương thức được gọi trong luồng này. Phương thức run được thực hiện từ dòng 7 đến dòng 15. Dòng 9 truy xuất một phần tử từ hàng đợi (phần tử cũng bị xóa khỏi hàng đợi bởi lệnh gọi này). Khi không có phần tử nào trong hàng đợi, nó sẽ chặn cho đến khi một phần tử mới được thêm vào. Vì chúng tôi đang thêm chuỗi URL vào hàng đợi, một yêu cầu có thể được tạo (dòng 12) và thực thi (dòng 13). Kết quả của yêu cầu được thêm vào danh sách kết quả cho công nhân này (dòng 14). Cuối cùng, dòng 15 thông báo cho hàng đợi rằng một tác vụ đã được thực thi thành công.

Vì chúng ta muốn Thread kết thúc khi tất cả các cuộc gọi đã được thực hiện, chúng ta phải thực hiện một cơ chế dừng. Một cách là gọi phương thức Queue.get () với giá trị thời gian chờ. Khi không có đối tượng nào trong hàng đợi, một ngoại lệ Empty được đưa ra khi thời gian chờ vượt quá. Cá nhân tôi không thích giải pháp này. Các ngoại lệ dành cho các tình huống đặc biệt, không dành cho chức năng mong đợi. Vì vậy, mã này đang sử dụng một giá trị dừng trong hàng đợi, trong trường hợp này là một chuỗi trống. Khi một chuỗi trống được truy xuất, vòng lặp while kết thúc, do đó kết thúc phương thức run- . Khi phương thức chạy kết thúc, Chủ đề cũng tự động kết thúc.

Để tất cả chúng cùng nhau:

Một phương thức được tạo sẽ thực hiện các yêu cầu web song song. Các tham số là danh sách URL và số luồng công nhân cần tạo. Sau khi tạo hàng đợi (dòng 21–24), một nhóm công nhân sẽ được tạo. Mỗi công nhân được gắn vào hàng đợi và bắt đầu. Các luồng sẽ bị dừng khi một chuỗi trống được truy xuất từ ​​hàng đợi, vì vậy đối với mỗi công nhân, một chuỗi trống được thêm vào hàng đợi (dòng 33–34). Bởi vì chúng ta có một hàng đợi FIFO, những thứ này sẽ được lấy ra từ hàng đợi cuối cùng. Bằng cách tham gia worker, mã tiếp theo được thực thi khi tất cả các worker đã kết thúc.

Tất cả công nhân lưu trữ kết quả trong không gian bộ nhớ của riêng họ. Tất cả các kết quả này phải được kết hợp trước khi trả lại cho người gọi (dòng 40–42). Với phương pháp này, việc thực hiện nhiều cuộc gọi web song song được thực hiện trong một dòng mã (dòng 46). Kích thước mã có thể được giảm bớt bằng cách lược bỏ một vài vòng lặp nhưng để dễ đọc, chúng được tách ra.

Bây giờ, đã đến lúc trả lời câu hỏi nó cải thiện hiệu suất đến mức nào. Vì vậy, một thí nghiệm nhỏ được thực hiện. Bằng cách gửi một nghìn yêu cầu tới một phiên bản OTP cục bộ, có thể thiết lập tác động của số lượng công nhân. Một phiên bản máy chủ cục bộ được sử dụng để giảm tác động của lưu lượng mạng và tốc độ internet. Để ngăn chặn một số loại lưu vào bộ nhớ đệm, tất cả các yêu cầu đều khác nhau. Bằng cách xác định thời gian 1000 yêu cầu, chúng tôi có thể xác định tổng số cuộc gọi có thể được thực hiện trong một giờ (thông lượng).

Thông lượng được tính toán và vẽ biểu đồ dưới dạng hàm của số lượng công nhân:

Thông lượng (hình ảnh của tác giả)

Chỉ với một công nhân, hiệu suất ngang bằng với việc thực hiện mà không có song song. Nó sẽ kém hơn một chút do chi phí luồn dây thêm vào nhưng điều này không đáng kể so với các phép đo khác.

Nếu không phân luồng, thông lượng thô là 11.000 cuộc gọi mỗi giờ. Bằng cách thêm chủ đề, điều này được cải thiện lên 56.000. Sau khi đạt đến mức tối ưu này, việc thêm nhiều luồng không cải thiện hiệu suất, thậm chí nó còn giảm một chút. Thử nghiệm này được thực hiện trên một CPU có 8 nhân nên việc tìm ra mức tối ưu ở mức 8 là như mong đợi. OTP được thực hiện đa luồng và với 8 lõi, nó có thể xử lý 8 yêu cầu song song. Tùy thuộc vào các công việc khác đang chạy trên hệ thống, mức tối ưu là bằng số lõi hoặc ít hơn một chút.

Trong ví dụ OTP của chúng tôi, chúng tôi có thể tăng thông lượng lên một hệ số 5. ​​Với số lượng yêu cầu được thực hiện để tạo biểu đồ OTP trong các bài viết khác của tôi, thời gian chạy giảm từ 6 giờ xuống dưới 1. Có thể thực hiện việc tăng hiệu suất này bằng cách triển khai phương pháp đa luồng tương đối đơn giản này. Tôi hy vọng nó có thể giúp bạn tiết kiệm một chút thời gian quý báu để!

Tôi hy vọng bạn thích bài viết này. Để có cảm hứng sử dụng OTP, hãy xem một số bài viết khác của tôi:

© Copyright 2021 - 2023 | vngogo.com | All Rights Reserved