Số luồng trên vi xử lý

19/06/2021

Lập trình đa luồng luôn bị coi là một chủ đề phức tạp và đáng sợ. Tuy nhiên, rất khó né tránh chủ đề này khi app của chúng ta càng ngày càng thực hiện nhiều tác vụ mà vẫn phải đảm bảo trải nghiệm người dùng. Trong series này mình sẽ cùng các bạn khám phá mọi góc cạnh của đa luồng và biến nó trở thành công cụ đắc lực. Với bất kỳ kiến thức nào, nền tảng luôn là thứ quan trọng nhất. Vậy nên, mình sẽ dành phần đầu series để nói về cách thức hoạt động của CPU và hệ điều hành. Kiến thức này sẽ giúp ta hiểu rõ hơn về bản chất của lập trình đa luồng trong iOS

CPU & Core

CPU là bộ não của một thiết bị điện tử. Nó nhận lệnh từ hệ điều hành và biến chúng thành các tính toán cần thiết. CPU được cấu thành bởi một hoặc nhiều Core với chức năng thực hiện các tính toán trên.

Chip M1 của Apple sở hữu CPU với 8 Core

Mỗi Core chỉ có thể làm duy nhất một tác vụ một lúc. Hiểu một cách đơn giản, nếu CPU là bộ não, thì Core như cánh tay của nó. Mỗi tay chỉ làm một việc tại một thời điểm như cầm sách, quẹt điện thoại, hay di chuột. Theo logic trên, ta có thể suy ra số Core tỉ lệ thuận với số tác vụ được thực thi song song.

Process & Thread

CPU và Core là phần cứng, và hệ điều hành là phần mềm giúp ta giao tiếp với chúng. Trong iOS, một chương trình khi chạy được tạo nên bởi một process tương ứng. Process có nhiệm vụ cung cấp các tài nguyên, tập lệnh, và vùng nhớ cần thiết cho hoạt động của chương trình đó. Các process khác nhau chạy tách biệt và không dùng chung bất cứ dữ liệu nào.

Gmail và Safari là 2 process độc lập

Process sở hữu một hoặc nhiều luồng. Luồng, hay còn gọi là thread, là hàng chờ của các lệnh. Mỗi khi bạn gọi function như reloadData, hay tạo biến như let language = "swift", chúng sẽ biến thành chỉ dẫn cho CPU dưới dạng nhị phân và được đặt vào thread. Các thread sẽ chuyển những chỉ dẫn đó tới CPU và sau đó CPU sẽ sử dụng Core để thực thi và thay đổi trạng thái của process.

Quay lại phép ẩn dụ ở phần trước, bạn hãy hình dung bộ não đang tung hứng nhiều quả bóng với 2 cánh tay, mỗi cánh tay chỉ có thể cầm một quả bóng và ngay sau đó phải đổi sang quả bóng khác. Những quả bóng ở đây chính là thread, và hành động tung hứng cũng giống việc CPU điều khiển các Core thực hiện chỉ dẫn trong thread đó. Một Core chỉ làm việc với một thread một lúc và chỉ xử lý một chỉ dẫn trong thread đó tại bất cứ thời điểm nào.

Nguồn GIPHY

Điều gì sẽ xảy ra khi số tay được tăng từ 2 lên 4? Nếu câu trả lời của bạn là bộ não giờ đây có thể cầm tối đa 4 quả bóng cùng lúc thì bạn đã hiểu chính xác rồi đấy.

Nguồn GIPHY [sorry, đây gif hợp lý nhất mình có thể tìm được]

Số thread trong một process không cố định. Process có thể huỷ hoặc sinh ra thread mới khi cần thiết. Các thread trong cùng một process chia sẻ vùng nhớ và dữ liệu với nhau. Dữ liệu ở đây có thể kể đến như object, function, con trỏ địa chỉ vùng nhớ, hoặc bất kì biến nào được tạo ra. Các thread khác nhau sở hữu độ ưu tiên khác nhau. CPU chạy thread dựa theo độ ưu tiên giảm dần.

Mỗi process sở hữu một tập thread riêng. Các thread trong một process hoạt động trên cùng một vùng nhớ

Trong iOS, ta không làm việc với process mà chỉ có thể tương tác với thread qua class Thread. Tuy nhiên, Thread là một API bậc thấp và yêu cầu người code phải xử lý rất nhiều chi tiết phức tạp. 99.99% trường hợp, bạn nên tránh sử dụng nó trực tiếp. Hãy ưu tiên các API bậc cao như Grand Central Dispatch [GCD] hoặc Operation. Nếu bạn thấy GCD là một thuật ngữ xa lạ thì đừng sợ, thực ra đây là một API rất thân thuộc với chúng ta. Chắc hẳn bạn đã từng dùng DispatchQueue.main.async rồi chứ 😉

Về bản chất, khi app khởi tạo, iOS sẽ cung cấp cho nó một thread chính, gọi là main thread. Code bạn viết ra mặc định chạy trên thread này. Đây cũng là thread bắt buộc phải dùng để gọi code liên quan tới UI. Bạn có thể truy cập main thread qua DispatchQueue.main


override func viewDidLoad[] {
    super.viewDidLoad[]
    
    //code mặc định chạy trên main thread
    tableView.delegate = self
    tableView.dataSource = self

    callAPI[]
}

func callAPI[] {
    //vẫn đang ở trên main thread
    let url = URL[string: "domain"]!

    URLSession.shared.dataTask[with: url] { [data, res, err] in
        //...
        //hiện đang không ở main thread
        //...

        DispatchQueue.main.async {
            //quay lại main thread để cập nhật UI
            tableView.reloadData[]
        }
    }
}

Khi bạn gọi DispatchQueue.main.sync hoặc DispatchQueue.main.aync thì các dòng lệnh ở giữa 2 dấu { } sẽ được chạy trên main thread. Ta gọi chung những dòng lệnh đó là task.

Từ giờ khi dùng thread là mình muốn ám chỉ thread của process, còn Thread để biểu thị class Thread trong swift

Đa luồng - Multithreading

Trang bị những kiến thức trên, chúng ta đã sẵn sàng tìm hiểu đa luồng và chi tiết cách CPU cùng các Core hoạt động với nó.

Multithreading là gì?

Multithreading là khả năng xử lý nhiều thread cùng lúc của CPU. Khi có nhiều task khác nhau, CPU có thể làm việc với chúng đồng thời - concurrent hoặc song song - parallel.

Giả sử tồn tại task A với thời gian chạy 1 phút, và task B với thời gian chạy 2 phút.

  • Hai task A, B chạy parallel nếu CPU xử lí chúng cùng thời điểm. Tổng thời gian cần để hoàn thành 2 task sẽ là thời gian chạy của task lâu nhất, tức max[A, B] = 2 phút
  • Hai task A, B chạy đồng thời nếu CPU xử lí chúng parallel hoặc chạy một phần của task A rồi đổi sang task B và cứ thể lặp lại cho đến khi 2 task hoàn thành. Tổng thời gian chạy có thể là max[A, B] = 2 phút nếu chúng thực sự chạy parallel, hoặc A + B = 3 phút nếu CPU phải đổi giữa các task.
2-Core CPU có thể chạy 2 task A và B song song trong khi 1-Core CPU phải thay đổi liên tục giữa các task

Nhắc lại kiến thức phần trước, Core là nơi thực hiện các task và mỗi Core chỉ chạy 1 task tại một thời điểm. Chính vì lí do này, 1-Core CPU chỉ có thể thực thi một task một lúc, và càng nhiều Core thì CPU càng thực hiện được nhiều task.

Từ đây ta có thể hiểu concurrent là làm nhiều task cùng lúc. CPU không cần đợi task A hoàn thành để bắt đầu task B. Nó đạt được điều này bằng cách chạy các task đồng thời trên nhiều Core khác nhau, hoặc liên tục chuyển giữa chúng tại 1 Core. Parallel là trường hợp đặc biệt của concurrent, khi các task thực sự được cùng xử lý tại một thời điểm. Số task tối đa có thể chạy parallel chính bằng số Core của CPU.

Về mặt hiệu năng, xử lý parallel giúp giảm thời gian hoàn thành task trong khi đối với concurrent thì điều này không được đảm bảo. Một điều cần lưu ý nữa là việc đổi giữa các task của các thread khác nhau không miễn phí.

Khoảng xám giữa các lần đổi task là thời gian chuẩn bị cho task mới của CPU

Để đổi task, hệ điều hành phải lưu trạng thái hiện giờ của CPU, xác định task mới, thiết lập trạng thái cho task mới, load các thông tin cần thiết vào bộ nhớ và cache, load các lệnh chưa chạy hoặc đang chạy dở, và cuối cùng mới có thể thực thi task đó. Chính vì lí do này, multithread phải được dùng một cách rất cẩn trọng và có suy nghĩ. Việc lạm dụng multithread sẽ phản tác dụng và làm chậm app của bạn thay vì tăng tốc cho nó.

Tại sao cần multithreading

Những năm 90, máy tính phổ thông chỉ có một Core duy nhất. Điều này có nghĩa nếu không có multithreading, bạn sẽ không thể vừa nghe nhạc vừa duyệt web, hoặc không thể vừa down phim vừa làm luận án. Rất may là điều đó không phải sự thật. CPU có tốc độ xử lý hàng nghìn triệu phép tính một giây, kết hợp với multithreading, 1-Core CPU cho chúng ta ảo giác rằng ta có thể cùng lúc thao tác nhiều việc dù thực chất nó chỉ đang luân phiên xử lý các tác vụ.

Ngày nay, kể cả khi máy tính sở hữu nhiều Core hơn, việc multithreading bằng cách đổi task vẫn rất phổ biến. Lý do đơn giản bởi vì luôn có hàng trăm process khác nhau chạy ngầm trong máy tính của bạn. Trong thực tế, rất khó để biết chắc chắn được khi nào các tác vụ được chạy parallel hoặc concurrent vì điều này hoàn toàn phụ thuộc vào số Core, cơ chế hoạt động của từng CPU, và hệ điều hành. iOS không cho bạn lựa chọn giữa parallel và concurrent. Bạn chỉ có thể chuyển task cho thread và hệ thống sẽ thực thi chúng tuỳ theo hoàn cảnh.

Vậy nên từ giờ trở đi, mình sẽ dùng thuật ngữ concurrency [danh từ của concurrent] để nói chung cho cả parallel và concurrent.

Race condition

Multithreading không chỉ có màu hồng. Nếu bạn đã từng phải debug những lỗi khó tái hiện, hoặc lỗi thi thoảng mới gặp thì rất nhiều khả năng chúng liên quan đến concurrency. Ở phần này bài viết, chúng ta sẽ cùng tìm hiểu một vấn đề kinh điển khi code đa luồng.

Thread trong một process hoạt động trên cùng một vùng nhớ và chia sẻ hầu hết tài nguyên của process. Nếu tại một thời điểm, hai hoặc nhiều thread cùng truy cập và thay đổi một địa chỉ nhớ thì thứ tự truy cập của chúng sẽ ảnh hưởng đến kết quả bạn nhận được. Nói một cách khác, kết quả của tác vụ trở nên không thể đoán định và phụ thuộc vào trình tự chạy của các thread. Hiện tượng này được gọi là race condition.

Hình dung bạn và một người lạ đang ở rạp phim và cùng có ý định mua vé xem Avengers. Điều gì sẽ xảy ra nếu 2 nhân viên quầy vé cùng nhấn nút một lúc? Có thể người mua được là bạn hoặc cũng có thể là người lạ kia. Nếu viễn cảnh đấy lặp lại 100 lần, không gì đảm bảo 100 lần đó kết quả đều như nhau.

Trong thực tế, việc kết quả của các lệnh phụ thuộc vào sự kết hợp đan xen ngẫu nhiên của các thread gây ra rất nhiều rắc rối


class UnsafeDataSource {
    private var model: [Int] = [1, 2, 3]
    
    func removeAll[] {
        model.removeAll[]
    }
    
    func printFirstItem[] {
        if !model.isEmpty {
            print[model[0]]
        }
    }
}

Giả sử có hai thread A, B cùng đọc và thay đổi giá trị của UnsafeDataSource, thread A gọi function removeAll để xoá hết item trong model, còn thread B in item đầu tiên sau khi kiểm tra model không rỗng. Trong trường hợp A chạy xong hoàn toàn rồi mới đến B, không có gì được in ra. Nếu B chạy trước A, model[0] sẽ được in trước khi A xoá item trong model.

Tuy nhiên, do trình tự thực thi của các thread không thể đoán định, hoàn toàn có khả năng B vừa check isEmpty xong thì CPU đổi sang thread A và chạy lệnh removeAll. Lúc này sẽ xảy ra crash khi CPU quay lại thread B để chạy lệnh print[model[0]] vì mặc dù B đã check isEmptyfalse, điều này không còn đúng tại thời điểm model[0] thực thi vì toàn bộ item đã bị xoá

Race condition khi nhiều thread cùng làm việc với UnsafeDataSource

Một trường hợp hay gặp gây ra bởi race condition là Fatal error: Index out of range ở hàm cellForRow[at indexPath:] khi tableView.reloadData[]. Nguyên nhân là do trạng thái của UITableView không đồng nhất với model do hàm reloadDatacellForRow truy cập model ở trên main thread nhưng trong lúc đó model lại bị thay đổi ở một thread khác.

Class và struct bạn tạo ra mặc định không an toàn để sử dụng đa luồng. Nếu biến và các thuộc tính của chúng có thể bị thay đổi bởi bất kì thread nào thì race condition chắc chắn sẽ xảy ra. Code chạy đúng 1000 lần không có nghĩa bạn sẽ an toàn ở lần thứ 1001.

Value type trong swift không phải lúc nào cũng an toàn để sử dụng đa luồng

Tổng kết

Chúng ta đã cùng nhau hiểu rõ hơn về cách hoạt động của CPU, Core, cũng như cách chúng kết hợp với iOS để chạy code của ứng dụng. Ta cũng biết thêm về một vấn đề nổi cộm trong multithreading là race condition. Ở những bài tiếp theo, mình sẽ nói kĩ hơn về cách sử dụng các API đa luồng trong iOS như DispatchQueue, Operation, và NSLock. Trong quá trình đó, bạn cũng sẽ được giới thiệu về các vấn đề của chúng như deadlock và priority inversion. Hẹn gặp lại ở bài viết tới ;]

Chủ Đề