Phân loại VS Hồi quy

Mar 22 2022
Học máy được giám sát
Học máy được giám sát Học máy có giám sát là một trong những danh mục phụ của Học máy. Nếu bạn đang bắt đầu hành trình học máy của mình thì có thể đây là loại thuật toán học máy đầu tiên bạn sẽ sử dụng.
Ảnh của Andrea De Santis trên Unsplash

Học máy được giám sát

Học máy có giám sát là một trong những danh mục phụ của Học máy. Nếu bạn đang bắt đầu hành trình học máy của mình thì có thể đây là loại thuật toán học máy đầu tiên bạn sẽ sử dụng. Trong học máy có giám sát, thuật toán học theo ví dụ. Trong học máy có giám sát, chúng ta có cả đầu vào của dữ liệu cũng như đầu ra. Trong giai đoạn huấn luyện, thuật toán cố gắng tìm một mẫu giữa dữ liệu đầu vào và đầu ra tương ứng của nó.

Sau khi học trong giai đoạn đào tạo, một thuật toán học máy được giám sát sẽ cố gắng dự đoán kết quả đầu ra của dữ liệu chưa nhìn thấy mới dựa trên quá trình đào tạo trước đó. Mục tiêu của thuật toán học máy có giám sát là dự đoán nhãn lớp chính xác (đầu ra) cho điểm dữ liệu mới chưa nhìn thấy.

Học máy được giám sát có thể được chia thành hai danh mục con: Phân loại và Hồi quy.

Hình 1: Danh mục con của Học máy được giám sát.

Phân loại so với hồi quy

Vì cả hai đều là thuật toán học có giám sát nên chúng tôi có cả dữ liệu đầu vào và đầu ra tương ứng của chúng. Giai đoạn đào tạo cũng giống nhau, cả hai thuật toán này đều cố gắng tìm ra mẫu giữa dữ liệu đầu vào và đầu ra tương ứng của nó. Ngay cả mục tiêu của cả hai thuật toán này đều giống nhau, để dự đoán nhãn lớp chính xác (đầu ra) cho điểm dữ liệu mới chưa nhìn thấy.

Vậy sự khác biệt nằm ở đâu? Nó nằm trong nhãn lớp (đầu ra) của tập dữ liệu. Trong phân loại , nhãn lớp (giá trị đầu ra) là giá trị rời rạc (nghĩa là đánh giá tích cực hoặc đánh giá tiêu cực, tương tự hoặc không tương tự, spam hoặc không phải spam, v.v.). Một số thuật toán phân loại phổ biến là:

  • K-Những người hàng xóm gần nhất
  • Naive Bayes
  • Hồi quy logistic (tên bao gồm "hồi quy" nhưng nó thực sự là một thuật toán phân loại).
  • Máy vector hỗ trợ
  • Cây quyết định
  • Hồi quy tuyến tính
  • Hồi quy Ridge
  • Hồi quy Lasso
  • Cây quyết định

Phần kết luận

Sự khác biệt giữa phân loại và hồi quy nằm ở nhãn lớp của nó (giá trị đầu ra). Nếu nhãn lớp (giá trị đầu ra) là một giá trị rời rạc thì chúng ta cần sử dụng thuật toán dựa trên phân loại và nếu giá trị đầu ra là một giá trị liên tục thì chúng ta cần sử dụng thuật toán dựa trên hồi quy.

Cảm ơn vì đã dành thời gian cho tôi!

© Copyright 2021 - 2023 | vngogo.com | All Rights Reserved