Phát hiện gian lận thanh toán trực tuyến bằng máy học

Jul 25 2022
Tôi nghĩ rằng mọi người đều rõ rằng việc gian lận trong thanh toán trực tuyến xảy ra và không phải là mới. Rõ ràng là bất cứ ai ở vị trí người mua đều sợ rơi vào cảnh lừa đảo, hoặc đã sa ngã hoặc biết ai đó đã bị bọn lừa đảo tóm gọn.

Tôi nghĩ rằng mọi người đều rõ rằng việc gian lận trong thanh toán trực tuyến xảy ra và không phải là mới. Rõ ràng là bất cứ ai ở vị trí người mua đều sợ rơi vào cảnh lừa đảo, hoặc đã sa ngã hoặc biết ai đó đã bị bọn lừa đảo tóm gọn. Theo nghiên cứu , gian lận thanh toán trực tuyến sẽ vượt 343 tỷ trong 5 năm.

Các ngân hàng ngày càng tự cập nhật để ngăn chặn các giao dịch gian lận diễn ra thông qua nền tảng của họ, nhưng có khó khăn lớn trong việc xác định các giao dịch đó, vì theo Ngân hàng Trung ương (BACEN) , hơn 71,5 tỷ giao dịch ngân hàng đã diễn ra vào năm 2021, trong đó 35% (gần 25 tỷ) được đăng ký bằng điện thoại di động, không tính máy tính xách tay và các loại tương tự. Sẽ không thể có tổ chức tài chính nào giám sát từng giao dịch này và tự tin phân loại chúng là gian lận hay không.

Nhờ công nghệ, ngày nay chúng ta có một cách để hiệu quả hơn trong vấn đề này, đó là cố gắng phân loại từng giao dịch này và thực hiện các hành động cho phù hợp.

Dưới đây, tôi sẽ trình bày một trong những giải pháp khả thi cho tình huống khó xử này:

  • Để xác định gian lận trong thanh toán trực tuyến, chúng tôi có thể sử dụng Học máy. Phương pháp dạy cho máy hiểu các mẫu giao dịch cũ và phân loại chúng theo cách tốt nhất có thể.
  • Điều quan trọng là phải chỉ ra rằng cũng giống như con người, máy móc mắc sai lầm và chúng ta sẽ không có, ít nhất là trong vài năm tới, một giải pháp với độ chính xác 100%.
  • Chúng tôi sẽ sử dụng tập dữ liệu kaggle chứa thông tin về các giao dịch gian lận trong quá khứ để máy hiểu các mẫu và có thể dự đoán phân loại của chúng.
  • Chúng tôi nhập các thư viện giúp chúng tôi với các mã lớn và phức tạp đã được người khác phát triển và sao chép theo cách đơn giản thông qua chúng;
  • Chúng tôi đọc tệp chúng tôi có làm cơ sở để khám phá và hiểu rõ hơn về dữ liệu chúng tôi đang sử dụng;
  • Chúng tôi đã xác định mối tương quan giữa các cột;
  • Chúng tôi thực hiện một số điều chỉnh đối với tệp để máy có thể đọc được;
  • Chúng tôi xác định thông tin nào chúng tôi sẽ dự đoán (mục tiêu dự đoán) và thông tin nào chúng tôi sẽ cung cấp cho máy để nó hiểu các mẫu và có thể tạo ra các kết quả (tính năng) khẳng định hơn;
  • Chúng tôi tách dữ liệu tệp thành dữ liệu đào tạo và dữ liệu xác thực. Dữ liệu đào tạo sẽ được cung cấp cho máy để nó nghiên cứu và học hỏi, trong khi dữ liệu xác nhận sẽ được sử dụng để kiểm tra kết quả mà máy tạo ra với kiến ​​thức mới thu được của nó;
  • Chúng tôi tạo mô hình sẽ được sử dụng bởi máy, trong trường hợp này là bộ phân loại cây quyết định;
  • Chúng tôi đào tạo mô hình với dữ liệu đào tạo;
  • Chúng tôi xác thực với dữ liệu xác thực;
  • (Nếu độ chính xác của mô hình thấp, chúng tôi sẽ cần xem xét lại một số khái niệm và làm thêm các thử nghiệm với các tính năng khác, mô hình khác cho đến khi chúng tôi hài lòng);
  • Vì vậy, chúng tôi có thể kiểm tra mô hình của mình trong thế giới thực, cung cấp đầu vào để phân loại.

Hãy theo dõi tôi trên LinkedIn và hẹn gặp lại bạn vào lần sau!

© Copyright 2021 - 2022 | vngogo.com | All Rights Reserved