HomeLập trìnhPythonCác thư viện...

Các thư viện cần thiết cho Machine Learning trong Python


của Shubhi Asthana

Python thường là ngôn ngữ được lựa chọn cho các nhà phát triển, những người cần áp dụng các kỹ thuật thống kê hoặc phân tích dữ liệu trong công việc của họ. Nó cũng được sử dụng bởi các nhà khoa học dữ liệu có nhiệm vụ cần được tích hợp với các ứng dụng web hoặc môi trường sản xuất.

Python thực sự tỏa sáng trong lĩnh vực máy học. Sự kết hợp của cú pháp nhất quán, thời gian phát triển ngắn hơn và tính linh hoạt khiến nó rất phù hợp để phát triển các mô hình tinh vi và công cụ dự đoán có thể cắm trực tiếp vào hệ thống sản xuất.

Một trong những tài sản lớn nhất của Python là bộ thư viện phong phú của nó.

Thư viện là tập hợp các thủ tục và chức năng được viết bằng một ngôn ngữ nhất định. Một bộ thư viện mạnh mẽ có thể giúp các nhà phát triển thực hiện các tác vụ phức tạp dễ dàng hơn mà không cần viết lại nhiều dòng mã.

Học máy phần lớn dựa trên toán học. Cụ thể là tối ưu hóa toán học, thống kê và xác suất. Các thư viện Python giúp các nhà nghiên cứu/nhà toán học ít được trang bị kiến ​​thức về lập trình viên có thể dễ dàng “làm máy học”.

Dưới đây là một số thư viện được sử dụng phổ biến nhất trong học máy:

Scikit-learning để làm việc với các thuật toán ML cổ điển

saQHUdhXbYflEmnDMhN5Qewekg0h6KPx9oIT

Scikit-learning là một trong những thư viện ML phổ biến nhất. Nó hỗ trợ nhiều thuật toán học có giám sát và không giám sát. Các ví dụ bao gồm hồi quy tuyến tính và logistic, cây quyết định, phân cụm, phương tiện k, v.v.

Đọc thêm  Sắp xếp bong bóng – Thuật toán trong Java, C++, Python với mã ví dụ

Nó được xây dựng trên hai thư viện cơ bản của Python là NumPy và SciPy. Nó bổ sung một bộ thuật toán cho các tác vụ khai thác dữ liệu và học máy phổ biến, bao gồm phân cụm, hồi quy và phân loại. Ngay cả các tác vụ như chuyển đổi dữ liệu, lựa chọn tính năng và phương pháp tập hợp có thể được thực hiện trong một vài dòng.

Đối với người mới làm quen với ML, Scikit-learning là một công cụ quá đủ để làm việc, cho đến khi bạn bắt đầu triển khai các thuật toán phức tạp hơn.

Tensorflow cho Deep Learning

5M9fILVJO06e0zPLStKihIlOYxsLUw8f3kI9

Nếu bạn đang trong thế giới của máy học, có lẽ bạn đã nghe nói về, thử hoặc triển khai một số dạng thuật toán học sâu. Chúng có cần thiết không? Không phải lúc nào cũng vậy. Họ có mát mẻ khi thực hiện đúng không? Đúng!

Điều thú vị về Tensorflow là khi bạn viết một chương trình bằng Python, bạn có thể biên dịch và chạy trên CPU hoặc GPU của mình. Vì vậy, bạn không cần phải viết ở cấp độ C++ hoặc CUDA để chạy trên GPU.

Nó sử dụng một hệ thống các nút nhiều lớp cho phép bạn nhanh chóng thiết lập, đào tạo và triển khai các mạng thần kinh nhân tạo với các bộ dữ liệu lớn. Đây là thứ cho phép Google xác định các đối tượng trong ảnh hoặc hiểu lời nói trong ứng dụng nhận dạng giọng nói của mình.

Theano cũng dành cho Deep Learning

e-jPhWk8t0PSdEJeLtt9F32FroB1fiLfZbEo

Theano là một thư viện Python tốt khác để tính toán số và tương tự như NumPy. Theano cho phép bạn xác định, tối ưu hóa và đánh giá các biểu thức toán học liên quan đến mảng nhiều chiều một cách hiệu quả.

Điều làm nên sự khác biệt của Theano là nó tận dụng GPU của máy tính. Điều này cho phép nó thực hiện các phép tính cần nhiều dữ liệu nhanh hơn tới 100 lần so với khi chỉ chạy trên CPU. Tốc độ của Theano làm cho nó trở nên đặc biệt có giá trị cho việc học sâu và các nhiệm vụ tính toán phức tạp khác.

Đọc thêm  Ví dụ về hàm Python – Cách khai báo và gọi với tham số

Bản phát hành cuối cùng của thư viện Theano là vào năm ngoái — 2017, phiên bản 1.0.0 với nhiều tính năng mới, thay đổi giao diện và cải tiến.

Pandas để trích xuất và chuẩn bị dữ liệu

Pandas là một thư viện rất phổ biến cung cấp các cấu trúc dữ liệu cấp cao, dễ sử dụng cũng như trực quan.

Nó có nhiều phương pháp sẵn có để nhóm, kết hợp dữ liệu và lọc cũng như thực hiện phân tích chuỗi thời gian.

Pandas có thể dễ dàng tìm nạp dữ liệu từ các nguồn khác nhau như cơ sở dữ liệu SQL, tệp CSV, Excel, JSON và thao tác dữ liệu để thực hiện các thao tác trên đó. Có hai cấu trúc chính trong thư viện:

  • “Sê-ri” — một chiều
XOnqsPFM6zmV3Yy6Sgs5palSmfHxMJLK-JYz
  • “Khung dữ liệu” – hai chiều.
c6PpmB9g6ixbMmmYm8YfhmT7bc4Vx2IepqTe

Để biết thêm chi tiết về cách sử dụng Sê-ri và Khung dữ liệu, hãy xem bài đăng trên blog khác của tôi.

Matplotlib để trực quan hóa dữ liệu

NqFp4qWaItpXVSCaxGyIMQbmZRaKFn6Pcbrd
Nguồn hình ảnh: https://github.com/nschloe/matplotlib2tikz

ML tốt nhất và phức tạp nhất sẽ vô nghĩa nếu bạn không thể truyền đạt nó cho người khác.

Vậy làm thế nào để bạn thực sự xoay chuyển giá trị từ tất cả dữ liệu mà bạn có? Làm thế nào để bạn truyền cảm hứng cho các nhà phân tích kinh doanh của mình và kể cho họ những “câu chuyện” đầy “cái nhìn sâu sắc”?

Đây là nơi Matplotlib đến để giải cứu. Nó là một thư viện Python tiêu chuẩn được mọi nhà khoa học dữ liệu sử dụng để tạo các biểu đồ và biểu đồ 2D. Nó ở mức khá thấp, có nghĩa là nó yêu cầu nhiều lệnh hơn để tạo ra các biểu đồ và số liệu đẹp mắt hơn so với một số thư viện nâng cao.

Đọc thêm  Nối trong Python – Cách nối vào Danh sách hoặc Mảng

Tuy nhiên, mặt trái của điều đó là tính linh hoạt. Với đủ lệnh, bạn có thể tạo bất kỳ loại biểu đồ nào bạn muốn với Matplotlib. Bạn có thể tạo các biểu đồ đa dạng, từ biểu đồ biểu đồ và biểu đồ phân tán đến biểu đồ tọa độ không phải Descartes.

Nó hỗ trợ các chương trình phụ trợ GUI khác nhau trên tất cả các hệ điều hành và cũng có thể xuất đồ họa sang các định dạng đồ họa và vectơ phổ biến như PDF, SVG, JPG, PNG, BMP, GIF, v.v.

Seaborn là một thư viện trực quan hóa dữ liệu khác

03MXWUZOfFO2MzbzTQntDwMZcLVe79gpJuos
Nguồn hình ảnh: seaborn.pydata.org/

Seaborn là một thư viện trực quan phổ biến được xây dựng trên nền tảng của Matplotlib. Đây là một thư viện cấp cao hơn, nghĩa là việc tạo một số loại biểu đồ nhất định, bao gồm bản đồ nhiệt, chuỗi thời gian và biểu đồ vĩ cầm sẽ dễ dàng hơn.

Phần kết luận

Đây là tập hợp các thư viện Python quan trọng nhất cho Machine Learning. Những thư viện này đáng để xem cũng như làm quen nếu bạn dự định làm việc với Python và khoa học dữ liệu.

Tôi có bỏ lỡ bất kỳ Thư viện Python ML quan trọng nào không? Nếu vậy, xin vui lòng đảm bảo đề cập đến nó trong các ý kiến ​​​​dưới đây. Mặc dù tôi đã cố gắng đề cập đến những thư viện hữu ích nhất, tôi vẫn có thể không đề cập đến một số thư viện khác đáng được xem xét.

Câu hỏi hoặc phản hồi? Tôi rất muốn nghe ý kiến ​​từ bạn — vui lòng để lại nhận xét hoặc kết nối với tôi trên Tdí dỏm/Linkedin.





Zik.vn – Biên dịch & Biên soạn Lại

spot_img

Create a website from scratch

Just drag and drop elements in a page to get started with Newspaper Theme.

Buy Now ⟶

Bài viết liên quang

DMCA.com Protection Status