HomeLập trìnhPythonCách sử dụng...

Cách sử dụng Python để thu thập các đánh giá trên App Store


Quét dữ liệu, thường được gọi là quét web, là một kỹ thuật để lấy dữ liệu và nội dung từ internet.

Bạn thường giữ thông tin này trong một tệp cục bộ để bạn có thể thay đổi và kiểm tra nó khi cần.

Quét web về cơ bản chỉ là sao chép và dán nội dung từ một trang web vào bảng tính Excel ở quy mô rất nhỏ.

Mục tiêu chính của bài viết này là giúp bạn bắt đầu quét web bằng các bước nhanh chóng và dễ dàng. Bạn sẽ học cách thu thập các bài đánh giá trên cửa hàng ứng dụng bằng cách sử dụng app_store_scraper thư viện bằng Python. Có những công cụ và thư viện khác mà bạn có thể sử dụng như Scrapy, PandasBeautifulSoup nhưng ở đây chúng ta sẽ sử dụng cách sử dụng app_store_scraper.

Tùy thuộc vào cơ chế bạn chọn để quét web, nó có thể thực sự đơn giản hoặc khá phức tạp.

May mắn thay, có một phần mềm đơn giản và tuyệt vời có thể giúp bạn thu thập các bài đánh giá về ứng dụng của mình từ cửa hàng ứng dụng Apple và sử dụng chúng để phân tích thêm cảm tính.

Tại sao quét web thậm chí còn hữu ích?

Các chuyên gia phân tích dữ liệu sử dụng công cụ quét web cho nhiều nhiệm vụ khác nhau, bao gồm tạo khách hàng tiềm năng, phân tích thị trường, phân tích tâm lý người tiêu dùng và tích hợp dữ liệu.

Đọc thêm  Python if __name__ == __main__ Được giải thích bằng các ví dụ về mã

Bạn cũng có thể sử dụng tính năng quét web để theo dõi giá cổ phiếu, cơ hội trực tuyến (chẳng hạn như học bổng, việc làm, thực tập, v.v.), dữ liệu hàng tồn kho của đối thủ cạnh tranh cũng như đánh giá và xếp hạng của khách hàng.

Trong bài viết này, bạn sẽ học cách sử dụng Python để thu thập các bài đánh giá trên cửa hàng ứng dụng trong 4 bước đơn giản.

Trước khi bạn bắt đầu, đây là điều cần lưu ý: một số trang web không cho phép bạn cạo nội dung của họ, vì vậy hãy chắc chắn rằng bạn đã kiểm tra trước khi thực hiện. Việc cạo web không hoàn toàn bị cấm, nhưng bạn nên cẩn thận để biết khi nào/ở đâu bạn có thể cạo. Tôi thực sự khuyên bạn chỉ nên cạo cho mục đích thông tin và giáo dục.

Bước 1 – Cài đặt và thiết lập các gói

Trước tiên, bạn phải cài đặt và thiết lập các gói cần thiết. Trong bước này, bạn sẽ cài đặt app_store_scraper sử dụng trình cài đặt gói Python.

pip install app_store_scraper 

#or

pip3 install app_store_scraper

Bước 2 – Nhận tên và ID của ứng dụng

Tôi sẽ sử dụng một ứng dụng ngẫu nhiên và tôi sẽ thu thập các đánh giá về ứng dụng đó vì lợi ích của bản demo này. Nhưng nếu bạn có một ứng dụng cá nhân do bạn tạo và bạn có ứng dụng đó trên cửa hàng ứng dụng, thì bạn có thể sử dụng ứng dụng đó với các kỹ thuật tương tự. Bạn chỉ cần lấy tên và ID của ứng dụng mà bạn có thể tìm thấy bằng cách nhập tên của ứng dụng vào Google bằng PC của mình.

Đọc thêm  Xử lý tệp trong Python – Cách tạo, đọc và ghi vào tệp

Ví dụ:”Ứng dụng Slack trên cửa hàng ứng dụng apple

lam-google-search

Bạn nên nhấp vào kết quả đầu tiên sẽ chuyển hướng bạn đến cửa hàng chính thức của Apple. Ở đó bạn sẽ tìm thấy “ứng dụng chậm” và mọi thứ về nó.

Khi trang tải trong URL, bạn sẽ thấy tên ứng dụng (chùng) và ID ứng dụng (618783545). Sao chép nó xuống trong notepad của bạn.

Slack-app-tên-ứng dụng-id

Bây giờ bạn sẽ cần nhập một số gói và chạy một số mã:

import pandas as pd
import numpy as np
import json

from app_store_scraper import AppStore
slack = AppStore(country='us', app_name="slack", app_id = '618783545')

slack.review(how_many=2000)

Trong đoạn mã trên, bạn sẽ nhập pandas thư viện giúp bạn thêm các đánh giá/đánh giá vào một khung dữ liệu. Bạn cũng sẽ nhập khẩu numpy thư viện để chuyển đổi và sửa đổi dữ liệu. Cuối cùng, bạn sẽ nhận được app_store_scraper gói để thu thập các đánh giá từ trang web.

Bạn sẽ phải tạo và thể hiện của Appstore lớp, sau đó truyền vào các đối số country, app_name, app_id.

chùng-web-scraping
xếp hạng ứng dụng chậm

Các đánh giá đều được lưu trữ trong slack biến, vì vậy hãy chạy lệnh bên dưới để xem các đánh giá được lưu trữ ở định dạng JSON.

slack.reviews

đánh giá chậm
ứng dụng chùng đánh giá phế liệu

Bước 3 – Chuyển đổi dữ liệu từ JSON

Để làm cho dữ liệu dễ đọc hơn và được định dạng đúng, bạn cần chuyển đổi nó từ định dạng JSON sang khung dữ liệu Pandas. Bạn có thể làm điều đó với đoạn mã sau:

Đọc thêm  Đối tượng Int không thể lặp lại - Lỗi Python [Solved]

slackdf = pd.DataFrame(np.array(slack.reviews),columns=['review'])
slackdf2 = df.join(pd.DataFrame(slackdf.pop('review').tolist()))
slackdf2.head()

nhac-thuat
đánh giá được tạo trong pandas dataframe

Bước 4 – Chuyển đổi Dataframe sang CSV

Đây là bước cuối cùng: bạn sẽ chuyển khung dữ liệu thành csv (giá trị được phân tách bằng dấu phẩy) để bạn có thể có nó trên máy cục bộ của mình. Sau đó, bạn có thể xem nó trong bảng tính và cũng có thể chia sẻ nó với đồng nghiệp.

slackdf2.to_csv('Slack-app-reviews.csv')

Cuối cùng, bạn nên có “Slack-app-reviews.csv” được lưu vào thư mục dự án của bạn và bạn đã sẵn sàng.

Phần kết luận

Trong bài viết ngắn này, bạn đã có thể thu thập các bài đánh giá cửa hàng ứng dụng Slack vào một khung dữ liệu rồi lưu nó vào máy cục bộ của mình bằng 4 bước đơn giản. Tôi hy vọng bạn thích nó, chúc mừng.

Đây là kho lưu trữ GitHub nơi tôi lưu trữ mã, vui lòng đánh dấu sao cho kho lưu trữ.



Zik.vn – Biên dịch & Biên soạn Lại

spot_img

Create a website from scratch

Just drag and drop elements in a page to get started with Newspaper Theme.

Buy Now ⟶

Bài viết liên quang

DMCA.com Protection Status