Case study
5 phút đọc

Pfizer dưới góc nhìn dữ liệu: Phân tích cảm xúc từ 2.000+ tweet toàn cầu

Trong bối cảnh vaccine COVID-19 từng là tâm điểm tranh luận toàn cầu, dữ liệu mạng xã hội, đặc biệt là Twitter trở thành nguồn thông tin quý giá để hiểu cảm xúc thật sự của cộng đồng, vượt ra ngoài những khảo sát truyền thống.

Một nghiên cứu đăng trên tạp chí Heliyon (Elsevier) đã thực hiện phân tích chuyên sâu hơn 2.000 tweet liên quan đến vaccine Pfizer, với mục tiêu bóc tách các yếu tố ảnh hưởng đến thái độ tiêu cực của người dùng. Đây là một ví dụ điển hình cho việc kết hợp dữ liệu xã hội + Power BI + AI để đưa ra insight có chiều sâu.

Ba câu hỏi chính mà nghiên cứu tìm lời giải

Điều gì khiến một tweet trở nên tiêu cực?

Kết quả từ mô hình AI cho thấy ngôn ngữ là yếu tố ảnh hưởng mạnh nhất.
Một số ngôn ngữ như tiếng Ba Lan, Nhật, Ba Tư, Ý hoặc Thổ Nhĩ Kỳ có xác suất tạo ra tweet tiêu cực cao hơn rõ rệt – thậm chí cao gấp đôi mức trung bình trong một số trường hợp.

Ngoài ra, các yếu tố như số lượng follower cao hoặc lượng retweet lớn cũng có liên quan đến việc lan truyền cảm xúc tiêu cực.

Vùng nào, nhóm người nào dễ phản ứng tiêu cực hơn?

Phân tích phân khúc người dùng (Top Segments) cho thấy:

  • Những người có ít follower, tương tác thấp, hoặc đến từ các tài khoản không chính thống
  • Những tweet sử dụng hashtag liên quan đến chính trị, quân đội, v.v.

là nhóm thể hiện cảm xúc tiêu cực cao hơn rất nhiều so với phần còn lại. Mức độ tiêu cực trong nhóm này có thể đạt tới 0.75, gần gấp đôi so với mức trung bình.

Chủ đề nào gây tranh cãi nhất khi nhắc đến Pfizer?

Các nội dung tiêu cực thường tập trung vào 3 nhóm chủ đề:

  1. Hiệu quả thực tế của vaccine so với kỳ vọng ban đầu
  2. Doanh thu “khổng lồ” của Pfizer trong giai đoạn đại dịch
  3. Tác dụng phụ sau tiêm, đặc biệt ở trẻ nhỏ hoặc người có bệnh nền

Đây là những vấn đề chạm đến nỗi lo cá nhân và tâm lý xã hội, dễ tạo ra tranh cãi và lan truyền cảm xúc mạnh.

Phân tích tổng quan về sentiment

Sentiment Tỷ lệ
Tiêu cực 54.5%
Trung lập 36.7%
Tích cực 8.7%

Gần như 1 trong 2 tweet là tiêu cực, một tỷ lệ không thể xem nhẹ khi đánh giá phản ứng cộng đồng với các chiến dịch y tế quy mô lớn.

Case study cho người làm phân tích: Không chỉ “đếm” cảm xúc

Nếu bạn đang làm trong lĩnh vực data, truyền thông, hoặc sức khỏe cộng đồng, đây là một bài học lớn:

Đừng chỉ dừng lại ở việc “đo sentiment”.
Hãy phân tích theo ngữ cảnh, theo phân khúc người dùng, và theo mức độ lan truyền qua từng khu vực, nền tảng.

Power BI hoàn toàn đủ khả năng xử lý bài toán này nếu bạn biết cách kết hợp:

  • Key Influencers: Dùng AI phát hiện yếu tố ảnh hưởng mạnh nhất đến sentiment
  • Top Segments: Tự động phân nhóm người dùng có đặc điểm tiêu cực nổi bật
  • Map Visual + Entity Detection: Hiển thị cảm xúc theo vị trí địa lý trích xuất từ nội dung tweet

Kết luận: Một ứng dụng thực chiến của Power BI trong phân tích xã hội

Đây là một case học điển hình cho việc ứng dụng Business Intelligence vào phân tích cảm xúc cộng đồng – một lĩnh vực đang trở nên cực kỳ quan trọng với doanh nghiệp, tổ chức y tế, và nhà hoạch định chính sách.

Nếu bạn đang làm trong ngành dược, sức khỏe, hoặc truyền thông khủng hoảng, đây là lúc bạn nên học cách làm dashboard kiểu này.

Muốn thực hành bài phân tích này bằng Power BI?
Liên hệ đội ngũ Mastering Data Analytics để được tư vấn lộ trình học chuyên sâu trong khoá học Business Intelligence qua Zalo 0961 48 66 48.

📚 Nguồn dữ liệu: Heliyon – ScienceDirect