Tạo biểu đồ phân tán trong Excel để xác định mối quan hệ giữa hai biến

Nội dung được viết bởi Thanh Hằng

Biểu đồ phân tán là một trong nhiều loại biểu đồ có sẵn trong Excel, và được sử dụng rất nhiều trong các bản báo cáo để làm nổi bật mối quan hệ của hai đại lượng. Trong bài viết này, Gitiho sẽ cùng bạn tìm hiểu tất tần tật về biểu đồ phân tán trong Excel. 

Biểu đồ phân tán trong Excel là gì?

Biểu đồ phân tán (còn được gọi là biểu đồ XY) là một loại biểu đồ cho biết liệu có mối quan hệ giữa hai biến hay không. Với loại biểu đồ này, một biến được vẽ trên trục hoành và biến kia trên trục tung, và được sử dụng để xác định loại tương quan nào tồn tại giữa hai biến.

Biểu đồ phân tán thể hiện mối quan hệ tương quan giữa hai biến như sau:

Nếu các dấu chấm hoặc điểm trên biểu đồ phân tán tạo thành một đường thẳng, thì mối quan hệ giữa các biến là chặt chẽ.

Nếu đường biểu thị dốc từ phía dưới bên trái sang phía trên bên phải, thì mối tương quan giữa hai biến là tỷ lệ thuận .

Nếu đường biểu thị dốc từ phía trên bên trái xuống phía dưới bên phải, thì mối tương quan giữa hai biến là tỷ lệ nghịch.

Nếu các điểm phân bố rộng rãi, thì mối quan hệ giữa các biến là không chắc chắn.

Nếu các điểm trên biểu đồ xuất hiện ngẫu nhiên, hai biến được hiểu là không có mối tương quan.

Khi một biểu đồ phân tán được tạo với các đường nối, người ta có thể hiểu lầm và nghĩ rằng đó là một biểu đồ đường. Tuy nhiên, đồ thị phân tán và đồ thị đường không giống nhau. 

Sự khác biệt giữa biểu đồ phân tán và biểu đồ đường

Bạn có thể phân biệt sự khác biệt giữa hai loại biểu đồ này theo những cách sau:

Biểu đồ phân tán thiên về mối quan hệ giữa hai biến, trong khi biểu đồ đường nhấn mạnh hơn vào các giá trị gắn liền với các biến đó.

Biểu đồ phân tán luôn có dữ liệu số trên cả hai trục, với mục tiêu xác định mối quan hệ giữa hai biến. Biểu đồ vẽ giao điểm của các giá trị số X và Y thành các điểm dữ liệu đơn lẻ. Biểu đồ đường chỉ có một trục số (trục tung - trục Y).

Biểu đồ phân tán không bao giờ hiển thị các danh mục trên trục hoành, trong khi biểu đồ đường thì có.

Giả sử rằng chúng ta có dữ liệu trang tính sau:

Tạo biểu đồ phân tán trong Excel để xác định mối quan hệ giữa hai biến
 

Biểu đồ đường

Tạo biểu đồ phân tán trong Excel để xác định mối quan hệ giữa hai biến
 

Hai hạn chế của biểu đồ đường trên là:

  1. Vì các con số được sử dụng để đo lường từng biến số rất xa nhau, nên rất khó để nhìn thấy những thay đổi và dao động đối với những con số mang giá trị nhỏ hơn (Nhiệt độ hàng ngày). Chúng ta không thể thấy rõ sự chênh lệch giữa nhiệt độ vào ngày 14 tháng 3 (2,5 độ C) và nhiệt độ vào ngày 20 tháng 3 (16,2 độ C).
  2. Nếu bạn đang cố gắng thiết lập mối tương quan giữa hai biến số, rất khó để xác định một mô hình. 

Mặt khác, một biểu đồ phân tán của cùng một dữ liệu sẽ trông như thế này:

Tạo biểu đồ phân tán trong Excel để xác định mối quan hệ giữa hai biến
 

Một mối quan hệ nghịch đảo rõ ràng được chỉ ra giữa cả hai biến trong biểu đồ phân tán ở trên. Trong trường hợp này, cột ngày (cột A) bị bỏ qua khỏi dữ liệu nguồn biểu đồ vì nó không liên quan đến mối quan hệ giữa hai biến.

Xem thêm: Hướng dẫn cách để tạo biểu đồ trong Excel: Các dạng và ví dụ

Khi nào nên sử dụng biểu đồ phân tán trong Excel

Quyết định sử dụng biểu đồ phân tán, hoặc bất kỳ loại biểu đồ nào khác, thường sẽ dựa trên câu chuyện mà biểu đồ của bạn phải kể.

Nếu biểu đồ của bạn được sử dụng để chứng minh mối quan hệ giữa hai biến số, hãy chọn biểu đồ phân tán. 

Một biểu đồ phân tán sẽ trả lời các câu hỏi như, “Có mối quan hệ giữa nhiệt độ hàng ngày và lượng mưa hàng ngày không? Chúng ta có thể mong đợi rằng một sự thay đổi ở một trong hai biến có khả năng dẫn đến một sự thay đổi có thể dự đoán được ở biến còn lại không? ”

Mặt khác, hãy sử dụng biểu đồ đường thay vì biểu đồ phân tán nếu dữ liệu của bạn có các giá trị văn bản được đo trong một khoảng thời gian hoặc nếu bạn đang so sánh các danh mục, chẳng hạn như lượng mưa cho cùng một ngày trong hai năm trở lên. Trên biểu đồ đường, trục Y thường sẽ mang các giá trị số và các điểm dữ liệu được liên kết để tạo thành một dòng thời gian:

Tạo biểu đồ phân tán trong Excel để xác định mối quan hệ giữa hai biến
 

Cách tạo biểu đồ phân tán trong Excel

Hãy xem qua các bước để tạo một biểu đồ phân tán:

Bước 1: Kiểm soát dữ liệu của bạn

Đảm bảo rằng dữ liệu của bạn ở định dạng chính xác, vì đồ thị phân tán hiển thị hai giá trị số có liên quan với nhau như thế nào, nên cả hai đều phải được hiển thị trong hai cột riêng biệt.

Cột đầu tiên thường sẽ được vẽ trên trục X và cột thứ hai trên trục Y. Biến độc lập thường nằm trên trục X và biến phụ thuộc trên trục Y.

Bước 2: Chọn dữ liệu có liên quan

Đánh dấu các cột chứa cả hai bộ biến. Nếu các cột không liền nhau, hãy giữ phím Ctrl giữa các lựa chọn (Chỉ chọn các cột có hai tập dữ liệu đang được kiểm tra về mối quan hệ nguyên nhân/kết quả).

Bước 3: Chọn loại biểu đồ phân tán mong muốn

Từ tab Insert, chuyển đến nhóm Charts và nhấp vào biểu tượng Scatter

Tạo biểu đồ phân tán trong Excel để xác định mối quan hệ giữa hai biến
 

Các loại biểu đồ phân tán trong Excel

Một số loại biểu đồ phân tán có sẵn từ menu Insert Charts. Bao gồm:

  • Biểu đồ phân tán 'Classic' (chỉ với các điểm dữ liệu)
  • Biểu đồ phân tán với các đường cong và điểm đánh dấu
  • Biểu đồ phân tán với các đường cong
  • Biểu đồ phân tán bằng các đường thẳng và điểm đánh dấu
  • Biểu đồ phân tán bằng các đường thẳng

Tạo biểu đồ phân tán trong Excel để xác định mối quan hệ giữa hai biến
 

Biểu đồ phân tán với các đường được sử dụng tốt nhất khi bạn có ít điểm dữ liệu. Nếu không, biểu đồ của bạn có thể trông khá lộn xộn.

Xem thêm: Hướng dẫn cách làm đẹp cho biểu đồ Gantt Chart trên Excel

Vẽ biểu đồ phân tán với nhiều cặp XY

Chúng ta có thể tạo một biểu đồ phân tán trong Excel với hai hoặc nhiều bộ dữ liệu được không? Chúng ta có thể tạo biểu đồ phân tán với nhiều cặp XY không?

Câu trả lời là chúng ta có thể, và trên thực tế, điều này được thực hiện theo nhiều cách. Mình sẽ giới thiệu cho bạn phương pháp đơn giản và dễ hiểu nhất:

  1. Tạo hai tập dữ liệu riêng biệt, đối với mỗi tập dữ liệu, biến phụ thuộc phải ở bên phải của biến độc lập, như được thấy bên dưới.
  2. Tạo biểu đồ phân tán từ tập dữ liệu đầu tiên bằng cách đánh dấu dữ liệu và sử dụng trình tự Insert > Chart > Scatter.
  3. Chọn biểu đồ.
  4. Chuyển đến tab Design và nhấp vào Select Data
    Tạo biểu đồ phân tán trong Excel để xác định mối quan hệ giữa hai biến
  5. Trong hộp thoại Select Data Source, bên dưới mục Legend Entries (Series) , hãy bấm Add.
     
  6. Hộp thoại Edit Series, sẽ xuất hiện. Từ đây, bạn sẽ nhập các chi tiết liên quan đến tập dữ liệu thứ hai, bao gồm tên chuỗi, phạm vi giá trị trục X và phạm vi giá trị trục Y.

    Tạo biểu đồ phân tán trong Excel để xác định mối quan hệ giữa hai biến
     
  7. Nhấp vào OK và điều này sẽ đưa bạn trở lại hộp thoại Select Data Source - Chọn Nguồn Dữ liệu
Tạo biểu đồ phân tán trong Excel để xác định mối quan hệ giữa hai biến

 

  1. Nhấp vào OK, và bạn sẽ thấy bộ giá trị XY thứ hai được vẽ trên biểu đồ phân tán.

Tùy chỉnh một biểu đồ phân tán trong Excel

Các bước để tùy chỉnh biểu đồ phân tán tương tự như cách làm đối với hầu hết các biểu đồ khác . Bạn có thể tùy chỉnh biểu đồ của mình bằng cách thay đổi, thêm hoặc xóa những thứ như:

Nhãn dữ liệu - Data labels

Tiêu đề biểu đồ - A chart title

Tiêu đề trục - Axis titles

Đường xu hướng - Trendline

Thực hiện việc này bằng cách chọn biểu đồ, sau đó nhấp vào biểu tượng dấu cộng (+) màu xanh lá cây ở góc trên bên phải để mở Chart Elements. Tất cả các thay đổi có sẵn cho loại biểu đồ của bạn sẽ được hiển thị và một mũi tên mở rộng ở bên phải của mỗi lựa chọn, cung cấp các tùy chọn bổ sung.

Tạo biểu đồ phân tán trong Excel để xác định mối quan hệ giữa hai biến
 

Xem thêm: 25 kỹ năng Excel mà bạn nên biết từ cơ bản, trung cấp đến nâng cao

Kết luận

Biểu đồ phân tán có thể là một trong những biểu đồ Excel hữu ích nhất mà bạn chưa sử dụng. Những điểm quan trọng cần nhớ là:

Nếu ngày tháng hoặc mốc thời gian là quan trọng, thì bạn hãy nghĩ đến biểu đồ đường hoặc biểu đồ cột.

Nếu bạn nghĩ rằng hai biến có mối tương quan và bạn muốn làm nổi bật hoặc xác định mối quan hệ đó, thì biểu đồ phân tán là lựa chọn tốt nhất cho bạn.

Các biến độc lập thường được thể hiện trên trục hoành và các biến phụ thuộc trên trục tung.

Hy vọng bạn đã hiểu và áp dụng thành công cho công việc của mình. Nếu bạn có bất kỳ câu hỏi nào về biểu đồ Excel nói riêng và Excel nói chung thì đừng ngại ngần bình luận ở phía dưới cho Gitiho biết nhé! Đừng quên theo dõi chúng mình để xem thêm các bài viết bổ ích về những kĩ năng khác trong các bài học Excel online khác nhé!

KHÓA HỌC EXCEL ONLINE HOÀN TOÀN MIỄN PHÍ

Khóa học với hơn 14000 HỌC VIÊN đang học và đánh giá trung bình 4.76 SAO

5/5 - (1 bình chọn)

5/5 - (1 bình chọn)

0 thảo luận

@ 2020 - Bản quyền của Công ty cổ phần công nghệ giáo dục Gitiho Việt Nam
Giấy chứng nhận Đăng ký doanh nghiệp số: 0109077145, cấp bởi Sở kế hoạch và đầu tư TP. Hà Nội
Giấy phép mạng xã hội số: 588, cấp bởi Bộ thông tin và truyền thông