Biểu đồ phân tán là một trong nhiều loại biểu đồ có sẵn trong Excel, và được sử dụng rất nhiều trong các bản báo cáo để làm nổi bật mối quan hệ của hai đại lượng. Trong bài viết này, Gitiho sẽ cùng bạn tìm hiểu tất tần tật về biểu đồ phân tán trong Excel.
XEM NHANH BÀI VIẾT
Biểu đồ phân tán (còn được gọi là biểu đồ XY) là một loại biểu đồ cho biết liệu có mối quan hệ giữa hai biến hay không. Với loại biểu đồ này, một biến được vẽ trên trục hoành và biến kia trên trục tung, và được sử dụng để xác định loại tương quan nào tồn tại giữa hai biến.
Biểu đồ phân tán thể hiện mối quan hệ tương quan giữa hai biến như sau:
Nếu các dấu chấm hoặc điểm trên biểu đồ phân tán tạo thành một đường thẳng, thì mối quan hệ giữa các biến là chặt chẽ.
Nếu đường biểu thị dốc từ phía dưới bên trái sang phía trên bên phải, thì mối tương quan giữa hai biến là tỷ lệ thuận .
Nếu đường biểu thị dốc từ phía trên bên trái xuống phía dưới bên phải, thì mối tương quan giữa hai biến là tỷ lệ nghịch.
Nếu các điểm phân bố rộng rãi, thì mối quan hệ giữa các biến là không chắc chắn.
Nếu các điểm trên biểu đồ xuất hiện ngẫu nhiên, hai biến được hiểu là không có mối tương quan.
Khi một biểu đồ phân tán được tạo với các đường nối, người ta có thể hiểu lầm và nghĩ rằng đó là một biểu đồ đường. Tuy nhiên, đồ thị phân tán và đồ thị đường không giống nhau.
Bạn có thể phân biệt sự khác biệt giữa hai loại biểu đồ này theo những cách sau:
Biểu đồ phân tán thiên về mối quan hệ giữa hai biến, trong khi biểu đồ đường nhấn mạnh hơn vào các giá trị gắn liền với các biến đó.
Biểu đồ phân tán luôn có dữ liệu số trên cả hai trục, với mục tiêu xác định mối quan hệ giữa hai biến. Biểu đồ vẽ giao điểm của các giá trị số X và Y thành các điểm dữ liệu đơn lẻ. Biểu đồ đường chỉ có một trục số (trục tung - trục Y).
Biểu đồ phân tán không bao giờ hiển thị các danh mục trên trục hoành, trong khi biểu đồ đường thì có.
Giả sử rằng chúng ta có dữ liệu trang tính sau:
Hai hạn chế của biểu đồ đường trên là:
Mặt khác, một biểu đồ phân tán của cùng một dữ liệu sẽ trông như thế này:
Một mối quan hệ nghịch đảo rõ ràng được chỉ ra giữa cả hai biến trong biểu đồ phân tán ở trên. Trong trường hợp này, cột ngày (cột A) bị bỏ qua khỏi dữ liệu nguồn biểu đồ vì nó không liên quan đến mối quan hệ giữa hai biến.
Xem thêm: Hướng dẫn cách để tạo biểu đồ trong Excel: Các dạng và ví dụ
Quyết định sử dụng biểu đồ phân tán, hoặc bất kỳ loại biểu đồ nào khác, thường sẽ dựa trên câu chuyện mà biểu đồ của bạn phải kể.
Nếu biểu đồ của bạn được sử dụng để chứng minh mối quan hệ giữa hai biến số, hãy chọn biểu đồ phân tán.
Một biểu đồ phân tán sẽ trả lời các câu hỏi như, “Có mối quan hệ giữa nhiệt độ hàng ngày và lượng mưa hàng ngày không? Chúng ta có thể mong đợi rằng một sự thay đổi ở một trong hai biến có khả năng dẫn đến một sự thay đổi có thể dự đoán được ở biến còn lại không? ”
Mặt khác, hãy sử dụng biểu đồ đường thay vì biểu đồ phân tán nếu dữ liệu của bạn có các giá trị văn bản được đo trong một khoảng thời gian hoặc nếu bạn đang so sánh các danh mục, chẳng hạn như lượng mưa cho cùng một ngày trong hai năm trở lên. Trên biểu đồ đường, trục Y thường sẽ mang các giá trị số và các điểm dữ liệu được liên kết để tạo thành một dòng thời gian:
Hãy xem qua các bước để tạo một biểu đồ phân tán:
Bước 1: Kiểm soát dữ liệu của bạn
Đảm bảo rằng dữ liệu của bạn ở định dạng chính xác, vì đồ thị phân tán hiển thị hai giá trị số có liên quan với nhau như thế nào, nên cả hai đều phải được hiển thị trong hai cột riêng biệt.
Cột đầu tiên thường sẽ được vẽ trên trục X và cột thứ hai trên trục Y. Biến độc lập thường nằm trên trục X và biến phụ thuộc trên trục Y.
Bước 2: Chọn dữ liệu có liên quan
Đánh dấu các cột chứa cả hai bộ biến. Nếu các cột không liền nhau, hãy giữ phím Ctrl giữa các lựa chọn (Chỉ chọn các cột có hai tập dữ liệu đang được kiểm tra về mối quan hệ nguyên nhân/kết quả).
Bước 3: Chọn loại biểu đồ phân tán mong muốn
Từ tab Insert, chuyển đến nhóm Charts và nhấp vào biểu tượng Scatter
Một số loại biểu đồ phân tán có sẵn từ menu Insert Charts. Bao gồm:
Biểu đồ phân tán với các đường được sử dụng tốt nhất khi bạn có ít điểm dữ liệu. Nếu không, biểu đồ của bạn có thể trông khá lộn xộn.
Xem thêm: Hướng dẫn cách làm đẹp cho biểu đồ Gantt Chart trên Excel
Chúng ta có thể tạo một biểu đồ phân tán trong Excel với hai hoặc nhiều bộ dữ liệu được không? Chúng ta có thể tạo biểu đồ phân tán với nhiều cặp XY không?
Câu trả lời là chúng ta có thể, và trên thực tế, điều này được thực hiện theo nhiều cách. Mình sẽ giới thiệu cho bạn phương pháp đơn giản và dễ hiểu nhất:
Các bước để tùy chỉnh biểu đồ phân tán tương tự như cách làm đối với hầu hết các biểu đồ khác . Bạn có thể tùy chỉnh biểu đồ của mình bằng cách thay đổi, thêm hoặc xóa những thứ như:
Nhãn dữ liệu - Data labels
Tiêu đề biểu đồ - A chart title
Tiêu đề trục - Axis titles
Đường xu hướng - Trendline
Thực hiện việc này bằng cách chọn biểu đồ, sau đó nhấp vào biểu tượng dấu cộng (+) màu xanh lá cây ở góc trên bên phải để mở Chart Elements. Tất cả các thay đổi có sẵn cho loại biểu đồ của bạn sẽ được hiển thị và một mũi tên mở rộng ở bên phải của mỗi lựa chọn, cung cấp các tùy chọn bổ sung.
Xem thêm: 25 kỹ năng Excel mà bạn nên biết từ cơ bản, trung cấp đến nâng cao
Biểu đồ phân tán có thể là một trong những biểu đồ Excel hữu ích nhất mà bạn chưa sử dụng. Những điểm quan trọng cần nhớ là:
Nếu ngày tháng hoặc mốc thời gian là quan trọng, thì bạn hãy nghĩ đến biểu đồ đường hoặc biểu đồ cột.
Nếu bạn nghĩ rằng hai biến có mối tương quan và bạn muốn làm nổi bật hoặc xác định mối quan hệ đó, thì biểu đồ phân tán là lựa chọn tốt nhất cho bạn.
Các biến độc lập thường được thể hiện trên trục hoành và các biến phụ thuộc trên trục tung.
Hy vọng bạn đã hiểu và áp dụng thành công cho công việc của mình. Nếu bạn có bất kỳ câu hỏi nào về biểu đồ Excel nói riêng và Excel nói chung thì đừng ngại ngần bình luận ở phía dưới cho Gitiho biết nhé! Đừng quên theo dõi chúng mình để xem thêm các bài viết bổ ích về những kĩ năng khác trong các bài học Excel khác nhé!