Top doanh nghiệp đã đăng ký cho nhân viên
Bạn sẽ học được gì?
Khoá học này sẽ có:
Video
5h 05m giờ học
Article
0 bài viết chuyên môn
Material
1 tài liệu đính kèm
Exam questions
0 đề thi ghi nhớ kiến thức
Nội dung khoá học
5 Chương . 36 bài giảng . 5h 05m giờ học
Mở rộng tất cả các phầnMô tả khoá học
Trong khóa học này, chúng ta sẽ sử dụng các python package để thực hiện các tác vụ phân tích dữ liệu. Cụ thể, khóa học bao gồm các phần chính như sau:
- Căn bản về numpy. NumPy là một thư viện Python là viết tắt của Numerical Python. Đây là thư viện cốt lõi cho scientific computing, nó chứa một đối tượng mảng n chiều mạnh mẽ. Trong phần này chúng ta sẽ học cách sử dụng numpy để tạo ta các mảng mạnh mẽ. Trong đó, chúng ta sẽ bắt đầu với cách sử dụng jupyter notebook. Sau đó, khóa học đề cập đến cách tạp và sử dụng numpy array và numpy matrix.
- Thao tác và phân tích dữ liệu với pandas.Pandas là một thư viện Python cung cấp các cấu trúc dữ liệu nhanh, mạnh mẽ và linh hoạt. Trong phần này, bạn sẽ được học về cấu trúc dữ liệu DataFrame, cách đọc dữ liệu từ file excel và file csv. Chúng ta cũng cùng nhau thực hiện một số tác vụ phân tích dữ liệu như Làm sạch dữ liệu, Thống kê cơ bản, Hệ số tương quan và hồi quy.
- Trực quan hóa dữ liệu với matplotlib: Cách vẽ các đồ thị trong python bằng gói matplotlib. Ví dụ như: đồ thị cột, đồ thị đường, đồ thị phân tán, ... Ngoài ra, bạn còn được học cách thức thực hiện các chú thích trên đồ thị và điều chỉnh sao cho đồ thị dễ nhìn, dễ quan sát hơn.
Qua khóa học, bạn sẽ có cái nhìn tổng quát về phân tích dữ liệu cũng như nắm vững các công cụ mạnh mẽ được nhiều người sử dụng hiện nay trên thế giới để thực hiện các tác vụ phân tích dữ liệu.
Giảng viên:
5 điểm đánh giá
5 đánh giá
202 học viên
10 khóa học
Xin chào, Tôi là Trọng Nghĩa. Tôi thích viết code và cũng thích giúp mọi người viết được code. Tôi đã có hơn 10 năm kinh nghiệm lập trình và giảng dạy. Hiện đang giảng dạy tại bộ môn Khoa học dữ liệu và Trí tuệ nhân tạo.
Tôi có thể hỗ trợ các bạn về các vấn đề liên quan đến AI, Data Science và Full-stack Web developer, với các ngôn ngữ lập trình như python, JavaScript, PHP, C#, java, cùng với các thư viện để thực hiện công việc như Flask, Django, React, Nodejs, …
Hy vọng được kết nối với các bạn ❤️❤️❤️
Hỏi đáp khóa học
Thảo luận về bài học
20 thảo luận
Dương Anh Tài
hiện tại thì video bị đứng lại ở 24 giây cuối, cần kiểm tra lại giúp. Xin cảm ơn.
Đinh Nguyễn Trọng Nghĩa [Giảng viên]
Để tôi nhờ bộ phận kỹ thuật kiểm tra lại video. Cảm ơn bạn.
Đặng Quang Trang
khóa học này có tài liệu lý thuyết không thấy?
Nguyễn Hồng Quân
Khóa này chỉ có Link code kèm theo khóa học chứ ko có tài liệu bạn à
Lâm Hoàng Nhân
Chào thầy, em muốn addin thêm Legend và điều chỉnh Colort theo type của Data từng Iris thì như thế nào ạ. Em có search cách nhưng test không thành công, cảm ơn thầy!
Đinh Nguyễn Trọng Nghĩa [Giảng viên]
Chào bạn, cảm ơn bạn vì câu hỏi rất hay.
Một tập iris chung như thế chúng ta không thể thêm legend vào từng loại được. Do đó, muốn thêm legend thì ta tách dữ liệu thành 3 loại khác nhau
sl = [[], [], []]
sw = [[], [], []]
for i in range(len(types)):
sl[types[i]].append(sepal_length[i])
sw[types[i]].append(sepal_width[i])
Sau đó sẽ vẽ đồ thị cho từng loại và thêm label cho mỗi loại (màu sắc và label hoàn toàn có thể thay đổi theo ý mình)
colors = ['#aa6677', '#123456', '#ffee33']
legends = ['setosa', 'versicolor', 'virginica']
fig, ax = plt.subplots()
for i in range(3):
ax.scatter(sl[i], sw[i], c=colors[i], label=legends[i])
ax.legend()
plt.show()
Lâm Hoàng Nhân
Chào thầy, em bị tình trạng như trên hình, đường line e check nó vẫn chạy đến tầm 500 ạ. Mong thầy phản hồi
Em cảm ơn !
Đinh Nguyễn Trọng Nghĩa [Giảng viên]
Bạn thử print các biến x, y ra xem thử các giá trị của chúng là gì. Sau đó kiểm tra lại code bên trên xem nhé.
Đặng Hữu Thanh
.
Đinh Nguyễn Trọng Nghĩa [Giảng viên]
Bạn vào Bài đầu tiên có kèm code và các file csv thực hành kèm theo đó. ^^
Giá ưu đãi chỉ còn 1 ngày
399,000đ
799,000đĐăng ký cho doanh nghiệp
Giúp nhân viên của bạn truy cập không giới hạn 500+ khoá học, mọi lúc, mọi nơi