
[Series Git, GitHub] 8. Cách tải dataset từ Kaggle cho người học khoa học dữ liệu
Kaggle – Cộng đồng online dành cho những ai muốn tìm hiểu về machine learning và data science. Đó là nơi học tập cho những data scientist
Trang chủ » Free Materials
Kaggle – Cộng đồng online dành cho những ai muốn tìm hiểu về machine learning và data science. Đó là nơi học tập cho những data scientist
Visual Studio Code là một trình mã biên tập (IDE). Nó hỗ trợ nhiều ngôn ngữ lập trình và chạy được trên nhiều hệ điều hành.
Sau khi hoàn thành code, bạn có thể dùng git add để lưu code và dùng lệnh git push để đẩy code từ máy chủ của bạn lên server.
Việc commit rất quan trọng sau khi code xong. Khi bạn để lại commit sẽ giúp cho những người khác biết được bạn đã làm những gì.
Để bắt đầu làm việc chung với đồng nghiệp thì việc ta phải tải được repository để tiến hành code phần của mình.
Việc set up tên và email của máy chủ sẽ giúp cho những người làm việc chung biết được đó là code của ai.
Git được sử dụng phổ biến trong nhiều dự án phát triển phần mềm và là một công cụ quan trọng cho việc phát triển phần mềm theo nhóm.
Hướng dẫn sử dụng Git và GitHub – những công cụ không thể thiếu dành cho các lập trình viên trong việc phân tích dữ liệu và phát triển phần mềm.
Trong việc nâng cao kiến thức chuyên môn, tài liệu chuyên ngành đóng vai trò vô cùng quan trọng. Đặc biệt đối với lĩnh vực phân tích dữ liệu, để có thể đưa ra các phân tích có giá trị nhất cho các bài toán của doanh nghiệp, ta cần hiểu rõ phạm vi hoạt động của ngành.
Để có thể giải quyết các bài toán về phân tích dữ liệu chuyên ngành, ta cần tìm kiếm các tài liệu để giúp ta hiểu rõ những chỉ tiêu nào cần đưa vào phân tích và cách sử dụng các công cụ để tạo ra các báo cáo tổng hợp. Bộ tài liệu tham khảo dưới đây gồm các tài liệu chuyên ngành về ngân hàng, tài chính, thương mại điện tử, sức khỏe, bảo hiểm và fintech/tài chính có thể giúp bạn giải quyết các vấn đề này một cách dễ dàng.
10 bộ dataset miễn phí sau đây với nhiều lĩnh vực khác nhau, bao gồm: Bán hàng, tài chính, thể thao,… cho bạn thoải mái làm sạch dữ liệu, phân tích dữ liệu, dự báo, tạo visualizatio,…