爱数课 | 数据采集与清洗课程重磅上线!

2023-09-30

课程介绍

数据采集是指从各种数据源中抓取数据并存储到目标位置的过程,数据清洗是指对采集到的数据进行处理和调整,以消除数据中的错误、重复、缺失等问题,提高数据质量和可用性。

本门课程面向数据采集与清洗的初学者,采用了视频+练习+作业的形式介绍了数据采集与清洗的基本概念与操作,并配有实际案例,使初学者能够更快地掌握数据采集与清洗的相关知识。

本门课程共八章,可以分为两大部分。第一部分是数据采集部分,对应课程的第一至三章,介绍了爬虫的相关知识以及如何使用Python实现网络爬虫;第二部分是数据清洗部分,介绍了数据清洗中常见的问题以及处理方法,包括数据预处理、数据转换和不平衡数据处理和数据清洗案例四部分。

NoSQL数据库课程重磅上线1.png

边学边测、 边学边练

NoSQL数据库课程重磅上线2.jpg

NoSQL数据库课程重磅上线3.jpg

NoSQL数据库课程重磅上线4.jpg

NoSQL数据库课程重磅上线5.jpg

NoSQL数据库课程重磅上线6.jpg

课件展示

NoSQL数据库课程重磅上线7.jpg

(lxml库介绍)

NoSQL数据库课程重磅上线8.jpg

(BeautifulSoup)

NoSQL数据库课程重磅上线9.jpg

(Selenium)

NoSQL数据库课程重磅上线10.jpg

(Scrapy工作流程)

NoSQL数据库课程重磅上线11.jpg

(孤立森林算法-异常分数)

配套习题

NoSQL数据库课程重磅上线12.png

NoSQL数据库课程重磅上线13.png

NoSQL数据库课程重磅上线14.png

NoSQL数据库课程重磅上线15.png

NoSQL数据库课程重磅上线16.png

课程大纲

一章 数据采集概述

1.1 数据采集、网络爬虫的概念

1.2 网络爬虫的分类、基本架构

二章 网络爬虫基础

2.1 HTTP基础

2.2 URL抓取策略

2.3 爬取网页

2.4 HTML结构

2.5 lxml库的使用

2.6 BeautifulSoup

2.7 BeautifulSoup综合案例

三章 网络爬虫进阶

3.1 验证码识别

3.2 Selenium模拟登录

3.3 常见爬虫架构

3.4 Scrapy开发实践

四章 数据清洗概述

4.1 数据清洗的定义

4.2 数据清洗的内容

五章 数据预处理

5.1 数据整合

5.2 缺失值处理

5.3 异常值的检测与处理

六章 数据转换

6.1 数据格式转换

6.2 数据离散化

6.3 特征编码与标准化

七章 不平衡数据处理

7.1 数据类别不平衡处理

八章 数据清洗案例

8.1 汽车价格数据清洗

8.2 数据科学职位数据清洗

一键复制,快速开课

可复制平台的数据采集与清洗课程的内容,在平台开设自己的课程。面向本校学生开展教学。

课程由几十个知识点组成,根据需要可以选择不同的知识点建课。也可以根据需要上传自己的课件或视频组建新的课程。

NoSQL数据库课程重磅上线17.jpg

(复制课程)

NoSQL数据库课程重磅上线18.png

(复制知识点)

NoSQL数据库课程重磅上线19.png

(复制课件)

NoSQL数据库课程重磅上线20.png

(在知识点库查看课程知识点)

NoSQL数据库课程重磅上线21.png

(创建知识点)

助手iconChat