您好,以下是使用 Python 进行数据获取和清洗的常用方法及库:数据获取网络爬虫:requests、BeautifulSoup、ScrapyAPI 调用:requests、urllib文件读取:pandas(CSV/Excel)、json、openpyxl数据库连接:SQLAlchemy、pymysql、psycopg2数据清洗数据处理:pandas、numpy缺失值处理:pandas.fillna()、dropna()格式转换:astype()、to_datetime()异常值处理:统计方法(如 Z-score)、IQR 方法文本清洗:re(正则表达式)、string数据标准化:sklearn.preprocessing示例代码片段python运行
import pandas as pd
import numpy as np
from bs4 import BeautifulSoup
import requests
发布于2025-5-11 20:59 武汉

