爬取高山网中国大学排名python代码

#当然可以!以下是一个简单的 Python 爬虫示例,
#用于从高山网获取近三年中国高校排名数据。你可以根据自己的需求进行修改和扩展。

# python
import requests
import pandas as pd
from bs4 import BeautifulSoup

# 请求高山网的排名页面
url = 'http://m.gaosan.com/gaokao/265440.html'
response = requests.get(url)
soup = BeautifulSoup(response.content, 'html.parser')

# 提取表格数据
table = soup.find('table')
rows = table.find_all('tr')

# 解析表格数据并存储到 DataFrame
data = []
for row in rows[1:]:  # 跳过表头
    cols = row.find_all('td')
    rank = cols[0].text.strip()
    school_name = cols[1].text.strip()
    score = cols[2].text.strip()
    star_rank = cols[3].text.strip()
    level = cols[4].text.strip()
    data.append([rank, school_name, score, star_rank, level])

df = pd.DataFrame(data, columns=['名次', '学校名称', '综合得分', '星级排名', '办学层次'])

# 将数据保存到 CSV 文件
df.to_csv('排名.csv', index=False, encoding='utf-8')

print("数据已保存到:排名.csv文件中。")