Python爬取猫眼电影排行

程序员文章站 2023-01-01 21:31:26

```Python import requests import pyquery def crawl_page(url: str) -> None: headers = { 'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleW... ......

import requests
import pyquery


def crawl_page(url: str) -> none:
    headers = {
        'user-agent': 'mozilla/5.0 (windows nt 10.0; win64; x64) applewebkit/537.36 (khtml, like gecko) \
chrome/72.0.3626.121 safari/537.36',
    }
    response = requests.get(url, headers=headers)
    parse_page(response.text)


def parse_page(source_code: str) -> none:
    html = pyquery.pyquery(source_code)
    dd_elements = html('.board-wrapper dd')
    for dd_element in dd_elements.items():
        data = {
            '排名': dd_element.find('i.board-index').text(),
            '电影名': dd_element.find('a.image-link').attr('title'),
            '主演': dd_element.find('p.star').text().split('：')[1],
            '上映时间': dd_element.find('p.releasetime').text().split('：')[1],
            '评分': dd_element.find('p.score').text(),
        }
        print(data)
        save_data(data)


def save_data(data: dict) -> none:
    data = str(data)
    with open('maoyan.txt', 'a+', encoding='utf8') as f:
        f.write(data+'\n')
    return none


def main():
    for i in range(0, 100, 10):
        url = 'https://maoyan.com/board/4?offset={}'.format(i)
        crawl_page(url)


if __name__ == '__main__':
    main()

上一篇：排序算法代码实现（二）—— 冒泡排序

下一篇：酸菜饺子馅怎么调才会好吃

Python爬取猫眼电影排行

python—多协程爬取斗鱼高颜值美女图片-2.0版本

几行Python代码爬取3000+上市公司的信息

python爬虫教程之爬取百度贴吧并下载的示例

python爬取盘搜的有效链接

python爬虫爬取微博评论案例详解

Python爬虫使用selenium爬取qq群的成员信息（全自动实现自动登陆）

Python爬取知乎单个问题下的回答

Python爬取十四万条书籍信息告诉你哪本网络小说更好看

通过抓取淘宝评论为例讲解Python爬取ajax动态生成的数据(经典)

python爬取网页内容转换为PDF文件