Python网页数据收集以及处理-融创电子社区

首页论坛技术交流专区物联网 Python网页数据收集以及处理

发帖

光散落地方
24 发帖

116 回复

662 积分
私信他 + 关注

[分享] Python网页数据收集以及处理

761 查看

3 回复

楼主 | 发布于 2018-04-27 | 只看楼主

分享到：

import urllib
import re
import os


def getHtml(url):
    page = urllib.urlopen(url)
    html = page.read()
    return html

def getHash(html):
    reg = r'"hash":"(.+?)",'

    has = re.compile(reg)
    hashlist = re.findall(has, html)

    with  open('1.txt', 'w') as f:
        for has in hashlist:
            f.write(has + "|" + "\r\n")


def getName(html):
    reg = r'"filename":"(.+?)",'

    name = re.compile(reg)

    namelist = re.findall(name, html)

    with open('1.txt', 'rb') as fr:
        with open('2.txt', 'wb') as fw:
            for name in namelist:
                for l in fr:
                    fw.write(l.replace(b'\r\n', name + b'\r\n'))
                    break

html = getHtml(
    "http://mobilecdn.kugou.com/api/v3/special/song?plat=0&page=1&pagesize=-1&version=7993&with_res_tag=1&specialid=26430")

getHash(html)
getName(html)

(0 ) (0 )