[分享] Python网页数据收集以及处理
881 查看
3 回复
 楼主 | 发布于 2018-04-27 | 只看楼主
分享到:
import urllib
import re
import os


def getHtml(url):
    page = urllib.urlopen(url)
    html = page.read()
    return html

def getHash(html):
    reg = r'"hash":"(.+?)",'

    has = re.compile(reg)
    hashlist = re.findall(has, html)

    with  open('1.txt', 'w') as f:
        for has in hashlist:
            f.write(has + "|" + "\r\n")


def getName(html):
    reg = r'"filename":"(.+?)",'

    name = re.compile(reg)

    namelist = re.findall(name, html)

    with open('1.txt', 'rb') as fr:
        with open('2.txt', 'wb') as fw:
            for name in namelist:
                for l in fr:
                    fw.write(l.replace(b'\r\n', name + b'\r\n'))
                    break

html = getHtml(
    "http://mobilecdn.kugou.com/api/v3/special/song?plat=0&page=1&pagesize=-1&version=7993&with_res_tag=1&specialid=26430")

getHash(html)
getName(html)

(0 ) (0 )
回复 举报

回复于 2018-04-28 沙发

(0 )
评论 (0) 举报

回复于 2018-04-28 2#

赞一个,这段代码实现了什么功能呢?
(0 )
评论 (1) 举报

楼主 | 回复于 2018-05-01 3#

功能:网页中是一个txt文件,将里面的数据进行处理。
(0 )
评论 (0) 举报
  • 发表回复
    0/3000





    举报

    请选择举报类别

    • 广告垃圾
    • 违规内容
    • 恶意灌水
    • 重复发帖

    全部板块

    返回顶部