English | 简体中文 | 繁體中文 | Русский язык | Français | Español | Português | Deutsch | 日本語 | 한국어 | Italiano | بالعربية
以下は最もシンプルな実装方法です。まず、ターゲットウェブページを取得し、aタグのhref属性を正規表現でマッチしてリンクを取得します。
以下はコードです:
import urllib2 import re url = 'http://www.sunbloger.com/' req = urllib2.Request(url) con = urllib2.urlopen(req) doc = con.read() con.close() links = re.findall(r'href\=\"(http\:\/\/[a-zA-Z0-9\.\/]+)\"', doc) for a in links: print a
まとめ
以上はこの記事のすべての内容です。この記事の内容が皆様の学習や仕事に役立つことを願っています。何か疑問があれば、コメントを残してください。