python中get函数能获取大量url吗？该如何设置，盼大佬解惑

如何通过python获取到网站的所有url

可以通过2113正则表达式5261匹配出来的4102，网址的正1653则版表达式：权([\w-]+\.)+[\w-]+.([^a-z])(/[\w-: ./?%&=]*)?|[a-zA-Z\-\.][\w-]+.([^a-z])(/[\w-: ./?%&=]*)?

首先我们可以先获取要下载图片的整个页面信息。

getjpg.py

#coding=utf-8

import urllib

def getHtml(url):

page = urllib.urlopen(url)

html = page.read()

return html

print html

　　Urllib 模块提供了读取web页面数据的接口，我们可以像读取本地文件一样读取www和ftp上的数据。首先，我们定义了一个getHtml()函数:

　　urllib.urlopen()方法用于打开一个URL地址。

　　read()方法用于读取URL上的数据，向getHtml()函数传递一个网址，并把整个页面下载下来。执行程序就会把整个网页打印输出。

states是一个字典

只有当字典有'Texas'这个键时

才能states['Texas']，否则会报错

一种解决方式就是使用字典的get方法，如果键不存在，返回默认值

states.get('Texas',默认值')

在你的程序里默认值就是None

post或get是http里的概念,网站服务端就可以接收客户端post或get的数据了.简单来讲,你做个网站,就行了