Python写自动化之构造Multipartform

在HTTP协议的规范中会将http请求分为三个部分:状态行,请求头,请求体。在发送HTTP请求时,需要在请求头中注明发送的方法,这些方法包括:OPTIONS、GET、HEAD、POST、PUT、DELETE、TRACE、CONNECT。其中GET和POST是最为普遍被使用的。有关POST和GET的区别,知识库中已经有同学进行了表述,这里主要介绍一下multipart/form-data请求具体是怎么一回事。

在普通的HTML Form Post请求中,它会在头信息里使用Content-Length注明内容长度。头信息每行一条,空行之后便是Body,即“内容”(entity)。它的Content-Type是application/x-www-form-urlencoded,这意味着消息内容会经过URL编码,就像在GET请求时URL里的QueryString那样。以搜狗浏览器扩展升级的请求为例:

在早期的HTTP Post是不支持文件上传的,,编程开发带来很多问题。所以在《RFC 1867 -Form-based File Upload in HTML》中增加了用以支持文件上传的类型。即Content-Type的类型扩充了multipart/form-data用以支持向服务器发送二进制数据。因此发送post请求时,表单<form>属性enctype共有二个值可选,这个属性管理的是表单的MIME编码:

application/x-www-form-urlencoded(默认值)multipart/form-data

其实form表单在你不写enctype属性时,也默认为其添加了enctype属性值,默认值是enctype="application/x- www-form-urlencoded".

那么multipart/form-data请求有哪些特征呢?

1、multipart/form-data的基础方法是post

2、multipart/form-data与普通post方法的不同之处:请求头,请求体。

3、multipart/form-data的请求头必须包含一个特殊的头信息:Content-Type,且其值也必须规定为multipart/form-data,同时还需要规定一个内容分割符用于分割请求体中的多个post的内容,如文件内容和文本内容自然需要分割开来,不然接收方就无法正常解析和还原这个文件了。

4、multipart/form-data的请求体也是一个字符串,不过和普通post的请求体不同的是它的构造方式,post是简单的name=value值连接,而multipart/form-data则是添加了分隔符等内容的构造体。

通过Fiddler截取发送的请求包内容如图:

# coding=gbkimport urllib2;import json;def post_data():parameters = {'id': '', 'user': { 'username': '', 'password': '' }, 'query': { 'fromStation': 'beijing', 'fromStationText': 'shanghai' }}jdata = json.dumps( parameters )post_multipart( '', jdata )def post_multipart( url , fields ):content_type, body = encode_multipart_formdata( "data", fields )req = urllib2.Request( url, body )req.add_header( "User-Agent", "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/31.0.1650.63 Safari/537.36 SE 2.X MetaSr 1.0)" )req.add_header( "Accept", "*/*" )req.add_header( "Accept-Language", "zh-CN,zh;q=0.8" )req.add_header( "Accept-Encoding", "gzip,deflate,sdch" )req.add_header( "Connection", "keep-alive" )req.add_header( "Content-Type", content_type )req.add_header( "User-Agent1", "SogouMSE" )try:response = urllib2.urlopen( req )the_page = response.read().decode( 'utf-8' )print the_pagereturn the_pageexcept urllib2.HTTPError, e:print e.codepassexcept urllib2.URLError, e:print str( e )passdef encode_multipart_formdata( key, value ):BOUNDARY = '———-ThIs_Is_tHe_bouNdaRY_$'CRLF = '\r\n'L = []L.append( '–' + BOUNDARY )L.append( 'Content-Disposition: form-data; name="%s"' % key )L.append( '' )L.append( value )L.append( '–' + BOUNDARY + '–' )L.append( '' )body = CRLF.join( L )content_type = 'multipart/form-data; boundary=%s' % BOUNDARYreturn content_type, bodyif __name__ == '__main__':post_data();

谁是谁生命的点缀。

Python写自动化之构造Multipartform

相关文章:

你感兴趣的文章:

标签云: