Linux curl命令中 HTTP 302处理

在Linux中使用curl命令时,偶尔会遇到一些URL跳转到新的URL,即HTTP中的3XX(redirection,重定向 )。

$curl -s -I $URL > log

这时在返回的报文中,有Location字段标明了新的URL。

$cat log

HTTP/1.1 302 FoundExpires: -1Cache-Control: private, max-age=0Pragma: no-cacheLocation: Content-type: text/htmlConnection: closeDate: Tue, 05 Apr 2011 08:37:07 GMTServer: F_LIGHTY_TJ8

当我试图获取这个新的URL,,再进行curl时,总是报HTTP 400 (Bad Request,错误的请求)。

$URL=`cat log | grep ‘^Location’ | cut -f2 -d ‘ ‘ `$curl -s -I $URL > log

$cat log

HTTP/1.1 400 Bad RequestContent-Type: text/htmlContent-Length: 349Connection: closeDate: Tue, 05 Apr 2011 08:32:04 GMTServer: YOUKU.ZZ

直接将新的URL打印出来,复制粘贴再curl,却没有问题 。

$curl -s -I

HTTP/1.1 200 OKContent-Type: video/mp4Accept-Ranges: bytesETag: “392853628”Last-Modified: Fri, 12 Nov 2010 21:48:23 GMTContent-Length: 19971197Connection: closeDate: Tue, 05 Apr 2011 08:41:18 GMTServer: YOUKU.ZZ

百思不得其解!

最后。发现这个新的$URL中和“”并不完全相同,$URl的结尾多了一个‘0A’换行符。

$echo $URL > url_1

$echo > url_2

$hexdump url_1

0000000 7468 7074 2f3a 312f 3238 312e 3831 322e0000010 312e 2f31 6f79 6b75 2f75 3935 3337 45380000020 3244 4637 3335 3834 3831 4239 4144 43360000030 4533 3941 302f 3033 3030 3138 3031 34370000040 4443 4244 3136 3734 3936 3036 3932 36390000050 3243 3434 3132 4541 4438 2d38 3243 33410000060 312d 4442 2d39 3437 4341 462d 4235 37300000070 4131 3439 3345 2e33 706d 0d34 000a

$hexdump url_2

0000000 7468 7074 2f3a 312f 3238 312e 3831 322e0000010 312e 2f31 6f79 6b75 2f75 3935 3337 45380000020 3244 4637 3335 3834 3831 4239 4144 43360000030 4533 3941 302f 3033 3030 3138 3031 34370000040 4443 4244 3136 3734 3936 3036 3932 36390000050 3243 3434 3132 4541 4438 2d38 3243 33410000060 312d 4442 2d39 3437 4341 462d 4235 37300000070 4131 3439 3345 2e33 706d 0a34

去掉这个换行符,一切OK

URL=`cat log | grep ‘^Location’ | cut -f2 -d ‘ ‘ |sed ‘s/\r//’ `

Been dazed and confused for so long

相反,某天也许你会忽然发现,心早已沦陷。

Linux curl命令中 HTTP 302处理

相关文章:

你感兴趣的文章:

标签云: