传媒大学媒体中心资源批量获取工具的制作

中国传媒大学媒体中心（）是中国传媒大学媒体资源最集中的地方，各种电影，电视剧，音乐等等，可以说是丰富多彩。然而它有一个缺点，就是只能在线看，不能下载。这导致想把自己喜爱的视频保存下来是比较困难的。为此我课余时间进行了一个小研究，做了一个MFC的小程序，可以实现媒体中心中资源URL的提取和保存，在此记录一下自己的制作过程。

该工具主要涉及以下三个技术：

1.发送HTTP请求，获取网页的源代码

2.查找具有特定标记的字符串，并提取出来

3.数据写入xml文件

下面先看看实际情况

首先登录媒体中心，打开一个视频，截图如图所示：

查看一下网页的源代码，看看有没有视频URL。在网页里搜索了关键字“.flv”，竟然找到了。

地址就是：

:2048/02/video/2012/5/111309/1336492554022.flv

只要把上述地址粘贴到迅雷，快车里面就可以下载视频了。

现在有一个问题，就是下载一个视频可以这样翻网页源代码找一找，但是每次这样操作有点太过麻烦了。因此需要编程实现一个小工具。当输入一个视频播放网页的地址的时候，就可以输出该视频实际的下载地址。当然，最好可以批量输入页面地址，然后批量解析视频的实际地址。

其实这个东西已经实现出来了，最终界面如下所示：

在这个工具中，贴入视频所在的网页，就可以解析出视频的标题以及视频的地址。而且下半部分还提供了批量解析的功能，输入视频ID（随后会解释）的范围，就可以探测出该范围内所有的视频资源，同时输出成XML或者TXT。

批量解析输出成XML如下所示：

<URLList><URL id="4"><name>恐惧拉斯维加斯</name><link>:2048/02/video/2008/6/恐惧拉斯维加斯/恐惧拉斯维加斯.flv</link><type>vod</type><protocol>http</protocol></URL><URL id="5"><name>一球成名2CD1</name><link>:2048/02/video/2008/7/一球成名2CD1/一球成名2CD1.flv</link><type>vod</type><protocol>http</protocol></URL><URL id="6"><name>一球成名2CD2</name><link>:2048/02/video/2008/7/一球成名2CD2/一球成名2CD2.flv</link><type>vod</type><protocol>http</protocol></URL><URL id="7"><name>深海寻人</name><link>:2048/02/video/2008/7/深海寻人/深海寻人.flv</link><type>vod</type><protocol>http</protocol></URL><URL id="28"><name>Oh_My_Friend</name><link>:2048/02/video/1970/1/28.BIGBANG_3rd_MINI_Oh_My_Friend_MV/BIGBANG_3rd_MINI_Oh_My_Friend_MV.flv</link><type>vod</type><protocol>http</protocol></URL><URL id="30"><name>once in a lifetime</name><link>:2048/02/video/2008/9/30.once_in_a_lifetime/once_in_a_lifetime.flv</link><type>vod</type><protocol>http</protocol></URL></URLList>或者TXT格式：视频ID:4视频名称：恐惧拉斯维加斯视频地址：:2048/02/video/2008/6/恐惧拉斯维加斯/恐惧拉斯维加斯.flv视频ID:5视频名称：一球成名2CD1视频地址：:2048/02/video/2008/7/一球成名2CD1/一球成名2CD1.flv视频ID:6视频名称：一球成名2CD2视频地址：:2048/02/video/2008/7/一球成名2CD2/一球成名2CD2.flv视频ID:7视频名称：深海寻人视频地址：:2048/02/video/2008/7/深海寻人/深海寻人.flv视频ID:28视频名称：Oh_My_Friend视频地址：:2048/02/video/1970/1/28.BIGBANG_3rd_MINI_Oh_My_Friend_MV/BIGBANG_3rd_MINI_Oh_My_Friend_MV.flv视频ID:30视频名称：once in a lifetime视频地址：:2048/02/video/2008/9/30.once_in_a_lifetime/once_in_a_lifetime.flv介绍完毕。现在简要介绍一下单个视频解析url的制作过程。

第一步：发送HTTP请求，获取网页的源代码

曾经写过一篇发送HTTP请求获取网页源代码的文章：C++发送HTTP请求获取网页HTML代码

第二步：查找具有特定标记的字符串，并提取出来

曾经写过一篇查找字符串并提取出来的方法的文章：C++从文件中查找特定的字符串，并提取该字符串

在此需要综合前两篇文章的方法，实现对特定url的网页源代码的请求，以及对特定字符串的查找和提取。

首先观察一下网页源代码，发现视频地址是在一对<script>标签里：

视频标题的开头前面是“<span class=text_bl>”，地址结尾“</span> &nbsp”。以这两个字符串作为标志，就能找到视频的标题。

下面贴上这部分的源代码

注意：本工程中使用了3个CString变量关联到3个Edit Control控件：

不曾见谁。则见朵花儿闪下来，好一惊。

相关文章：

你感兴趣的文章：

标签云：