给你一个思路吧
1、先将网页文件的内容提取出来:可以用正则表达式提取(限于只是文字的情况);也可以将网页文件转换成文本文件或RTF文件。
2、将提取出来的内容或转换的文件,生成PDF文件。用以下方法可以轻松完成以上的工作。
《程序员秘书》--源代码--目录及文件--Word文档转换成各种类型的文档
            --PDF文件处理  (这是一个大项,可以生成PDF的各种格式,显示控制等)立即成为编程经验丰富的程序员不是梦,详见:http://www.psec.net.cn