做个网摘的高手 2006年网页资料我都要 | |
---|---|
http://www.sina.com.cn 2006年02月22日 07:52 中关村在线 | |
作者:王凯 阳光2005 上网浏览网页,保存资料成了不少网虫每天的必修课。有的时候会遇到各种棘手问题,如网页不允许“另存为”,复制的文本粘贴时会出现多余字符等等。这些问题可能困扰着不少朋友,于是乎小编安排了这样一篇文章,希望能够起到抛砖引玉的作用。OK,准备好了么,Let's GO。 一、去伪存真留文本 在一些优秀的论坛或网页中看到自己很感兴趣的内容,当然要保存下来。但是有些论坛由于版权等原因,为了防止网友随意复制,会做一些手脚。比如“http://nettu.net/cgi-bin/topic.cgi?forum=6&topic=542&show=0”,看起来没什么,但如果选中其中的文字,就会发现原来里面隐藏着与背景颜色同色的无用字符(如图1)/如果我们想复制其中的代码或帖子内容,会将许多无用的东西一起复制过来。如何解决这个问题? 去伪存真留文本 1.如此轻松——原来注册就可以 很多论坛和站点都和本例相似,对没有注册的用户万般刁难。只要注册后登陆,一切烦恼一扫而光!如果注册了仍然不行,请继续看下文。 2.复杂内容——找工具来帮忙 如果要复制的内容较多,而且其中有很多空行,上面的方法就显得捉肘见襟了。可以尝试使用下面的方法: (1)Word处理很轻松 首先将你需要的内容全部复制下来,当然摆脱不了其中的无用字符了。打开Word,将复制的内容粘贴。选择“编辑→替换”命令,在替换对话框中,点“高级”按钮,然后在“格式”中选择“字体”(如图2),在“字体颜色”中选择网页背景颜色(本例中是白色)(如图3),点“确定”。在“搜索范围”中选“全部”,然后再点“全部替换”按钮。关闭替换对话框,无用的字符是不是已经没有了! Word处理很轻松 调节颜色 (2)文字识别也拿手 如果系统中没有安装Word,仅仅为了简单的复制去弄个Office,未免有些兴师动众。其实我们还可以通过迂回战术把它复制下来。这里我们需要另一个小工具——Mini Ocr汉字显示字体识别软件。 小提示 《文萃》6期杂志《“迷你”OCR帮你找出PDF中的汉字》一文介绍了Mini Ocr的使用方法,另外6期光盘中已经收录该软件。 首先把需要的内容捕捉下来,如果文章很短,则键盘上的PrintScreen键就完全可以胜任了。如果文章较长,可以用PrintScreen键分多次捕捉,或使用HyperSnap-DX等专业截图软件进行截取。 接着要对捕捉的图片进行简单的处理。我们只需要保留文章内容,其它的所有无用信息都可以切走,然后将这幅图保存,图像格式可以是BMP、GIF或者JPG。 运行Mini Ocr,点“打开图像文件”,选择刚才处理过的图像;接着点“文字识别”,软件自动开始识别。根据文本内容的多少,识别的时间也不尽相同。识别完成之后,会弹出“耗时XXX秒”的对话框。点“确定”,我们需要的东西就在眼前,赶紧点击“保存结果”把它保存下来吧! 经过以上几个简单步骤就得到了我们需要的资料,是不是很爽? 二、搞定顽固网页 有的时候,对欲保存的网页点击“文件→另存为”,会出现“此网页无法保存”的错误提示;或打算选中文章内容复制后粘贴到其它文字处理软件中(如Word、WPS等),又选不中网页中的文章内容。怎么搞定这类网页呢?点击“查看→源文件”命令,这时打开一个文本文件,再点击它的“文件→另存为”命令即可将此网页保存。 小提示 在另存为对话框中,将“保存类型”设置为“所有文件”,将文件名改为***.html的形式。另外此方法无法保存网页中的图片等其他元素。 三、文字复制加速度 很多时候我们将网页中的文本复制到Word中进行简单的编辑与排版操作,但在实际复制过程时往往会将网页中的一些如图片、表格和各种小图标等一起复制到Word中,这些无关紧要的东西手工删除起来非常麻烦,这里给大家推荐快速复制网页文本的三种方法。 方法一:打开记事本,将复制的网页内容粘贴到记事本中,然后再将记事本中的文本复制到Word中,即用记事本作为一个“中转站”,这样可以避开图片、表格和各种小图标等的复制,提高复制速度和质量。 方法二:先将网页内容复制下来,打开Word,暂时不进行粘贴操作,在Word菜单栏中选择“编辑→选择性粘贴”,在打开的“选择性粘贴”对话框中选中“无格式文本”,这样即可自动剔除网页中的无关图片、表格和各种小图标了(如图4)。 文字复制加速度 方法三:将复制的网页内容粘贴到Word中,接下来单击所粘贴网页右下方的“粘贴选项”工具按钮,在其下拉菜单中选择“仅保留文本”选项即可,这样原粘贴网页中的无关图片、表格和各种小图标等会自动消失。 小提示 如果用户在Word的文档编辑区没有找到那个“粘贴选项”工具按钮,则可以在Word菜单栏中选择“工具→自动更正选项”,然后将弹出的对话框切换到“智能标记”选项卡,选中“显示智能标记操作按钮”即可(如图5)。 转换 |