●ニュース本文を印刷するには |
1.ブラウザの印刷機能を利用
2.ワープロの利用
3.印刷・閲覧用ページを作る
4.印刷・閲覧用ページとテキスト変換を同時に
英文のニュースを、英字新聞で読んだなら「新聞」という物理的な「物」が残りますよね。そして、それは日が経つにつれてかさ張ってきます。日本語の新聞なら、「あぁ、ゴミに出さなきゃ!邪魔くさいな。」なんて思うんですが、英字新聞の場合、英語学習者であれば、「もうこんなに読んでいるんだ。がんばったな〜。よしもっと続けるぞ!」と、学習意欲を継続させるきっかけともなります。
ところが、インターネットで英文ニュースを読んだ場合には、物としては後に何も残りませんよね。ファイルとしてハードディスクの中に残せたとしても、ハードディスクがクラッシュすれば一瞬で消えてしまいますし、せっかく目を通したニュースなら復習用に印刷しておこうとか、学習した証拠を残すために印刷して残しておきたい、と思うのが人情ではないでしょうか。
では、ニュース本文を印刷してとっておくにはどうすればよいでしょうか?ニュースを掲載しているページには、ニュース本文だけでなく、他のヘッドラインや、サイト内外の他のメニューへのリンクを含んでいることがほとんどですから、できるだけ余分な情報は排除して、ニュース本文だけを印刷しておきたいですよね。ニュース本文だけ印刷する方法としては、まず以下のような方法が考えられます。
- 目的のニュース本文の部分をマウスでドラッグして選択して、反転状態にする。
- インターネット・エクスプローラなら、メニュー [ファイル] − [印刷] − [全般] タブの「ページ範囲」で [○選択した部分] のラジオボタンを ON にする。
- [印刷] ボタンをクリックする。
こうすれば、意外と簡単に目的のニュース本文だけを印刷することができます。ニュースサイトによってはこれで十分なこともあります。ところが、多くのサイトの場合、ページが持っている書式がそのまま適用されるので、右に大きな余白ができてしまいます。そこで、これを解決するためにワープロを使うことを考えます。
同様にドラッグして選択して、クリップボードに [コピー] して、ワードなど文書印刷のできるアプリケーションを起動して、[貼り付け] て、書式を整えて印刷する。
こうすれば、なかなか見栄えよく目的のニュース本文だけを印刷することができます。
しかし、1日に10アーティクルについて、同じことをやると考えると、ちょっとうんざりします。 それに、実際にやってみると分かるのですが、テキストで保存すれば、2キロバイト以内におさまるデータが、ワードの文書として保存すると、10倍以上のサイズになってしまいます。
- 本文をドラッグして選択して、[コピー] する。
- ワードを起動、あるいはワードのウィンドウを切り替える。
- [貼り付け] る。
- 書式を整える。
- 印刷する。
以上のような面倒な操作をはぶくために、サイトによっては、通常の閲覧用のページとは別に、印刷用のページを提供してくれていることもあります。自分がよく利用しているサイトが印刷用ページを用意してくれていない場合には、どうすればよいでしょうか?
そうです! 自分で印刷用のページを作ってしまえばよいのです。
手順は、一括ダウンロードしてテキストに変換した方法と同じです。エディターのマクロを使います。
まず、ダウンロードしたファイルを テキストエディタで開いて見ましょう。
テキストエディタのアイコンにドラッグ&ドロップするか、ファイルを右クリック・メニューから [プログラムから開く] を選択し、テキストエディタを選択します。
(1) ファイルの先頭から、"newsText" という文字列のある行の直前行までは不要です。
(2) "back to top" という文字列のある行から、ファイルの最後までが不要です。
(3) "<p> "以外のタグは削除します。
(4) html ファイルとして必要なタグを、本文の前後に追加する必要があります。
(5) 以上の編集を行った後、html ファイルを上書き保存します。
これらを考慮して、必要な部分だけを切り出してシンプルな html ファイルに変換するために作ったのが、以下のマクロです。
MDN_html.mac // MDNを簡易HTMLに
Find("newsTitle","1","0","0","0","1","1","0")
MoveLineStart
MoveFileStart ,SHIFT
Delete
Find("back to top)","1","0","0","0","1","1","0")
MoveLineStart
MoveFileEnd ,SHIFT
Delete
MoveFileStart
Replace("<p>","@p@","1","0","0","0","4","1","1")
Replace("</p>","@/p@","1","0","0","0","4","1","1")
Replace("<[^>]+>","","1","0","1","0","4","1","1")
MoveFileStart
ReadFileToCaret(C:\Program Files\K2Editor\Macro\header.txt)
InputStr("<hr>")
InputStr("<h1>")
MoveLogicalLineEnd
InputStr("</h1><hr>")
Replace("@p@","<p>","1","0","0","0","4","1","1")
Replace("@/p@","</p>","1","0","0","0","4","1","1")
MoveFileEnd
InputStr("</p>")
Enter
InputStr("</body></html>")
SaveClose
このマクロは、 MAINICHI Daily News 専用ですが、他のニュースサイトの html ファイルを処理したい場合には、"newsText" と ""back to top" の部分だけの変更すれば、多くの場合は流用できると思います。
このマクロは、K2Editor のプログラムが格納されているフォルダの「Macro」フォルダに "MDN_html.mac" という名前で保存しておきましょう。
なお、このマクロでは、html ファイルとして必要なタグを一部、別のファイルから読み出して追加していますので、以下のファイルも必要になります。先のマクロと同じ「Macro」フォルダに "header.txt" という名前で保存しておきましょう。
header.txt <html>
<head>
<STYLE TYPE="text/css">
H1{FONT-WEIGHT: bold; FONT-SIZE: 20px; LINE-HEIGHT: 120%; FONT-FAMILY: "Verdana","sans-serif"; TEXT-ALIGN: center}
P{FONT-SIZE: 17px; LINE-HEIGHT: 120%; FONT-FAMILY: "Lucida Sans Unicode","Courier New","Courier","Andale Mono","monospace"}
{background:#9cceff} </STYLE>
</head>
<body bgcolor="#ccffff" text="darkblue">
どうせなら、一括ダウンロードしてテキストに変換で利用したマクロと統合して、一回の変換作業で、同時に上記の html ファイルと、テキストファイルを作ってしまいましょう。
MDN_edit&html.mac // MDNニュースのHTMLを
//(1)印刷・閲覧用HTMLに
//(2)純粋なテキスト本文に
Find("newsTitle","1","0","0","0","1","1","0")
MoveLineStart
MoveFileStart ,SHIFT
Delete
Find("back to top)","1","0","0","0","1","1","0")
MoveLineStart
MoveFileEnd ,SHIFT
Delete
MoveFileStart
Replace("<p>","@p@","1","0","0","0","4","1","1")
Replace("</p>","@/p@","1","0","0","0","4","1","1")
Replace("<[^>]+>","","1","0","1","0","4","1","1")
MoveFileStart
ReadFileToCaret(C:\Program Files\K2Editor\Macro\header.txt)
InputStr("<hr>")
InputStr("<h1>")
MoveLogicalLineEnd
InputStr("</h1><hr>")
Replace("@p@","<p>","1","0","0","0","4","1","1")
Replace("@/p@","</p>","1","0","0","0","4","1","1")
MoveFileEnd
InputStr("</p>")
Enter
InputStr("</body></html>")
SaveFile
MoveFileStart
Find("<body","1","0","0","0","1","1","0")
MoveLineStart
MoveFileStart ,SHIFT
Delete
Replace("<p>","\n","1","0","1","0","4","0","1")
Replace("<[^>]+>","","1","0","1","0","4","0","1")
Replace("\n[\n]+","\n\n","1","0","1","0","4","0","1")
SaveAs(%OpenFileNameWithoutExt%.txt,0,0)
close
● ドラッグ&ドロップ用ショートカットの作成
一括ダウンロードしてテキストに変換でやったように、ここでもマクロを自動実行してくれるショートカットを作っておきましょう。
K2Editor の起動アイコンを右クリック・メニューから、[ショートカットの作成] を選択し、K2Editor のショートカットを作成して、デスクトップにでも置いておきます。できたショートカットの名前を、「MDN印刷用・テキスト変換」とでも変更しておきましょう。このショートカットを右クリック・メニューから [プロパティ]を選択します。
表示された[プロパティ]のダイアログから、[ショートカット] タブを選択し、[リンク先] を以下のように編集して [OK] ボタンをクリックします。
◆リンク先 = "C:\Program Files\K2E\K2Editor.exe" /mMDN_edit&html.mac
これは、「このアイコンをクリックすると自動的にマクロ MDN_edit&html.mac を呼び出して実行する」ための設定です。
このアイコンに、MAINICHI Daily News からダウンロードした html ファイルをドラッグ&ドロップしてみましょう。不要な部分が削除され、印刷・閲覧に適した html ファイルがに変換されると同時にテキストファイルが作成されるはずです。複数のファイルを一度にドラッグ&ドロップしても構いません。
これで、ダウンロードした複数の html ファイルを選択しておいて、この「MDN印刷用・テキスト変換」アイコンにドラッグ&ドロップすれば、一回の操作ですべての html ファイルを余分な部分を編集して削除した印刷・閲覧用のHTMLファイルと純粋なテキストファイルができあがります。