« Adobe CS3 クイズに答えてセグウェイ当ててしまえ。 | ホーム | 続・保護されたPDFをコピーする方法 »

2008年4月18日

保護されたPDFから内容をコピーする方法

サウンドハウスの個人情報流出の経過を記したPDFがネット上では話題。特に秀逸なタイムラインは、それぞれの関係者がどのように動いたかを詳細に記されてあり、今後の対応マニュアルなどであちこちで生かされると思う。いや生かすべき。生かせ。生かしとけ。

僕はこの秀逸なタイムラインを使って、ある種のタイポグラフィが作れないものかと、早速サンプリングと文章をコピペしようとした。
ところが、このPDFは保護されているため、文章のコピーができなかったのだ。

あー困ったな。印刷してスキャンしてOCRにかけるかな。と思いながらカチカチとメニューをいじくっていたら、なんともまぁ、意外な方法で内容を抜き取ることができてしまった。

まずは保護されたPDFのプロパティをAdobe Acrobat8で表示したときの画像をごらんいただこう。
Acrobat080419002.png
がっつり許可されてない。内容のコピーってやつだ。

印刷する際の選択範囲を作ったりする意味で、フォントが埋め込まれている場合はテキストの選択範囲を作ることができる。しかし、コピーのショートカットは効かない。

パスワード保護だから、それを破ればいいんじゃないのと思いつつ、今度は同じPDFをMacOSXのプレビューで開き直す。

プレビューでテキストを選択してコピーしようとすると、パスワードを入れろと言われる。
preview080419001.png

ここでもがっつりロックがかかっているわけだ。暗号化のダイアログではコピー禁止のアイコンがついている。
preview080419002.png

はぁ、無理か。と思いつつおもむろに右クリックしてみると…
preview080419003.png

ん?
検索?
検索できんの?

いやいや、実はこのメニューはプロテクトされていてもコピーも表示されているから、どうせまたパスワード入れろとか言うんだろうなと思いながらカチ。

preview080419004.png

あ、検索された。ご丁寧に今開いてるファイルが該当しているようだけど…
ん?

preview080419005.png

あああああああ!抜けちゃった!取れちゃった!
もちろんそのままコピーして、エディタに貼り付けられたよ!
でもこれだと改行とかがなくなってしまうから(もちろん、それが使いやすい場合もあるよ)、もうちょっと何とかならないかなと思って今度はGoogle検索かけてみたよ。

preview080419006.png

フォームとかに件の文字列がコピペされてしまっているのはさっきと変わらないけど、注目すべきはアドレスバー。ばーっとスクロールさせていくと…

preview080419007.png

スペースが「+」に置き換えられてしまっているけど、改行文字を%0Aとしてゲット!
あとは上手く置換すれば改行位置もコピペできてしまうことになるね!これで思う存分保護されたPDFから文字列をぶっこ抜けるね!

トラックバック(0)

トラックバックURL: http://okamot.com/mt/hage-tb.cgi/1713

コメントする

このブログ記事について

このページは、はげが2008年4月18日 23:02に書いたブログ記事です。

ひとつ前のブログ記事は「Adobe CS3 クイズに答えてセグウェイ当ててしまえ。」です。

次のブログ記事は「続・保護されたPDFをコピーする方法」です。

最近のコンテンツはインデックスページで見られます。過去に書かれたものはアーカイブのページで見られます。