ここしばらくブログの保管、再編集しての公開などに取り組んでいた

ここしばらくブログの保管、再編集しての公開などに取り組んでいた
WordPressの世界がこんなに進んでいるとは知らなかった
ーーー
保管が必要というのは、自分が経験しただけでも、MSブログ閉鎖、Yahooブログ閉鎖、Yahoo Goecity 終了、OCNブログ閉鎖、そして今回はSonetがSSに身売り。
アフェリエイトのこととか検索結果の順位のこととかで、閉鎖したとか書かれていた。
ーーー
GeocityからSonetに移動、OCNからgooに引っ越しなどしたが、作業が杜撰なので、リンクは切れるし、自分でアップロードしたpdfファイルは失われたままになるしで、結構な実質の損失があった。
Geocityはそのままハードディスクに残っているのだが、困ったことに、どのハードディスクのどのフォルダに入っているのか、分からない。
OCNのリンクの分は、公開、出版されている文献が多いので、集められると思うが、ファイルの名前の付け方にシステムがなくて、その場その場で一時しのぎにつけているので、ファイル名から中身を特定できないことも多い。きちんと書いておけばよかった。
ーーー
というようなこともあったので、
きちんと保管しておこうよと思った
そしてまず
当然だけど、エクスポートとかバックアップを使った
bloggerのエクスポートは優秀だった。
bloggerからWordPressへの移動は簡単だった。
その他の多くのブログではMTファイルが多い。
gooでは有料会員にならないとバックアップができない。
ーーー
MTファイルでエクスポートとインポートをしてみると、ところどころ、画像が抜けていたりするのに気が付いた、まあ、ほんの少し。しかしおおむねは問題ないようだった。
ーーー
そこで、MTにエクスポートできないexciteとgooの引っ越しをまず考えた。
gooからsonetの移行では、gooの記事を一つずつコピーして、そのままsonetに張り付けた。手作業だ。あとでみたらリンクが抜けてしまっていた。これはよくない。htmlでコピーして、htmlに張り付ければいいのだろうが、そうすると今度は画像がなくなってしまう。一つ一つの手作業なら、画像は別に処理すればいい。
自分のブログの再確認という意味もあるので、一括処理でなくてもいいと思っている。
リンクが抜けてしまったのは、よく考えると、30記事をまず一度「メモ帳」にペーストして、そのあと、一つずつ記事をのせたからだ。「ワード」にペーストしてから切り取ってコピー&ペーストすれば、リンクは失われなかった。
とはいうものの、アドレスは分かっても、そのアドレスはもう存在していないので、どこでがっかりするかの違いだけなのだが。
ーーー
exciteからライブドアへの移行は、横着して、30記事をまとめてコピーして、まとめて貼り付けた。やはりリンクが抜けていた。良くない。まとめてしまったので、タイトルを並べてみることができない。
exciteではブログを本にするサービスがあって、印刷の見本としてPDFを作り、それを見て、再編集したりするのだという。その途中のpdfが欲しかったのでやってみたけれど、全部にsampleという透かしが入っていた。これはダメ。
ーーー
exciteの表示は最大で30記事。それをhmtlとして保存するならコントロール+Sでよい。600記事なら20回やればいいだけ。これが一番正確な保存になると思う。
2万記事なら667回。これをどう思うかですね。
残すならpdfもいいと思う。印刷設定でpdfを指定する。やってみると、リンクは生きていた。画像はもちろん入るので、これもいいけれども、やはり30個ずつ。
そのままで残すという点では、htmlのほうがいいと思うが、一覧性がなくなる。
ーーー
見る時に、ブラウザーを使うのも面倒なので、ワードに張り付けるとどうか。
結果は、リンクはコピーされていない。所々で、文字が□になっている。文字セットが一致していないのだろう。調整すれば多分大丈夫。
ワードの場合は、字の大きさ、フォント、行間など自分で変更できる。
それに、自分の現在の考えを書くとか、見つけた間違いの訂正とかもできる。htmlでもできるけれど、こちらがより自由。そして最終稿にしたものをサイトに移動させてもよい。
ーーー
ライブドアブログでepubの項目を見つけた。
また、はてなブログでも、製本の途中で、MTファイルをepub形式にするという。こちらは製本を依頼すると、epubを作ると書いてあるから、無料ではないのだろう。
ライブドアは無料なので、ライブドアの二つのサイトで試してみた。見てみると、目次がきれいにできていた。これは得点高い。
自分で直接書いたほうのブログは、フォントも適切で、問題ないと思った。しかし、今回、exciteからライブドアに移行したものについては、フォントを変更したくなるようなものだった。もともとのフォントが適切でなかったのだろうか。出来上がってからでは変更もできないようだ。ブログのフォント指定を変更すればよい。
ーーー
epubで目次までつけてくれて、ありがたい感じだったけれど、アドビのepub閲覧ソフトは使いにくい。Readiumはクロームの上で動くのだが、今一つ。今後は開発しない様子だとか。
色々な記事によると、epubが盛り上がったのは10年前のことで、今は下火になり、pdfの優位が続いているという。確かに、著者の提供するママ、というのも価値があるし、読者の側でフォントとかレイアウトとかをいじるのも意味がある。著者の考えのままで、というなら、pdfでいい。epubからpdfやmobiにはすぐ変換できる。逆に、pdfをepubに変換するソフトもあるけれども、pdfのままで工夫したほうがいいような気がする。好き好きだろうけれど。
MSエッジでepubサポートしない、と記事が出ていた。アプリを入れて読めとのこと。
ーーー
昔は、ホームページを丸ごとダウンロードするソフトがいくつもあった。
Website Explorerなど使っていた。これで十分だったような気がする。
しかし最近のブログはまた複雑で、あまりぱっとしない
ーーー
Cyotek WebCopy、WeBoX、CompleteGetter、HTTrackなどがすぐに検索で見つかる。試してみて、自分として比較的良かったのはCyotek WebCopyであるが、リンクを延々と追いかけていくので、時間がかかり、いろいろと問題がある、そのなかで、Cyotek WebCopyが少し良かったというだけ。
ーーー
wgetコマンドを使って、ライン入力で操作し、ひとつの記事についてひとつのhtmlを格納しするほうほうもいろいろと試した。
それぞれのブログに応じて、オプションを工夫すればうまくいったのが7割くらいか、どうしてもうまくいかず原因不明だったのも一つくらいあったような記憶がある。
普段Linuxを使うときの感じでいいのでいろいろ工夫するが取り切れないものがあった。
ーーー
昔の自分に対面するというのも、恥ずかしいけれども、悪くない。
ーーー
以上を書き終えてから、見つけた情報によれば、
「FC2ブログのお引越しツール」があり、たくさんのブログが、エクスポー機能がなくても、引っ越しができる。
引っ越ししたあとはFC2の機能を使っていろいろなことができる。
これでいいようだ。