Macショートカット: Control+ShiftがMS Word (Windows版)のAlt+Shift操作に相当
タイトルの通りの内容を調べるのに時間が掛かったので、記事にしておく。
MS Word (Windows版)において、箇条書きリストの順番や階層を操作する際は、Alt+Shiftを押しながらカーソルキーを押下する。このテクニックはかなり重宝しており、何かアイディアをPC上でまとめる際は下記の用にしている。
タイトルの通りの内容を調べるのに時間が掛かったので、記事にしておく。
MS Word (Windows版)において、箇条書きリストの順番や階層を操作する際は、Alt+Shiftを押しながらカーソルキーを押下する。このテクニックはかなり重宝しており、何かアイディアをPC上でまとめる際は下記の用にしている。
Microsoft Office Wordファイルの検索クローラをPythonで作成する際、表題の通り、*.docからテキストデータに変換する必要がある。本記事ではwin32comライブラリを用いてPythonスクリプトからWordファイルのテキストデータを抽出するスクリプトを紹介する。 (尚、世には多数のOfficeファイルコンバーターが有るので、このソースを使うことが最適とは限らない)
Microsoft Office PowerPointファイルの検索クローラをPythonで作成する際、表題の通り、*.pptからテキストデータに変換する必要がある。本記事ではwin32comライブラリを用いてPythonスクリプトからスライド中の各シェイプボックスからテキストデータを抽出するスクリプトを紹介する。 (尚、世には多数のOfficeファイルコンバーターが有るので、このソースを使うことが最適とは限らない)
先日、Windows7からFTPでIBM System i上のバイナリファイルをダウンロードしようとしたところ、上記のエラーが出力され、ファイルのダウンロードが失敗したので、その原因と対応策を備忘録として本記事で紹介。
FTP(File Transfer Protocol)はInternet Request for Comment(RFC) 959で定義されているファイル転送プロトコルであるが、この度、改めてFTPの仕組み、特にクライアント-サーバ間の接続方法を確認。 上図より接続のフローを簡単に説明すると、
FTPにはActive/Passiveの2つのモードがあるが、両モードの違いはサーバ→クライアントへの接続に使用するサーバ側の送信ポートの違いである。図の通り、Activeモードはport 20番、Passiveモードは1024以上のport番号からランダムに選択したものを使用する。
PythonでWindowsのアプリ・ファイルを扱う際に必要なwin32comモジュールのインストール方法を以下の通り。
COM(Component Object Model)を使用してWordファイル内のテキストをテキストファイルへ抽出・変換するスクリプト。
# coding: utf-8
import fnmatch, os, sys, win32com.client
if __name__ == '__main__':
wa = win32com.client.gencache.EnsureDispatch("Word.Application")
try:
for path, dirs, files in os.walk(sys.argv[1]): # コマンドラインより探索ディレクトリpathを取得
for filename in files:
if not fnmatch.fnmatch(filename, "*.doc"): continue # wordファイルの拡張子かをパターン・マッチング
doc = os.path.abspath(os.path.join(path, filename)) # wordファイルへの絶対パスを作成
print "processing %s in %s" % (doc, path)
wa.Documents.Open(doc)
txt = doc[:-3] + 'txt' # 変換保管するテキストファイル名
wa.ActiveDocument.SaveAs(txt, FileFormat=win32com.client.constants.wdFormatText)
wa.ActiveDocument.Close()
finally:
wa.Quit() # Wordの終了
備忘録として以下のWindows7の使用リソースの軽量化設定の手順を簡単に紹介します。