メインコンテンツまでスキップ

「Office」タグの記事が2件件あります

全てのタグを見る

Python: Microsoft Wordファイル(*.doc)のテキストデータ抽出 - pywin32, win32com

· 約2分
Yu Sasaki
Enterprise Security Manager / Advisor

Microsoft Office Wordファイルの検索クローラをPythonで作成する際、表題の通り、*.docからテキストデータに変換する必要がある。本記事ではwin32comライブラリを用いてPythonスクリプトからWordファイルのテキストデータを抽出するスクリプトを紹介する。 (尚、世には多数のOfficeファイルコンバーターが有るので、このソースを使うことが最適とは限らない)

Python: Microsoft PowerPointファイル(*.ppt)のテキストデータ抽出 - pywin32, win32com

· 約3分
Yu Sasaki
Enterprise Security Manager / Advisor

Microsoft Office PowerPointファイルの検索クローラをPythonで作成する際、表題の通り、*.pptからテキストデータに変換する必要がある。本記事ではwin32comライブラリを用いてPythonスクリプトからスライド中の各シェイプボックスからテキストデータを抽出するスクリプトを紹介する。 (尚、世には多数のOfficeファイルコンバーターが有るので、このソースを使うことが最適とは限らない)