Python で docx2md を書いてみた

tweet に流れていた mattn/docx2md に触発されて Python でスクラッチから書いてみた。

Lotus Notes から Document の xml 定義を取得して html へ変換するのは Ruby で書いたこともあり、どんなことが必要か何となくは分かっていたものの、

  • 文書構造が違う
  • 出力が Markdown に変わる
  • 規格に基づいて作るのではなく実際のファイルからの合わせこみ
  • Python パッケージってどうやって作るのかわからない
  • PyPI へ登録するにはどうするのかわからない

などあってそれなりに手こずり、結局夏休みはほぼ毎日 VSCode に向かう事に。

それでも何とか手元のファイルをそれなりに変換できるようになって満足。

pypi.org

github.com