スライド処理モジュール

スライドの一括画像変換

self_slide_img.py

「ppt_dir」に保存されているpptxファイル(複数)を一括して、jpg、もしくは、png形式の画像に変換します。変換後の画像ファイルのファイル名は、変換前のpptxファイルのファイル名にスライド番号を付記したものになります。





スライドから抽出したテキストのcsvへの書き出し

self_slide_txt.py

「ppt_dir」に保存されているpptxファイル(複数)のスライドに記入されているテキスト分を抽出して、csvファイルに書き出します。csvファイル(report.csv)の1列目には、pptファイルのファイル名、2列目にはテキストが書き出されます。書き出されたテキストを機械学習の対象とすることができます。






北海道医療大学・情報センター