PDF・Google Docインポートを試してみた #Notion

Notionのインポート対象にPDFとGoogle Docが追加されました。これまでは参照として扱えた2種ですが、実体取り込みはどのような結果になるのか試してみました。
2024.04.24

Notionへのインポート手段にGoogle DocとPDFが追加されました。これまではいずれも実体を外部参照する形で行えていましたが、テキストデータを直接取り込むことが可能になりました。

実際に試してみたところ、それぞれフォーマットを完全に維持した状態での取り込みは難しいようです。実際の取り込み交えての解説となります。

コネクト設定

Google Docのインポートは、先にGoogle Driveとのコネクトが必要になります。

インポートする

取り込み先はいずれもプライベートスペースとなります。50MBを超える場合は取り込みが不可能です。

PDFの場合

ファイルを直接指定します。

気をつける点としては以下の通り。

  • 1ページにまとめて取り込みとなります
  • PDF内のリンク機能は引き継がれません
  • レイアウトはテーブルとして持ち込まれますが、元の構成を維持しているとは限りません
  • 番号リストはリストではなく番号が接頭で直打ちされた文章になります
  • PDF内の画像は個別画像として取り込まれます

Google Docの場合

Docを指定します。

気をつける点としては以下の通り。

  • フォントサイズの調整はほぼ反映されません
  • 画像は個別画像として取り込まれます
  • リンクは引き継がれます
  • 表組みは引き継がれます

インポート後におすすめの操作

インポート後作成されるページ内各ブロックに対して、NotionAIで改善を実行しておきましょう。スペースや余分なドット(.)等が一掃されたり、文章途中の余計な改行も駆除されます。テーブルについても、AIが整形しつつの再構成を行ってくれるため、手作業による整形よりも手間が省けます。

あとがき

Google Docについてはほぼ期待通りのデータの取り込み移動とも言えそうです。

PDFについては、幾つかファイルを取り込んでみましたが、いずれも取り込んだ後の整形加工が必須ともいえる程に、そのままでは使えそうにないテキストとなっていました。NotionAIプランを契約されている場合は即利用の機会かもしれません。

PDFからテキストを取得するプロセスで難儀することも多くあります。「細かい点はさておきとして、とにかくテキストを取り込みたい」という場合にもおすすめです。