いちから画像要約 ichikara pdf2summary

文書画像を元にした
2種類の要約データ

向いている課題

公的文書PDFからの要約・情報抽出能力を強化できるデータセットです。文章構造の理解や重要情報の識別、表現の簡潔化を通じて、モデルの文書処理力を向上させることができます。

  • 長文・複雑文書からの要点抽出能力向上
  • 文章構造に基づく自然で簡潔な要約生成
  • 官公庁文書特有の表現・形式理解の強化

文書イメージデータからその要点・要約を作るデータが欲しいという声にお応えして作成しました。元となるPDFデータは、著作権の関係から官公庁のものに限定しております。こちらは125件のデータセットとなっております。

元となるPDFデータ
   {
        "ID":"ichikara-pdf2summary-001-001-0000001-001",
        "department":"デジタル庁",
        "file":[
            "DigitalAgency/D_1.pdf"
        ],
        "title":"マイナポータルの機能追加について(令和3年10 月)",
        "toWhom":"マイナンバーカードを取得している方",
        "abstract":"マイナポータルの機能追加や暮らしをより良くするためのサービス等について",
        "summary":"マイナポータルで可能な以下の事について書かれています。\n\n医療保険の薬剤情報を確認・取得する流れ\n薬剤情報の表示例\n特定健診情報、後期高齢者健診情報を確認・取得する流れ\n特定健診情報の表示例\n後期高齢者健診情報の表示例\n医療費通知情報を確認・取得する流れ\n医療費通知情報の表示例\n\nまた、マイナポータルの仕組みやマイナンバーカードの利用法についても書かれています。マイナンバーカードの安全性や実際の医療機関・薬局におけるオンライン資格確認の仕組み等についても詳しく書かれています。"
    },



いちからのデータリスト(料金表)


導入や活用における疑問・不安がありましたら、お気軽にご相談ください。
専門家が現状のヒアリングから課題抽出、具体的なソリューション提案まで伴走いたします。



TOP