いちから7.6万質問集 ichikara 76Kprompt

7.6万件の一般人による質問データ

向いている課題

一般ユーザーによる自然発話を基にした大規模質問データであり、実運用環境に近い入力耐性と安全性対応能力を強化できるデータセットです。

  • 自然文入力への汎用応答力向上(口語・揺らぎ対応)
  • 曖昧・抽象的質問への解釈能力向上
  • 危険な挙動を学習させない(有害・誹謗中傷除去後データでの健全応答)

ユーザーが有料モデル(当時)のGPT-4を無料で使用できる代わりに、その入力された質問の著作権をいただくというチャットツールを作成、データ収集をしました。そのため、自然な質問文となっている一方で、個人情報や誹謗中傷といった有害情報の質問や重複質問も多く、人手作業でそれを除去した76,638件の質問集となっています。

   {
        "ID":"ichikara-76Kprompts-001-001-0033593",
        "text":"菓子パンが大好きです。\n体によくないのは分かっています。\nどうしたら食べるのをやめられますか?"
    },
    {
        "ID":"ichikara-76Kprompts-001-001-0033594",
        "text":"菓子パンは体に悪いでしょうか。"
    },
    {
        "ID":"ichikara-76Kprompts-001-001-0033595",
        "text":"課金型ゲームはなぜ流行った?なぜ廃れない?"
    },
    {
        "ID":"ichikara-76Kprompts-001-001-0033596",
        "text":"課題は自由で、作文を作ってください"
    },
    {
        "ID":"ichikara-76Kprompts-001-001-0033597",
        "text":"課題を抽出して視点の課題に貢献できますか?"
    },
    {
        "ID":"ichikara-76Kprompts-001-001-0033598",
        "text":"課長試験に合格して頑張っているし、部下からの評価も悪くないのに、出世できないのは何故ですか?"
    },
    {
        "ID":"ichikara-76Kprompts-001-001-0033599",
        "text":"貨客船は何故汽笛を鳴らすのか答えなさい"
    },
    {
        "ID":"ichikara-76Kprompts-001-001-0033600",
        "text":"貨物輸送方法として存続するのは陸路、鉄路、空路のうちどれか"
    },
    {
        "ID":"ichikara-76Kprompts-001-001-0033601",
        "text":"貨幣経済、資本主義経済の限界について\n具体的考察かつ解決案を提示せよ\n"
    },



いちからのデータリスト(料金表)


導入や活用における疑問・不安がありましたら、お気軽にご相談ください。
専門家が現状のヒアリングから課題抽出、具体的なソリューション提案まで伴走いたします。



TOP