いちから7.6万質問集 ichikara 76Kprompt

7.6万件の一般人による質問データ
向いている課題
一般ユーザーによる自然発話を基にした大規模質問データであり、実運用環境に近い入力耐性と安全性対応能力を強化できるデータセットです。
- 自然文入力への汎用応答力向上(口語・揺らぎ対応)
- 曖昧・抽象的質問への解釈能力向上
- 危険な挙動を学習させない(有害・誹謗中傷除去後データでの健全応答)
ユーザーが有料モデル(当時)のGPT-4を無料で使用できる代わりに、その入力された質問の著作権をいただくというチャットツールを作成、データ収集をしました。そのため、自然な質問文となっている一方で、個人情報や誹謗中傷といった有害情報の質問や重複質問も多く、人手作業でそれを除去した76,638件の質問集となっています。
{
"ID":"ichikara-76Kprompts-001-001-0033593",
"text":"菓子パンが大好きです。\n体によくないのは分かっています。\nどうしたら食べるのをやめられますか?"
},
{
"ID":"ichikara-76Kprompts-001-001-0033594",
"text":"菓子パンは体に悪いでしょうか。"
},
{
"ID":"ichikara-76Kprompts-001-001-0033595",
"text":"課金型ゲームはなぜ流行った?なぜ廃れない?"
},
{
"ID":"ichikara-76Kprompts-001-001-0033596",
"text":"課題は自由で、作文を作ってください"
},
{
"ID":"ichikara-76Kprompts-001-001-0033597",
"text":"課題を抽出して視点の課題に貢献できますか?"
},
{
"ID":"ichikara-76Kprompts-001-001-0033598",
"text":"課長試験に合格して頑張っているし、部下からの評価も悪くないのに、出世できないのは何故ですか?"
},
{
"ID":"ichikara-76Kprompts-001-001-0033599",
"text":"貨客船は何故汽笛を鳴らすのか答えなさい"
},
{
"ID":"ichikara-76Kprompts-001-001-0033600",
"text":"貨物輸送方法として存続するのは陸路、鉄路、空路のうちどれか"
},
{
"ID":"ichikara-76Kprompts-001-001-0033601",
"text":"貨幣経済、資本主義経済の限界について\n具体的考察かつ解決案を提示せよ\n"
},導入や活用における疑問・不安がありましたら、お気軽にご相談ください。
専門家が現状のヒアリングから課題抽出、具体的なソリューション提案まで伴走いたします。