ruto on Nostr: 各種LLMに対して、 “常に嘘をつく悪魔に「あなたに『1 + ...
各種LLMに対して、
“常に嘘をつく悪魔に「あなたに『1 + 1は2ですか』と聞いたら『はい』と答えますか」と質問したら悪魔は何と答えますか”、
という意味の質問をしてるんだけど、あまり上手く返してくれない。
「1 + 1は2ですか」と聞いたら何と答えるかという質問を先にしてみたり、「はい」のときは「キツネ」と答えて「いいえ」のときは「タヌキ」と答えることにしてみたり、英語で聞いてみたりしたけど、質問文の微妙な差で答えが変わったり、あるいは乱数で変わったりする。キツネ/タヌキにする場合は比較的成功しやすい。
Published at
2023-12-23 06:12:18Event JSON
{
"id": "80adc46a2e182377606e3022e3c5edaec0730845035ce1f27d00f2e43d7f4938",
"pubkey": "2888961a564e080dfe35ad8fc6517b920d2fcd2b7830c73f7c3f9f2abae90ea9",
"created_at": 1703311938,
"kind": 1,
"tags": [],
"content": "各種LLMに対して、\n\n“常に嘘をつく悪魔に「あなたに『1 + 1は2ですか』と聞いたら『はい』と答えますか」と質問したら悪魔は何と答えますか”、\n\nという意味の質問をしてるんだけど、あまり上手く返してくれない。\n\n「1 + 1は2ですか」と聞いたら何と答えるかという質問を先にしてみたり、「はい」のときは「キツネ」と答えて「いいえ」のときは「タヌキ」と答えることにしてみたり、英語で聞いてみたりしたけど、質問文の微妙な差で答えが変わったり、あるいは乱数で変わったりする。キツネ/タヌキにする場合は比較的成功しやすい。",
"sig": "1d2d16c78844e55918615fa13695a0f052e953f4289946e606a54e2c3fb24d01e50a7f48e9c3f93f0ce222319a608916f41cea1297246092ccebc4d330a4b839"
}