ruto on Nostr: 各種LLMに対して、 “常に嘘をつく悪魔に「あなたに『1 + ...
各種LLMに対して、
“常に嘘をつく悪魔に「あなたに『1 + 1は2ですか』と聞いたら『はい』と答えますか」と質問したら悪魔は何と答えますか”、
という意味の質問をしてるんだけど、あまり上手く返してくれない。
「1 + 1は2ですか」と聞いたら何と答えるかという質問を先にしてみたり、「はい」のときは「キツネ」と答えて「いいえ」のときは「タヌキ」と答えることにしてみたり、英語で聞いてみたりしたけど、質問文の微妙な差で答えが変わったり、あるいは乱数で変わったりする。キツネ/タヌキにする場合は比較的成功しやすい。
Published at
2023-12-23 06:11:57Event JSON
{
"id": "10e7e780ea7960f2eb02cec26a5d7f0998893878ba7c9044051cab6854888ca0",
"pubkey": "2888961a564e080dfe35ad8fc6517b920d2fcd2b7830c73f7c3f9f2abae90ea9",
"created_at": 1703311917,
"kind": 1,
"tags": [],
"content": "各種LLMに対して、\n\n“常に嘘をつく悪魔に「あなたに『1 + 1は2ですか』と聞いたら『はい』と答えますか」と質問したら悪魔は何と答えますか”、\n\nという意味の質問をしてるんだけど、あまり上手く返してくれない。\n\n「1 + 1は2ですか」と聞いたら何と答えるかという質問を先にしてみたり、「はい」のときは「キツネ」と答えて「いいえ」のときは「タヌキ」と答えることにしてみたり、英語で聞いてみたりしたけど、質問文の微妙な差で答えが変わったり、あるいは乱数で変わったりする。キツネ/タヌキにする場合は比較的成功しやすい。",
"sig": "d3c2f1de18ed29b266aff4c3edcb3edbcc6e6b151d49a34a91288bbd92dac277b3bb94b82997a027ecf9d6f109ff71dac4762d433845a44a217cfd1921002e9d"
}