延陵子 on Nostr: ChatGLM-6B ...
ChatGLM-6B 是一个清华大学主导开源的、支持中英双语的对话语言模型,基于 General Language Model (GLM) 架构,具有 62 亿参数。结合模型量化技术,可以在消费级的显卡上进行本地部署(INT4 量化级别下最低只需 6GB 显存)。 ChatGLM-6B 使用了和 ChatGPT 相似的技术,针对中文问答和对话进行了优化。经过约 1T 标识符的中英双语训练,辅以监督微调、反馈自助、人类反馈强化学习等技术的加持,62 亿参数的 ChatGLM-6B 已经能生成相当符合人类偏好的回答。目前的效果能和文心一言有得一拼,但也不能瞧背后的资本力量。
Published at
2023-03-20 08:58:08Event JSON
{
"id": "134cfe978686d4a3af1e5032821684afa654bd8413a2a5c3a3cf1e65b32b95ad",
"pubkey": "08d25bdf21f9cd77484f304b0e077027a7d09b8d073dbd8be01a51a4fbc7639d",
"created_at": 1679302688,
"kind": 1,
"tags": [],
"content": "ChatGLM-6B 是一个清华大学主导开源的、支持中英双语的对话语言模型,基于 General Language Model (GLM) 架构,具有 62 亿参数。结合模型量化技术,可以在消费级的显卡上进行本地部署(INT4 量化级别下最低只需 6GB 显存)。 ChatGLM-6B 使用了和 ChatGPT 相似的技术,针对中文问答和对话进行了优化。经过约 1T 标识符的中英双语训练,辅以监督微调、反馈自助、人类反馈强化学习等技术的加持,62 亿参数的 ChatGLM-6B 已经能生成相当符合人类偏好的回答。目前的效果能和文心一言有得一拼,但也不能瞧背后的资本力量。",
"sig": "70afdf7dbc60f0b38c97adc365eb44ca26348833fa5361b2240caa08e7fac57b4bb142c1c7273c6c62efe57cc2b86eea2b628448ad20b9193be4a217554900a6"
}