https://www.primeintellect.ai/blog/intellect-2-release
INTELLECT-2 Release: The First Globally Trained 32B Parameter Model Reinforcement Learning Training Run
INTELLECT-2は、分散強化学習で訓練された初の32Bパラメータモデルです。
PRIME-RLなどのオープンソースインフラストラクチャコンポーネントを紹介しています。
分散トレーニングにおけるパラダイムシフトを示し、オープンソースAIの可能性を強調しています。