什么是踏马的 MCP
Re:从零开始的 OpenAI Agents SDK 学习之旅 Day0
追踪大模型是如何思考的丨 Anthropic
Anthropic 发布了两篇关于可解释性研究的重要论文,展示了他们如何通过“AI 显微镜”深入理解 Claude 模型的内部机制。这些研究揭示了 Claude 在多语言处理、诗歌创作、数学推理、幻觉控制等方面的“思维过程”,并提出了一种新的分析方法:将模型内部的“特征”连接成“电路”,以追踪其计算路径。
关于Workflow
Self-Instruct
生成SFT的数据
Panda LLM
使用模型评价不同response的质量
RLAIF-如何用模型来做RLHF
使用模型做RLHF
Falcon
数据清洗的步骤和效果⭐
Instruct-GPT
GenAI奠基文章⭐